【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
真实生活中的***压缩。 不是GPU太弱鸡,而是CPU用的...
你太瞧不起NT Kernel了,这个内核无疑是有史以来最先进...
今天是6月20号,这是新鲜的,热乎的 本人96年一月带阜阳城...
能 很多很多年之前,我单身的时候,买了一副超级巨大的美女海报...
巴西的编程语言都占领全世界了,中国怎么就不行呢? 转自公众号...
月薪3万应该可以,咱们越南有的是人,但没有无限量供应的傻子 ...
在线客服 :
服务热线:
电子邮箱:
公司地址: