2020年8月14日
摘要: 对一段文本,想要统计各种词语出现的次数,即词频统计,思路是先分词,再进行数量统计、排序。 分词可以用jieba库,同时snownlp库也是可以实现的。 jieba一般可以直接用jieba.lcut('你的文本内容abcdefg。。。')即可,非常简单。 snownlp除了分词还能实现转繁体、情感分类 阅读全文
posted @ 2020-08-14 12:48 青锋剃刀 阅读(3544) 评论(0) 推荐(0) 编辑
摘要: 执行程序时,我们有时要在运行过程中不断查看结果,这时一些包内弹出的警告十分讨厌。 要忽略他们其实也很简单。代码前面加两行: import warnings warnings.filterwarnings("ignore") 命令行下忽略警告错误的输出的方法为: python -W ignore XX 阅读全文
posted @ 2020-08-14 12:04 青锋剃刀 阅读(739) 评论(0) 推荐(0) 编辑