2020 年 8月 14 日随笔档案 - 青锋剃刀

2020年8月14日

摘要：对一段文本，想要统计各种词语出现的次数，即词频统计，思路是先分词，再进行数量统计、排序。分词可以用jieba库，同时snownlp库也是可以实现的。 jieba一般可以直接用jieba.lcut('你的文本内容abcdefg。。。')即可，非常简单。 snownlp除了分词还能实现转繁体、情感分类阅读全文

posted @ 2020-08-14 12:48 青锋剃刀阅读(3544) 评论(0) 推荐(0) 编辑

python压制警告

摘要：执行程序时，我们有时要在运行过程中不断查看结果，这时一些包内弹出的警告十分讨厌。要忽略他们其实也很简单。代码前面加两行： import warnings warnings.filterwarnings("ignore") 命令行下忽略警告错误的输出的方法为： python -W ignore XX 阅读全文

posted @ 2020-08-14 12:04 青锋剃刀阅读(739) 评论(0) 推荐(0) 编辑