摘要: import pandas as pd data = pd.read_table('val.txt',names=['category','theme','URL','content']) #读取数据,转成DataFrame格式。因为前期数据已经是处理好的,所以可以这样写。这里的read_table 阅读全文
posted @ 2020-08-23 20:23 理工—王栋轩 阅读(782) 评论(0) 推荐(0) 编辑
摘要: 在实际应用中,经常需要把统计一段字符中,每个词出现的次数,也就是词频。统计次数有一个现成的方法就是DataFrame.value_counts(),问题是如何保存结果为我们所用。思路就是把value_counts的两列先分别转成列表,再讲两个列表转成字典。 import pandas as pd d 阅读全文
posted @ 2020-08-23 18:58 理工—王栋轩 阅读(5212) 评论(0) 推荐(1) 编辑