摘要:
在python&numpy中切片(slice) 上文说到了, "词频的统计" 在数据挖掘中使用的频率很高,而切片的操作同样是如此。在从文本文件或数据库中读取数据后,需要对数据进行预处理的操作。此时就需要对数据进行变换,切片,来生成自己需要的数据形式。 对于 一维数组 来说,python原生的list 阅读全文
随笔档案-2017年03月
利用多种方式来统计词频(单词个数)
2017-03-18 10:15 by Fururur, 4289 阅读, 收藏, 编辑
摘要:
python的思维就是让我们用尽可能少的代码来解决问题。对于词频的统计,就代码层面而言,实现的方式也是有很多种的。之所以单独谈到统计词频这个问题,是因为它在统计和数据挖掘方面经常会用到,尤其是处理分类问题上。故在此做个简单的记录。 阅读全文