bug_x

导航

 

2018年11月1日

摘要: 1、TF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率).(逆文档词频) 2、自我理解: 公式TF = $$\frac{语料库中关键词出现的次数}{总词数量}$$ ##权重w (词频) 或者 TF = $$\frac{某个词在文章中出 阅读全文
posted @ 2018-11-01 23:03 bug_x 阅读(194) 评论(0) 推荐(0) 编辑
 
摘要: dt = searchfor = ['og', 'at'] dt = '|'.join(dt) 阅读全文
posted @ 2018-11-01 11:55 bug_x 阅读(87) 评论(0) 推荐(0) 编辑
 
摘要: 1、排序 DataFrame 按照Index排序 Series.order()进行排序,而DataFrame则用sort或者sort_index或者sort_values 2、去重, 阅读全文
posted @ 2018-11-01 11:53 bug_x 阅读(2300) 评论(0) 推荐(0) 编辑
 
摘要: 1、 2、 2、copy and value_counts 3, add del 4、筛选: 阅读全文
posted @ 2018-11-01 11:05 bug_x 阅读(188) 评论(0) 推荐(0) 编辑