读论文 + 总结 + 笔记

日常笔记summarized here。


《Thumbs up?Sentiment Classification using Machine Learning Techniques》2002年

这篇文章只是简单的把一篇文档里的词的数量组成一个特征向量来表示该文档。

情感分类的特征选取对分类正确率的影响:

  1. unigrams比bigrams的效果好
  2. “特征是否出现”比“特征频率”的效果好
  3. 词性对效果的影响并不大
  4. 词的位置对效果的影响并不大

posted @ 2016-07-20 20:13  StevenLuke  阅读(141)  评论(0编辑  收藏  举报