《Thumbs up? Sentiment Classification using Machine Learning Techniques》笔记
这篇论文早就读过,现在重读一遍。
这是一篇2002年的论文,它的结论如下:
算法方面:
SVM比最大熵和朴素贝叶斯好
特征方面:
Bnigram并不比Unigram好
特征的presence比frequency好
词性影响不大
词的位置影响不大
读完。
读了也是白读,talk is cheap, show me the code,我还是写不出效果好的程序。