数据挖掘和机器学习相关资源
最近把一些在网上见到的自然语言处理(感觉用数据挖掘和机器学习概括更为准确,修改了一下标题)的资源整理了一下,包括论文列表、软件资源和一些实验室主页、个人主页等,希望能对NLP研究者有所帮助,由于个人视野有限,目前只整理了这些,以后会持续更新。在此也感谢这些资源的提供者和维护者。
论文、博客
1. Google在研究博客中总结了他们2011年的精彩论文《Excellent Papers for 2011》,包括社会网络、机器学习、人机交互、信息检索、自然语言处理、多媒体、系统等各个领域,很精彩的论文集锦。http://googleresearch.blogspot.com/2012/03/excellent-papers-for-2011.html
或者zibuyu的BLOG http://blog.sina.com.cn/s/blog_574a437f0100y6zy.html
2. Best paper awards for AAAI,ACL, CHI, CIKM, FOCS, ICML, IJCAI, KDD, OSDI, SIGIR, SIGMOD, SOSP, STOC, UIST,VLDB, WWWhttp://jeffhuang.com/best_paper_awards.html
3. IBM R&D Journal 刚发布了关于Watson的专刊《This is Watson》。总共17篇论文。http://ieeexplore.ieee.org/xpl/tocresult.jsp?isnumber=6177717&punumber=5288520
4. Web Data Mining作者刘兵维护的一个专题资源:Opinion Mining,Sentiment Analysis, and Opinion Spam Detection 。http://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html
5. Statistical Machine Translationhttp://www.statmt.org/
Statistical Machine TranslationTutorial Readinghttp://cseweb.ucsd.edu/~dkauchak/mt-tutorial/
Philipp Koehn主页http://homepages.inf.ed.ac.uk/pkoehn/
6.Profile Hidden Markov ModelResourceshttp://webdocs.cs.ualberta.ca/~colinc/cmput606/
Hidden Markov Model (HMM) Toolbox forMatlabhttp://www.cs.ubc.ca/~murphyk/Software/HMM/hmm.html
7.CRF http://www.inference.phy.cam.ac.uk/hmw26/crf/
Conditional Random Field (CRF)Toolbox for Matlabhttp://www.cs.ubc.ca/~murphyk/Software/CRF/crf.html
FlexCRFs: Flexible Conditional RandomFieldshttp://flexcrfs.sourceforge.net/
8.Transfer Learning 包含papers、talks、software等http://www.cse.ust.hk/TL/index.html
9.Topic Model,Topic Modeling Bibliographyhttp://www.cs.princeton.edu/~mimno/topics.html
David M. Blei的主页http://www.cs.princeton.edu/~blei/publications.htmlMatlab Topic Modeling Toolbox 1.4http://psiexp.ss.uci.edu/research/programs_data/toolbox.htm
LDA GIBBS Java源码http://arbylon.net/resources.html
GibbsLDA++: A C/C++ Implementation ofLatent Dirichlet Allocationhttp://gibbslda.sourceforge.net/
10.科学网—推荐系统的循序进阶读物(从入门到精通) - 张子柯的博文http://blog.sciencenet.cn/home.php?mod=space&uid=210641&do=blog&id=508634
11.SVM入门http://www.blogjava.net/zhenandaci/archive/2009/02/13/254519.html
12.斯坦福大学自然语言处理实验室整理的NLP资源http://www-nlp.stanford.edu/links/statnlp.html
13.Stanford University InformationRetrieval Resourceshttp://nlp.stanford.edu/IR-book/information-retrieval.html
14.Software Tools for NLP http://www-a2k.is.tokushima-u.ac.jp/member/kita/NLP/nlp_tools.html
实验室主页
1.The Stanford NLP Group http://nlp.stanford.edu
2.The Berkeley Natural LanguageProcessing Grouphttp://nlp.cs.berkeley.edu
3.University of Tokyo TsujiiLaboratory http://www.nactem.ac.uk/tsujii/publications.cgi?lang=en
4.Korea University NLP http://nlp.korea.ac.kr/ http://nlp.korea.ac.kr/new/
5.中国科学院计算技术研究所自然语言处理研究组http://nlp.ict.ac.cn/new/
6.清华大学自然语言处理组 http://nlp.csai.tsinghua.edu.cn/site2/
7.HIT-SCIR http://ir.hit.edu.cn/
8.苏州大学自然语言处理实验室http://nlp.suda.edu.cn/
个人主页
1.David M. Blei, (Princeton) LDA,http://www.cs.princeton.edu/~blei/publications.html
2.Noah Smith, (CMU),以自然语言处理、机器学习为基础研究computationalsocial science。http://www.cs.cmu.edu/~nasmith/
3.Philipp Koehn (University ofEdinburgh)http://homepages.inf.ed.ac.uk/pkoehn/
4.Dekang Lin (University ofAlberta)http://webdocs.cs.ualberta.ca/~lindek/
5.Michael Collins(ColumbiaUniversity)http://www.cs.columbia.edu/~mcollins/
6.Dekai WU(HKUST) http://www.cs.ust.hk/~dekai/
7.Pascale Fung (HKUST) http://www.ee.ust.hk/~pascale/
8.Alessandro Moschitti (Universityof Trento)http://disi.unitn.it/moschitti/
9.Xiaojin (Jerry) Zhu (Universityof Wisconsin-Madison)http://pages.cs.wisc.edu/~jerryzhu/
10.Eugene Charniak (BrownUniversity)http://www.cs.brown.edu/~ec/
【原文】