X-man

导航

NLP 自然语言处理

 

 


参考:
自然语言处理怎么最快入门:http://www.zhihu.com/question/19895141
自然语言处理简介:http://wenku.baidu.com/link?url=W6Mw1f-XN8s1pAkd-vzCLTsxOiMiux1Q24wB1_PbZ7Kn6h-6iaxbG3-9OV68eX1qxZTNlYJeZSezQIuBfIKd1RCwnY8VOdrKP18G3QITAuO


近期有同学问我有哪些较好的nlp工具。
之前我们都知道中科院的ictclas,能够实现分词、词性标注功能,而且最新版的还增加了几个篇章级的功能,如新词识别,关键词抽取等,在接口方面ictclas有java, c++, python版本。 
另外,从去年开始我一直在用哈工大的ltp,它的基础性功能比ictclas要丰富一些,除了分词,还有实体识别,句法分析,语义角色标注等,在上下文补充的情况下,效果甚至要优于ictclas。也提供了java,c++,python的接口,而且它还提供云服务,免除本地安装配置环节,但是受限于网速,执行较慢。今天研究了如何在本
地安装Python版的ltp(即pyltp),有兴趣的同学,特别是做与命名实体有关的同学,可以参考一下 http://blog.csdn.net/laoyaotask/article/details/45312905

 

word2013 论文引用参考文献

http://blog.csdn.net/zhaizu/article/details/21092885

 

说到 Deep learning, 可以看看这个最新的中文综述, http://www.ccf.org.cn/resources/1190201776262/2015/03/12/2.pdf 
配Theano
手把手教你怎么搞 http://deeplearning.net/tutorial/contents.html
一定要在Ubuntu 下搞,不要用windows
中文的资料不是很多,这个相当不错 http://ufldl.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B

 

机器学习日报 http://ml.memect.com/

 

发一个论文给安军辉及其它做类似工作的同学参考: AAAI 2015 最佳论文候选:O网页链接 根据 twitter 的follow 网络关系,预测每个用户的6种基本信息: 性别, 年龄, 种族,教育水平以及收入)训练的是回归模型,但用的时候是当成分类器用,令人惊讶的是,这样效果并不比直接训练一个分类器效果差。
 

posted on 2015-05-05 19:19  雨钝风轻  阅读(546)  评论(0编辑  收藏  举报