机器学习杂记

Google近年来发布的有关文本挖掘、自然语言处理的数据集。http://t.cn/z8sMlZv

 

关键词抽取的demo http://115.28.183.178/#/cloud

 

问: 做基于话题的社交网络中的溯源,寻找源头用户, 求文章? 答: 找到5篇论文 http://t.cn/RhW6Suk 特别推荐Guille等"在线社交网络中信息扩散综述"(SIGMOD Record 2013)脑图, 讲了三个挑战及相关解法: 发现有趣话题,扩散过程建模, 识别高影响力节点。此外还有几篇溯源算法研究及一篇Science相关好文

 

 http://t.cn/RhOz6bQ 情感分析(sentiment analysis) 两本经典综述PDF下载: A Survey of Opinion Mining and Sentiment Analysis (2012) by Bing Liu; Opinion mining and sentiment analysis (2008) by Bo Pang, Lillian Lee, 另附Richard Socher等深度学习用于情感分析的论文

 

在Kaggle上经常取得不错成绩的Tim Dettmers介绍了他自己是怎么选择深度学习的GPUs: http://t.cn/RhpuD1b 以及个人如何构建深度学习的GPU集群:http://t.cn/RhpuD1G 非常有用的信息,不过需要FQ看。

 
 
特别推荐一本免费电子书: 微软研究院邓力和俞栋合写的“Deep Learning Methods and Applications” (2014) http://t.cn/RhoPwll 近200页篇幅对深度学习的方法和应用做了比较全面地综述。还有 @高杰_Speech 推荐 微软研究院出品C++开源Computational networks工具包 CNTK http://t.cn/Rhy4u3l
 
 
统计学习基础 数据挖掘、推理与预测 中文版.pdf - 共享资料下载http://t.cn/8F7d11J
 

如何计算两个文档的相似度(一)http://blogread.cn/it/article/6435?f=wb

 

机器学习中的数学(4)-线性判别分析(LDA), 主成分分析(PCA) http://www.cnblogs.com/LeftNotEasy/archive/2011/01/08/lda-and-pca-machine-learning.html

posted on 2014-11-20 21:20  Wilco  阅读(144)  评论(0编辑  收藏  举报