相关有用链接
面试中一些有用的算法题目讲解:
关于funf的一些东西:
“结构之法,算法之道”博客
http://www.cnblogs.com/v-July-v/archive/2011/06/14/2770530.html
1,lda各种语言的开源实现
http://www.zhizhihu.com/html/y2010/1465.html
2,集中开源数据挖掘工具
numpy tutial :http://wiki.scipy.org/Tentative_NumPy_Tutorial
scikit-learn:https://pypi.python.org/pypi/scikit-learn/0.13.1
http://scikit-learn.org
其中涉及模型检验的部分:
http://scikit-learn.org/stable/modules/model_evaluation.html
http://scikit-learn.org/stable/modules/cross_validation.html
http://scipy-lectures.github.io/advanced/scikit-learn/index.html
http://matplotlib.org/examples/index.html
分类器的评价标准(TPR,FPR,ROC)
http://blog.csdn.net/marising/article/details/6543943
具体实现(包括TPR,FPR,ROC,predition,recall,F_beta的计算):
http://scikit-learn.org/stable/modules/model_evaluation.html#receiver-operating-characteristic-roc
交叉验证的实现:
http://scikit-learn.org/stable/modules/cross_validation.html
weka:
http://www.cs.waikato.ac.nz/~ml/weka/
关于推荐:
http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html
crab:http://muricoca.github.io/crab/
pip:http://www.saltycrane.com/blog/2010/02/how-install-pip-ubuntu/
介绍机器学习的各种开源网站门户:http://www.open-open.com/lib/view/open1364432241437.html
weka学习篇:
linux安装weka:
3,优秀论文集
http://googledata.org/uncategorized/excellent-papers-for-2012/
LDA数学八卦中提到的关于LDA实现的网站:http://code.google.com/p/plda/
4,django网站
http://djangobook.py3k.cn/2.0/chapter01/
http://djangobook.py3k.cn/2.0/
http://djangobook.py3k.cn/2.0/
http://docs.python.org/2/tutorial/
5,一个微博数据爬取工具
6,android开源框架afinal
https://github.com/yangfuhai/afinal
7,MIT关于手机数据挖掘的网站
http://realitycommons.media.mit.edu/
http://www.media.mit.edu/
funf的官方文档:
http://code.google.com/p/funf-open-sensing-framework/wiki/StoringData
关于行为建模比赛的一个网址:
http://www.umiacs.umd.edu/conferences/sbp2012/paperaward.html
7,c++的库函数(相当于api)
http://www.cplusplus.com/reference/
python:
http://docs.python.org/2/library/
8 相关数据集:
http://grouplens.org/datasets/movielens/
9,和电视相关的一些论文的链接
http://www.tandfonline.com/action/showMostCitedArticles?journalCode=hbem20#.UqhkNs9Dt0w
10,一个相似话题检测的东西
http://blog.csdn.net/liuaigui/article/details/6897314
一些博客收集:
白话经典算法系列(讲解排序实现,冒泡、归并、选择、插入、快速排序等):http://www.cnblogs.com/morewindows/category/314533.html
算法中的数学原理(svd,lda,lsi等浅显但是挺妙的解释):
http://www.cnblogs.com/LeftNotEasy/
recommation:
python实现的一个简单的推荐系统: http://www.ocelma.net/software/python-recsys/build/html/
其源代码位置:https://github.com/ocelma/python-recsys
和论文相关的:
http://www.wikicfp.com/cfp/home
http://www.myhuiban.com/index.php?sort=location
一个可视化作图的网站:
http://www.jasondavies.com/wordcloud
word2vec
https://code.google.com/p/word2vec/
http://blog.csdn.net/zhaoxinfan/article/details/11069485
http://www.douban.com/note/298095260/