python 把txt文件分隔成0.8和0.2的比例的新文件
摘要:from math import sqrt import randomimport osfrom sklearn import cross_validation os.chdir("/*")c=[]filename=r'rating.txt'out_train=open(r'train.txt','
阅读全文
mac 下 python链接mysql
摘要:安装过程 :http://blog.topspeedsnail.com/archives/6018 注意 报错的话要先装一个东西 http://cdn.mysql.com/Downloads/Connector-Python/mysql-connector-python-2.0.4.zip#md5=
阅读全文
协同过滤
摘要:入门:http://www.cnblogs.com/wentingtu/archive/2011/12/16/2289926.html 例子:http://it.sohu.com/20160323/n441708747.shtml http://dblab.xmu.edu.cn/blog/1284-
阅读全文
爬虫 正则表达式
摘要:在线测试 http://tool.oschina.net/regex/
阅读全文
LDa 通俗理解
摘要:LDA理解以及源码分析(一) http://blog.csdn.net/pirage/article/details/50239125 LDA在主题建模中的应用,需要知道以下几点: 文档集中的words不考虑顺序,符合Bag Of Word词袋模型,假设总词汇数为V。 每篇由n个word生成的doc
阅读全文
三个臭皮匠顶个诸葛亮的随机森林算法!
摘要:http://mp.weixin.qq.com/s?__biz=MzIzNDM2OTMzOQ==&mid=2247484211&idx=1&sn=5eb8958f7a87fcbb3992a5226e367445&mpshare=1&scene=23&srcid=0306A97NjBiE9Zsp5Gm
阅读全文
18个技巧实战深度学习,资深研究员的血泪教训
摘要:http://mp.weixin.qq.com/s?__biz=MzIzODQ5Njc3Ng==&mid=2247483789&idx=2&sn=2b249abaf5bf0ec4239c4571ea1b859d&chksm=e9393ceade4eb5fc098b431a234f11c1b0a4a1
阅读全文
python 字符串报错问题
摘要:http://jingyan.baidu.com/article/25648fc1a96dd49191fd00c0.html 解决'ascii' codec can't encode character 在python2.7下,将字符串写入到文件时会出现"UnicodeEncodeError: 'a
阅读全文
lda spark 代码官方文档
摘要:http://spark.apache.org/docs/1.6.1/mllib-clustering.html#latent-dirichlet-allocation-lda http://spark.apache.org/docs/1.6.1/api/python/pyspark.mllib.h
阅读全文
rdd去重
摘要:a=[[1,2,3,2,3,4],[3,4,5,6,7,5,3,2]]b=sc.parallelize(a) d=b.flatMap(lambda x:x) #铺平 ,形成一个rdd e=d.distinct() e.collect() => [1, 2, 3, 4, 5, 6, 7]
阅读全文
一些数据集
摘要:https://zhuanlan.zhihu.com/p/25138563
阅读全文
经典的图像匹配算法----SIFT
摘要:经典的图像匹配算法 SIFT http://mp.weixin.qq.com/s?__biz=MzIzNDM2OTMzOQ==&mid=2247484319&idx=1&sn=33c16724594b338dd43b77530eaf9931&mpshare=1&scene=23&srcid=0302
阅读全文
LDA处理文档主题分布代码
摘要:[python] LDA处理文档主题分布代码入门笔记 http://blog.csdn.net/eastmount/article/details/50824215
阅读全文
Dirichlet Process
摘要:http://www.cnblogs.com/zhangbojiangfeng/p/5962039.html [各种函数推导】
阅读全文