• 博客园logo
  • 会员
  • 周边
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






江枫1

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

03 2017 档案

 
python 把txt文件分隔成0.8和0.2的比例的新文件
摘要:from math import sqrt import randomimport osfrom sklearn import cross_validation os.chdir("/*")c=[]filename=r'rating.txt'out_train=open(r'train.txt',' 阅读全文
posted @ 2017-03-23 15:47 江枫1 阅读(355) 评论(0) 推荐(0)
mac 下 python链接mysql
摘要:安装过程 :http://blog.topspeedsnail.com/archives/6018 注意 报错的话要先装一个东西 http://cdn.mysql.com/Downloads/Connector-Python/mysql-connector-python-2.0.4.zip#md5= 阅读全文
posted @ 2017-03-20 20:41 江枫1 阅读(153) 评论(0) 推荐(0)
协同过滤
摘要:入门:http://www.cnblogs.com/wentingtu/archive/2011/12/16/2289926.html 例子:http://it.sohu.com/20160323/n441708747.shtml http://dblab.xmu.edu.cn/blog/1284- 阅读全文
posted @ 2017-03-17 12:02 江枫1 阅读(140) 评论(0) 推荐(0)
爬虫 正则表达式
摘要:在线测试 http://tool.oschina.net/regex/ 阅读全文
posted @ 2017-03-09 16:55 江枫1 阅读(143) 评论(0) 推荐(0)
LDa 通俗理解
摘要:LDA理解以及源码分析(一) http://blog.csdn.net/pirage/article/details/50239125 LDA在主题建模中的应用,需要知道以下几点: 文档集中的words不考虑顺序,符合Bag Of Word词袋模型,假设总词汇数为V。 每篇由n个word生成的doc 阅读全文
posted @ 2017-03-09 15:04 江枫1 阅读(378) 评论(0) 推荐(0)
三个臭皮匠顶个诸葛亮的随机森林算法!
摘要:http://mp.weixin.qq.com/s?__biz=MzIzNDM2OTMzOQ==&mid=2247484211&idx=1&sn=5eb8958f7a87fcbb3992a5226e367445&mpshare=1&scene=23&srcid=0306A97NjBiE9Zsp5Gm 阅读全文
posted @ 2017-03-07 09:35 江枫1 阅读(442) 评论(0) 推荐(0)
18个技巧实战深度学习,资深研究员的血泪教训
摘要:http://mp.weixin.qq.com/s?__biz=MzIzODQ5Njc3Ng==&mid=2247483789&idx=2&sn=2b249abaf5bf0ec4239c4571ea1b859d&chksm=e9393ceade4eb5fc098b431a234f11c1b0a4a1 阅读全文
posted @ 2017-03-07 09:25 江枫1 阅读(648) 评论(0) 推荐(0)
python 字符串报错问题
摘要:http://jingyan.baidu.com/article/25648fc1a96dd49191fd00c0.html 解决'ascii' codec can't encode character 在python2.7下,将字符串写入到文件时会出现"UnicodeEncodeError: 'a 阅读全文
posted @ 2017-03-06 19:27 江枫1 阅读(469) 评论(0) 推荐(0)
lda spark 代码官方文档
摘要:http://spark.apache.org/docs/1.6.1/mllib-clustering.html#latent-dirichlet-allocation-lda http://spark.apache.org/docs/1.6.1/api/python/pyspark.mllib.h 阅读全文
posted @ 2017-03-02 16:55 江枫1 阅读(187) 评论(0) 推荐(0)
rdd去重
摘要:a=[[1,2,3,2,3,4],[3,4,5,6,7,5,3,2]]b=sc.parallelize(a) d=b.flatMap(lambda x:x) #铺平 ,形成一个rdd e=d.distinct() e.collect() => [1, 2, 3, 4, 5, 6, 7] 阅读全文
posted @ 2017-03-02 15:50 江枫1 阅读(242) 评论(0) 推荐(0)
一些数据集
摘要:https://zhuanlan.zhihu.com/p/25138563 阅读全文
posted @ 2017-03-02 14:31 江枫1 阅读(134) 评论(0) 推荐(0)
经典的图像匹配算法----SIFT
摘要:经典的图像匹配算法 SIFT http://mp.weixin.qq.com/s?__biz=MzIzNDM2OTMzOQ==&mid=2247484319&idx=1&sn=33c16724594b338dd43b77530eaf9931&mpshare=1&scene=23&srcid=0302 阅读全文
posted @ 2017-03-02 10:48 江枫1 阅读(308) 评论(0) 推荐(0)
LDA处理文档主题分布代码
摘要:[python] LDA处理文档主题分布代码入门笔记 http://blog.csdn.net/eastmount/article/details/50824215 阅读全文
posted @ 2017-03-01 19:22 江枫1 阅读(263) 评论(0) 推荐(0)
Dirichlet Process
摘要:http://www.cnblogs.com/zhangbojiangfeng/p/5962039.html [各种函数推导】 阅读全文
posted @ 2017-03-01 12:07 江枫1 阅读(133) 评论(0) 推荐(0)