摘要: 2013年6月13日,阿里巴巴联合天弘基金推出余额宝业务,短短几个月的时间,用户超过了1600万,货币基金累计超过1300亿。天弘基金一跃成为国内的明星基金公司,而其运作的货币基金也是目前中国最大的公募基金和货币基金。紧接着,百度联合国内的基金大佬华夏基金推出类似的互联网理财产品,发行当天即募得8亿资金。最为BAT中最先拿到移动互联网船票的腾讯也有动作,有消息称微信版的余额宝也将在11月底上线。就在几天前,马云、马化腾和马明哲齐聚复旦,畅谈互联网金融的未来,三人合力打造的中国首个互联网保险公司高调宣布再外滩挂牌。与此同时,中国p2p网贷平台正在以每天3~4家的数量增长,年底有望突破1000家… 阅读全文
posted @ 2013-11-19 22:30 HarryJiang 阅读(1098) 评论(3) 推荐(3) 编辑
摘要: 要解决复杂的模式识别问题,往往需要构建大规模的神经网络。随着节点数量的增加,模型的训练速度将变得缓慢,而内存的开销也会以n^2的速度增长。这样,采用单机训练RBM变得不切合实际。而鉴于RBM训练更新需要在整个网络的范围内进行权值更新(不考虑针对Sparse情况的优化),设计分布式程序需要解决的主要问题之一就是如何处理网络间的“更新传递”以及如何解决分布式中可能出现的单个节点故障问题。下面这个总结是根据Andrew Ng教授在Google所领导的Google Brain项目采用的相关技术,讨论如何有效的解决上述两个问题。 阅读全文
posted @ 2013-08-22 12:39 HarryJiang 阅读(663) 评论(1) 推荐(0) 编辑
摘要: RBM是构建deep learning 的基础,之前研究了一段时间,把相关的理论进行了下系统的梳理,并进行了总结。理论总结以pdf上传到了这里: http://files.cnblogs.com/HarryJiang/rbm.pdf相关的单机版python实现代码:https://github.com/nebuladream/sparse_class_rbm/tree/master/ClassRBMPy 阅读全文
posted @ 2013-08-22 12:20 HarryJiang 阅读(1685) 评论(3) 推荐(2) 编辑
摘要: “宝贝印象”是从用户评论中解析出关键词来,并根据这些关键词对于文档本身进行聚类以提供给用户更加直观评论信息。 淘宝系统当中有庞大的词库支持,如用户描述“好闻”“很香”等会被自动判断为“气味”,当该属性的提及次数在所有的属性词当中排在前K个,即会被展现,用户点击“气味”时,也会自动反向匹配相关评论的原文。要实现这样的效果,首先需要对于关键词进行聚类。假设有一个documents-terms所组成的矩阵每一行代表一个文档,行当中的每个元素代表某个单词出现的次数,这样把字典中的所有单词全部平铺开来,就会形成一个很大而且稀疏的矩阵。假设该矩阵为A, 如果对这个矩阵进行SVD分解,则会得到如下的形式化表 阅读全文
posted @ 2013-06-12 16:20 HarryJiang 阅读(1135) 评论(0) 推荐(0) 编辑