2014年8月6日

摘要: 本文为senlie原创,转载请保留此地址:http://www.cnblogs.com/senlie/todo 本文未完善,还待修改许多问题可以被表述为寻找相似项。比如,有相似单词的网页 —— 用于重复检测、根据主题分类,购买了相似物品的用户,有相似特征的图像。这些问题可以被抽象为:给定:一组高维的... 阅读全文
posted @ 2014-08-06 20:05 senlie zheng 阅读(1332) 评论(0) 推荐(3) 编辑

2014年7月27日

摘要: 本文为senlie原创,转载请保留此地址:http://www.cnblogs.com/senlie/1.概要很多计算在概念上很直观,但由于输入数据很大,为了能在合理的时间内完成,这些计算必须分布在数以百计数以千计的机器上。例如处理爬取得到的文档、网页请求日志来计算各种衍生数据,如倒排索引,网页文档... 阅读全文
posted @ 2014-07-27 17:16 senlie zheng 阅读(17287) 评论(2) 推荐(1) 编辑

2014年7月25日

摘要: 本文为senlie原创,转载请保留此地址:http://www.cnblogs.com/senlie/决策树---------------------------------------------------------------------1.描述:以树为基础的方法可以用于回归和分类。树的节点... 阅读全文
posted @ 2014-07-25 16:13 senlie zheng 阅读(6961) 评论(0) 推荐(1) 编辑

2013年10月1日

摘要: `references:` 1. http://zh.wikipedia.org/wiki/CAP%E5%AE%9A%E7%90%86 2. http://en.wikipedia.org/wiki/CAP_theorem 3. http://www.royans.net/arch/brewers-cap-theorem-on-distributed-systems/ 4. http://tianhailong.com/cap%e7%90%86%e8%ae%ba.html **Brewers CAP Theorem on distributed systems** Large... 阅读全文
posted @ 2013-10-01 13:01 senlie zheng 阅读(421) 评论(0) 推荐(0) 编辑

导航