上一页 1 ··· 49 50 51 52 53 54 55 56 57 ··· 78 下一页
摘要: 1、概述Hadoop Streaming是Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer,例如:采用shell脚本语言中的一些命令作为mapper和reducer(cat作为mapper,wc作为reducer)$HADOOP_HOME/bi... 阅读全文
posted @ 2014-06-15 16:38 Django's blog 阅读(424) 评论(0) 推荐(0) 编辑
摘要: 转自:使用Python实现Hadoop MapReduce程序英文原文:Writing an Hadoop MapReduce Program in Python根据上面两篇文章,下面是我在自己的ubuntu上的运行过程。文字基本采用博文使用Python实现Hadoop MapReduce程序, 打... 阅读全文
posted @ 2014-06-15 16:35 Django's blog 阅读(989) 评论(0) 推荐(0) 编辑
摘要: http://agapple.iteye.com/blog/1111377zookeeper学习记录博客分类:distributed背景 前段时间看了S4流计算引擎,里面使用到了zookeeper进行集群管理,所以也就花了点时间研究了下zookeeper,不求看懂所有源码,但求了解其实现机制和原理,... 阅读全文
posted @ 2014-06-10 14:32 Django's blog 阅读(441) 评论(0) 推荐(0) 编辑
摘要: 1.g++ test_search.cpp -o test_search.o -g2.gdb ./test_search.o3.l:看代码b 12:设置断点在第12行p var: 看变量n:单步执行r: runc: continue 阅读全文
posted @ 2014-06-09 17:06 Django's blog 阅读(160) 评论(0) 推荐(0) 编辑
摘要: http://www.csdn.net/article/2014-06-05/2820089摘要:MapReduce在实时查询和迭代计算上仍有较大的不足,目前,Spark由于其可伸缩、基于内存计算等特点,且可以直接读写Hadoop上任何格式的数据,逐渐成为大数据处理的新宠,腾讯分享了Spark的原理... 阅读全文
posted @ 2014-06-05 16:05 Django's blog 阅读(394) 评论(0) 推荐(0) 编辑
摘要: http://www.tuicool.com/articles/vUvQVn时间2009-08-30 15:13:22不周山原文http://www.wentrue.net/blog/?p=559不久前,始于2006年的netflix prize名花有主,几年来一直领先的Bellkor队得到了最后的... 阅读全文
posted @ 2014-06-05 15:28 Django's blog 阅读(330) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/dark_scope/article/details/17228643〇.说明 本文的所有代码均可在DML找到,欢迎点星星。一.引入 推荐系统(主要是CF)是我在参加百度的电影推荐算法比赛的时候才临时学的,虽然没拿什么奖,但是知识却是到手了,一... 阅读全文
posted @ 2014-06-05 15:07 Django's blog 阅读(1142) 评论(0) 推荐(0) 编辑
摘要: http://www.cnblogs.com/guozk/p/3316790.htmlFP-Growth算法 FP-Growth(频繁模式增长)算法是韩家炜老师在2000年提出的关联分析算法,它采取如下分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(FP-Tree),但仍保留项集关联信息;该算... 阅读全文
posted @ 2014-06-04 16:21 Django's blog 阅读(1089) 评论(0) 推荐(0) 编辑
摘要: http://www.cnblogs.com/guozk/p/3498844.htmlSolrCloud阶段总结开发类型全文检索相关开发Solr版本4.2文件内容本文介绍SolrCloud的功能使用及相关注意事项在代码文本框中如有显示不全的,请在文本框中按Ctrl+A再复制.版本作者/修改人日期V1... 阅读全文
posted @ 2014-06-04 16:13 Django's blog 阅读(495) 评论(0) 推荐(0) 编辑
摘要: http://www.cnblogs.com/guozk/p/3498831.htmlSolr调研总结开发类型全文检索相关开发Solr版本4.2文件内容本文介绍solr的功能使用及相关注意事项;主要包括以下内容:环境搭建及调试、两个核心配置文件介绍、中文分词器配置、维护索引、查询索引,高亮显示、拼写... 阅读全文
posted @ 2014-06-04 15:42 Django's blog 阅读(892) 评论(0) 推荐(0) 编辑
上一页 1 ··· 49 50 51 52 53 54 55 56 57 ··· 78 下一页