摘要: 本文来自:http://www.ilablog.org/%E7%BC%96%E8%AF%91hadoop-eclipse%E6%8F%92%E4%BB%B6/本人由于工作原因目前没有亲自尝试,那位尝试如果出错可以将错误写在评论里,我们共同探讨。一、所需软件Windows 7旗舰版Eclipse 3.7.0AntCygwinhadoop-1.0.3二、Ant和Cygwin安装1、Ant安装(1)将Ant解压放在合适目录:比如D盘。(2)配置Ant环境变量:D:\Ant\apache-ant-1.8.4\bin(3)控制台中输入echo %PAHT% 使环境变量生效。(没必要重启)2、Cygwin 阅读全文
posted @ 2013-08-29 13:57 wq920 阅读(523) 评论(0) 推荐(0) 编辑
摘要: FROM:http://www.drdobbs.com/parallel/indexing-and-searching-on-a-hadoop-distr/226300241?pgno=3在今天的信息饱和的世界,地理分布的数据,需要一种系统的巨大增长,有利于快速检索有意义的结果的解析。分布式数据的可搜索的索引去加速的过程很长的路要走。在这篇文章中,我演示了如何使用Lucene和Java的基本数据索引和搜索,如何使用RAM目录索引和搜索,如何创建居住在HDF的数据索引,以及如何搜索这些索引。由开发环境,Eclipse的Java 1.6的Lucene的2.4.0,3.4.2,和Hadoop 0.1 阅读全文
posted @ 2013-08-29 11:53 wq920 阅读(2331) 评论(0) 推荐(0) 编辑
摘要: FROM:http://architects.dzone.com/articles/solr-hadoop-big-data-love许多人使用Hadoop的开源项目来处理大数据的大数据集,因为它是一个伟大的解决方案可扩展,可靠的数据处理工作流程。Hadoop是目前最流行 ​​的大数据处理系统,与企业使用数千台服务器上的数据存储和处理PB级的大规模集群。Nutch的开源网络爬虫项目于2006年出现以来,Hadoop已种植在各方面都可以想象-用户,开发相关的项目(又名“Hadoop生态系统”)。在大致相同的时间开始,Solr的开源项目已经成为地球上最广泛使用的搜索解决方案。Solr的包装API级 阅读全文
posted @ 2013-08-29 11:20 wq920 阅读(2979) 评论(0) 推荐(0) 编辑