随笔分类 - Hadoop+Nutch+HBse+ES
Ubuntu系统下搜索引擎搭建知识记录和积累
摘要:/×××××××××××××××××××××××××××××××××××××××××/Author:xxx0624HomePage:http://www.cnblogs.com/xxx062
阅读全文
摘要:1.WordCount(统计单词)经典的运用MapReuce编程模型的实例1.1 Description给定一系列的单词/数据,输出每个单词/数据的数量1.2 Sample1 a is b is not c2 b is a is not d1.3 Output1 a:22 b:23 c:14 d:1...
阅读全文
摘要:/×××××××××××××××××××××××××××××××××××××××××/Author:xxx0624HomePage:http://www.cnblogs.com/xxx062
阅读全文
摘要:提示1:必须保证之前的ES中不存在index, 否则ES集群无法启动, 会提示red!提示2:下载的IK如果太新,会报错 TokenStream被重载Caused by: java.lang.VerifyError: class org.wltea.analyzer.lucene.IKAnalyze...
阅读全文
摘要:/×××××××××××××××××××××××××××××××××××××××××/Author:xxx0624HomePage:http://www.cnblogs.com/xxx062
阅读全文
摘要:/×××××××××××××××××××××××××××××××××××××××××/Author:xxx0624HomePage:http://www.cnblogs.com/xxx062
阅读全文
摘要:前提nutch1.2已部署到eclipse中详见:http://www.cnblogs.com/cy163/archive/2013/02/19/2916419.html1 部署IKAnalyzer3.2.81.1 下载IKAnalyzer3.2.81.2 将IKAnalyzer3.2.8复制到nu...
阅读全文
摘要:1 下载elasticsearch-0.90.52 修改配置(可选)修改内存:(可选)bin/elasticsearch.in.sh中:ES_MIN_MEMES_MAX_MEM修改搜索引擎页面信息:(可选)config/elasticsearch.yml中:cluster.name: elastic...
阅读全文
摘要:简易的搜索引擎搭建我的配置:Nutch:1.2Tomcat:7.0.571 Nutch设置修改Nutch配置1.1 修改conf/nutch-site.xml 1 2 3 4 5 6 7 8 9 storage.data.store.class 10 ...
阅读全文
摘要:/×××××××××××××××××××××××××××××××××××××××××/Author:xxx0624HomePage:http://www.cnblogs.com/xxx062
阅读全文
摘要:nutch2.2.1集成HBase0.94.25(详见:http://duguyiren3476.iteye.com/blog/2085973 )1. 修改nutch的hbase配置//将自己的hbase配置copy到nutch配置中cp /home/hbase/conf/hbase-site.xm...
阅读全文
摘要:/×××××××××××××××××××××××××××××××××××××××××/Author:xxx0624HomePage:http://www.cnblogs.com/xxx062
阅读全文
摘要:配置ant1. 下载ant(http://ant.apache.org/bindownload.cgi)例如我下载的是:apache-ant-1.9.4-bin.tar.gz解压ant,将文件夹名称改为apache_ant,并移动到/home目录下2. 设置环境变量sudo gedit /etc/p...
阅读全文
摘要:/×××××××××××××××××××××××××××××××××××××××××/Author:xxx0624HomePage:http://www.cnblogs.com/xxx062
阅读全文
摘要:配置zookeeper注意:因为是单机伪分布式配置,故同一机器上有3个serverzookeeper文件格式如下home---zookeeper---server0---zookeeper | ------------ser...
阅读全文
摘要:配置tomcat前提条件:JDK已配置。(配置JDK:http://www.cnblogs.com/xxx0624/p/4164744.html)1. 下载tomcat(http://tomcat.apache.org/download-70.cgi)解压到某个目录(我解压到的是:/home)tar...
阅读全文
摘要:/×××××××××××××××××××××××××××××××××××××××××/Author:xxx0624HomePage:http://www.cnblogs.com/xxx062
阅读全文
摘要:配置openSSH1.手动下载压缩文件(.tar.gz)zlib-1.2.7.tar.gzopenssl-1.0.1j.tar.gzopenssh-6.0p1.tar.gz2.安装zlib 2.1 解压zlibsudo tar -zxvf zlib-1.2.7.tar.gz 2.2编译安装/*进入z...
阅读全文
摘要:/×××××××××××××××××××××××××××××××××××××××××/Author:xxx0624HomePage:http://www.cnblogs.com/xxx062
阅读全文