摘要: 安装环境:windows7、cygwin1.7.9、hadoop0.21.01、jdk的安装路径包含空格问题:在hadoop-env.sh中加入JAVA_HOME环境变量供hadoop使用java,cygwin是在windows平台上模拟的linux环境,所以,使用的是安装到windows上的java,一般习惯放到Program Files目录下,但是路径包含空格,在后面的过程中会发生问题,网上有的解决方法是把路径放到“”中,还有的说在空格前加\,都测试了,问题依然存在(至少我使用的版本中),我总结的两个解决办法,一个是把jdk安装到没有空格的目录中;第二个方法是建立符号连接,例如jdk安装到 阅读全文
posted @ 2011-04-11 14:54 breezee 阅读(673) 评论(0) 推荐(0) 编辑
摘要: 垂直搜索引擎:不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。使用Lucene 2.0和Heritrix来构建自己的垂直搜索引擎 。 阅读全文
posted @ 2011-04-11 11:44 breezee 阅读(415) 评论(0) 推荐(0) 编辑