随笔分类 - 【47】搜索引擎
摘要:环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 elasticsearch-2.2.0 第一步:获取数据主流搜索引擎,会使用爬虫,来获取网站的html数据,常用的工具有nutch,Python(主流),wge
阅读全文
摘要:环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 elasticsearch-2.2.0 一、Rest简介Representational State Transfer一种软件架构风格,而不是标准,只是提供了一
阅读全文
摘要:环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 一、概念ElasticSearch: 基于Lucene全文搜索框架; 实时的高扩展的分布式的开源搜索引擎; Java开发,基于RESTful web接口; Lu
阅读全文
摘要:安装环境 jdk1.7 solr-4.10.3.tgz KAnalyzer2012FF_u1.jar tomcat7 VM虚拟机redhat6.5-x64:192.168.1.201 Xshell4 部署方案 单机部署201 安装步骤 步骤一:下载解压IK Analyzer 2012FF_hf1.z
阅读全文
摘要:安装环境 jdk1.7 solr-4.10.3.tgz tomcat7 VM虚拟机redhat6.5-x64:192.168.1.201 Xshell4 部署方案 单机部署201安装步骤 步骤一:解压Solr tar -zxvf solr-4.10.3.tgz -C /usr/local/src 步
阅读全文