摘要: sphinx的配置文件是在配置的时候最容易出错的了 我们先要明白几个概念: source:数据源,数据是从什么地方来的。 index:索引,当有数据源之后,从数据源处构建索引。索引实际上就是相当于一个字典检索。有了整本字典内容以后,才会有字典检索。 searchd:提供搜索查询服务。它一般是以dea 阅读全文
posted @ 2017-09-21 16:08 朽木自雕也 阅读(662) 评论(0) 推荐(0) 编辑
摘要: 从网络收集的文本各种各样,难免有垃圾数据,每行长度不一样,由于垃圾数据,导致导入MYSQL的时候导入速度缓慢,对导入缓慢的文本可以使用文本软件打开看看里面是否包含一些空白行 如图 处理办法 对最后去重后的文件进行fold 限制每行长度为300 将一个名为testfile 的文件的行折叠成宽度为300 阅读全文
posted @ 2017-09-19 11:07 朽木自雕也 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 解压RAR文件是提示, 不可预料的压缩文件末端 如图 我们可以使用工具来修复 链接:http://pan.baidu.com/s/1cD8Mqq 密码:24dm 操作很简单,点击右侧按钮选择需要修复的压缩包, 然后点击开始修复,修复完毕后会自动解压并打开目录。 一个修复成功的案例 阅读全文
posted @ 2017-08-29 17:22 朽木自雕也 阅读(10012) 评论(0) 推荐(0) 编辑
摘要: 原文本 Solr建立的索引 如果进行Mysql索引应该是1:3的比例 阅读全文
posted @ 2017-08-23 22:37 朽木自雕也 阅读(262) 评论(0) 推荐(0) 编辑
摘要: 导出命令 select * from b10 into outfile 'd:/b10.txt'; GBK格式导入 默认TAB分割 load data infile 'D:/test.txt' ignore into table b_1 character set gbk lines termina 阅读全文
posted @ 2017-08-23 21:25 朽木自雕也 阅读(109) 评论(0) 推荐(0) 编辑
摘要: Mysql在导入大量数据的时候就要把tomcat添加成服务 添加服务 在DOS界面下,进入Tomcat解压目录的bin目录 service.bat install 阅读全文
posted @ 2017-08-23 21:18 朽木自雕也 阅读(383) 评论(0) 推荐(0) 编辑
摘要: IK分词器就是一款中国人开发的,扩展性很好的中文分词器,它支持扩展词库,可以自己定制分词项,这对中文分词无疑是友好的。 jar包下载链接:http://pan.baidu.com/s/1o85I15o 密码:p82g下载好之后,将IK对应的jar复制到项目的D:\tomcat\webapps\sol 阅读全文
posted @ 2017-08-23 18:41 朽木自雕也 阅读(666) 评论(0) 推荐(0) 编辑
摘要: copyField 与multiValued用途 在我们的应用中经常会有这种情形:当用户输入某个字符串查找时,需要如果在标题及内容中存在这个字会串时均要把记录加载出来,通过引入copyField及multiValue这两个标签便可解决这种问题。如: 1.首先也要定义目标域的属性,name域名=sgk 阅读全文
posted @ 2017-08-23 17:50 朽木自雕也 阅读(809) 评论(0) 推荐(0) 编辑
摘要: 建一个例子,给core导入索引数据,用于后面的实验。 1.创建一个数据库 创建一个数据库,并创建几条数据,表结构: id自增 S_user用户信息 S_text随便填一些内容 注意:字符集UTF8 添加几条数据 2. 配置solrconfig.xml sorlconfig.xml文件与managed 阅读全文
posted @ 2017-08-23 13:02 朽木自雕也 阅读(943) 评论(0) 推荐(0) 编辑
摘要: 1、什么是core core是solr的一个索引库,可以理解为一个数据库,core可以根据需要,创建多个。 2、创建core 首先进入到solrhome文件夹(D:\solrhome),创建一个文件夹用于存放core。(例如:core_demo) 然后进入到solr-6.6.0\server\sol 阅读全文
posted @ 2017-08-22 21:44 朽木自雕也 阅读(620) 评论(0) 推荐(0) 编辑