上一页 1 ··· 4 5 6 7 8 9 10 11 下一页
摘要: #coding=utf-8 import os import pandas as pd import glob def hebing(): csv_list = glob.glob('*.csv') print(u'共发现%s个CSV文件'% len(csv_list)) print(u'正在处理............') for i in csv_list:... 阅读全文
posted @ 2017-06-22 11:30 右介 阅读(16375) 评论(0) 推荐(0) 编辑
摘要: 连接参数里加上 charset='utf8' 阅读全文
posted @ 2017-06-09 10:49 右介 阅读(2377) 评论(0) 推荐(0) 编辑
摘要: 把所有要上传的json文件放在一个文件夹里,在文件夹同一路径下创建这个.sh文件并执行。一个文件上传结束会自动执行下一个文件的上传命令。 阅读全文
posted @ 2017-06-08 17:03 右介 阅读(2841) 评论(0) 推荐(0) 编辑
摘要: 现有一个28G的txt文件,里面每一行是一个分词过的专利全文文档,一共370多万行。我需要把它按每五万行为单位做成一个json文件,格式大致如下: [{"id":"100000001","quanwen":"你好 张梦"},...] 其中每个quanwen中内容是每一行的文本。 阅读全文
posted @ 2017-06-08 15:50 右介 阅读(2780) 评论(0) 推荐(0) 编辑
摘要: 1、安装dos2unix(我的centos命令: yum install dos2unix)2、执行命令:dos2unix 文件名.sh 3、执行命令:bash -n 文件名.sh (检查语法错误) 阅读全文
posted @ 2017-06-08 15:36 右介 阅读(1691) 评论(0) 推荐(0) 编辑
摘要: Linux环境下: 1、进入需要导入的文件所在路径 2、执行: curl "http://IP:8983/solr/目标集合名/update?commit=true" --data-binary @文件名.json -H "Content-type:application/json" Windows 阅读全文
posted @ 2017-06-07 17:14 右介 阅读(1453) 评论(0) 推荐(0) 编辑
摘要: 如果命令语句中有单引号,改为英文双引号试一下 阅读全文
posted @ 2017-06-07 16:57 右介 阅读(5227) 评论(0) 推荐(1) 编辑
摘要: 步骤: 1、在Solr客户端左下方 Core Selector 中点选想要删除数据的索引库 2、点选Documents 3、右侧Document Type中点选XML 4、Document(s)中输入: 5、点击Submit Document 阅读全文
posted @ 2017-06-07 13:42 右介 阅读(4055) 评论(0) 推荐(0) 编辑
摘要: unlockOnStartup 告知 Solr 忽略在多线程环境中用来保护索引的锁定机制。在某些情况下,索引可能会由于不正确的关机或其他错误而一直处于锁定,这就妨碍了添加和更新。将其设置为 true 可以禁用启动锁定,进而允许进行添加和更新。 进入solr-5.3.1/server/solr/被锁住 阅读全文
posted @ 2017-06-07 10:40 右介 阅读(1348) 评论(0) 推荐(0) 编辑
摘要: 使用solr-5.3.1\example\exampledocs下的post.jar来完成数据导入 1、将想要导入的文件放在solr-5.3.1\example\exampledocs中,如aaa.xml, bbb.json 2、xml文件导入执行命令: java -Dport=solr端口号 -D 阅读全文
posted @ 2017-06-07 10:11 右介 阅读(2016) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 下一页