上一页 1 ··· 6 7 8 9 10 11 下一页
摘要: 新建一个文件夹命名为yuliao,把所有txt文件放进去就ok啦!注意路径中‘/’,windows下路径不是这样。 阅读全文
posted @ 2017-05-18 19:22 右介 阅读(33915) 评论(2) 推荐(1) 编辑
摘要: 把语料从数据库提取出来以后就要进行分词啦,我是在linux环境下做的,先把jieba安装好,然后找到内容是build jieba PKG-INFO setup.py test的那个文件夹(我这边是jieba-0.38),把自己的自定义词典(选用,目的是为了分出原始词库中没有的词以及优先分出一些词), 阅读全文
posted @ 2017-05-18 19:07 右介 阅读(68398) 评论(13) 推荐(3) 编辑
摘要: #coding=utf-8 import sys reload(sys) sys.setdefaultencoding('utf-8') from pymongo import MongoClient #建立MongoDB数据库连接 client = MongoClient('IP', 27017) #用户验证 db = client.库名 db.authenticate("账号", "密... 阅读全文
posted @ 2017-05-18 18:15 右介 阅读(7992) 评论(0) 推荐(0) 编辑
摘要: 2017-04-26 语料数据入库时有个小需求,需要用一个字段存储语料的语种,偶然发现langid可以实现这一功能,再次感叹python的好用! 阅读全文
posted @ 2017-05-18 13:40 右介 阅读(5067) 评论(0) 推荐(0) 编辑
摘要: 2017-04-25 可用Nodepad++将json文件打开并以UTF8无BOM格式保存。 阅读全文
posted @ 2017-05-17 16:20 右介 阅读(4370) 评论(0) 推荐(0) 编辑
摘要: 2017-04-25 python连mongodb数据库并将提取部分数据写入本地文件时,出现UnicodeEncodeError。 解决方法:指定文件字符集为utf-8,在文件头部加入以下代码 import sys reload(sys) sys.setdefaultencoding('utf-8' 阅读全文
posted @ 2017-05-17 16:17 右介 阅读(372) 评论(0) 推荐(0) 编辑
摘要: 2017-04-20 1、***\bin\>MySQL -h localhost -u root -p 这样应该可以进入MySQL服务器 执行代码如下: MySQL>use mysql; MySQL>update user set host = '%' where user = 'root'; My 阅读全文
posted @ 2017-05-17 15:39 右介 阅读(1062) 评论(0) 推荐(0) 编辑
摘要: 2017-04-19 部门经理习惯用C#做数据清洗,遇到个需要验证的问题,在一个万次左右循环内对文件执行打开关闭操作,比在循环前打开文件、循环后关闭文件耗时多多少。 阅读全文
posted @ 2017-05-17 15:33 右介 阅读(746) 评论(0) 推荐(0) 编辑
摘要: 2017-04-14 1.找到mysql安装目录,默认是C:/ProgramData/MySQL/MySQL Server 5.1,找到my.ini。如果这个文件没有,自己建一个my.ini。 2.假如你要把数据库放在F盘的newdir目录,则在my.ini中写入一下内容,并保存: [mysqld] 阅读全文
posted @ 2017-05-17 15:17 右介 阅读(1573) 评论(0) 推荐(0) 编辑
摘要: 2017-04-10 pickle是用来加工数据的,可以用来存取结构化数据。 例如: 一个字典a = {'name':'Timmy','age':26},用pickle.dump存到本地文件,所存数据的结构就是字典,而普通的file.write写入文件的是字符串。读取时,pickle.load返回的 阅读全文
posted @ 2017-05-17 14:53 右介 阅读(296) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 下一页