12 2017 档案

带列表写入文件出错先 json.dumps
摘要:output = json.dumps(output, ensure_ascii=False).encode('utf-8') 阅读全文

posted @ 2017-12-29 19:24 TMatrix52 阅读(174) 评论(0) 推荐(0) 编辑

IK 中文分词器
摘要:链接:https://github.com/wks/ik-analyzerIKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析 阅读全文

posted @ 2017-12-29 17:11 TMatrix52 阅读(154) 评论(0) 推荐(0) 编辑

tarfile — Read and write tar archive files
摘要:参考: https://docs.python.org/2/library/tarfile.html http://www.jianshu.com/p/bbad16822eab #解压文件tarfile.open(filepath, 'r:gz').extractall(inception_pret 阅读全文

posted @ 2017-12-10 17:16 TMatrix52 阅读(138) 评论(0) 推荐(0) 编辑

一些稍微复杂的正则表达式
摘要:参考: http://www.jb51.net/shouce/jquery/regexp.html http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 1. 数量词的贪婪模式与非贪婪模式 2. 数量词的贪婪模式与非贪婪模式 正则表达 阅读全文

posted @ 2017-12-08 13:31 TMatrix52 阅读(218) 评论(0) 推荐(0) 编辑

导航

点击右上角即可分享
微信分享提示