01 2018 档案

Vim 文件coding gbk格式
摘要:只需在 ~/.vimrc设置一致即可。文件编辑可正常显示中文,cat,不能正常显示,显示乱码,详情参考上篇。 set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936 set termencoding=utf-8 set encoding=ut 阅读全文

posted @ 2018-01-14 11:36 TMatrix52 阅读(186) 评论(0) 推荐(0) 编辑

linux shell 中文件编码查看及转换方法
摘要:参考: http://edyfox.codecarver.org/html/vim_fileencodings_detection.html 一、查看文件编码。 在打开文件的时候输入:set fileencoding 即可显示文件编码格式。 二、文件编码转换 1、在Vim中直接进行转换文件编码,比如 阅读全文

posted @ 2018-01-12 20:41 TMatrix52 阅读(564) 评论(0) 推荐(1) 编辑

句法分析工具 LTP HanLP
摘要:参考:http://cslt.riit.tsinghua.edu.cn/mediawiki/images/e/e5/%E5%8F%A5%E6%B3%95%E5%B7%A5%E5%85%B7%E5%88%86%E6%9E%90.pdf http://pyltp.readthedocs.io/zh_CN 阅读全文

posted @ 2018-01-11 19:45 TMatrix52 阅读(713) 评论(0) 推荐(0) 编辑

ix 混合索引
摘要:raw_datas #DateFrame diff_index_list = [] #行index #多行所有列索引 raw_datas.ix[diff_index_list] #多行一列索引raw_datas.ix[diff_index_list, df.columns[1]] #多行多列索引ra 阅读全文

posted @ 2018-01-04 21:10 TMatrix52 阅读(203) 评论(0) 推荐(0) 编辑

models.doc2vec – Deep learning with paragraph2vec
摘要:参考: 用 Doc2Vec 得到文档/段落/句子的向量表达 https://radimrehurek.com/gensim/models/doc2vec.html Gensim Doc2vec Tutorial on the IMDB Sentiment Dataset 基于gensim的Doc2V 阅读全文

posted @ 2018-01-04 11:28 TMatrix52 阅读(309) 评论(0) 推荐(0) 编辑

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8

统计

点击右上角即可分享
微信分享提示