2015年11月18日
摘要: java如何从gbk格式的文件中读取字符串保存为utf8的文件:读入: BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(fileFrom), Charset.forName... 阅读全文
posted @ 2015-11-18 12:35 大雄fcl 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 摘要:为解决中文搜索的问题,最开始使用PHP版开源的SCWS,但是处理人名和地名时,会出现截断人名地名出现错误。开始使用NLPIR分词,在分词准确性上效果要比SCWS好。本文介绍如何在windows系统下编译JAVA,生成可以执行的jar文件。NLPIR的下载地址:http://ictclas.nl... 阅读全文
posted @ 2015-11-18 10:32 大雄fcl 阅读(5842) 评论(0) 推荐(0) 编辑