摘要: 内容就是标题了。是要重构下上一节的代码,大体上按如下的思路: 功能拆分; 创建必要的工具类; 两个工具类StringUtils和TxtUtils。 StringUtils,主要是获取当前系统的换行符: package com.zhyea.util; public class StringUtils { public static final String... 阅读全文
posted @ 2014-12-22 16:52 robin·张 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 前段时间,在学习lucene的时候,遇到了读取txt文档遇到编码错误的问题。学了几个解决方案,大部分是将文件转十六进制(可以使用UE的Ctrl+H来查看),读取开头的四个标志位来判断。可是总有些文本文件无法识别(我遇到的是部分使用UTF-8编码的文件),后来发现了JCharDet。JCharDet是mozilla(就是firefox那家)的编码识别算法的Java实现,算了,这里是官网,自己看吧。 ... 阅读全文
posted @ 2014-12-22 16:27 robin·张 阅读(2944) 评论(0) 推荐(0) 编辑