获取文件编码集
在读取文本文件时,通常需要先获取文件的编码集。
可以采用
/** * @description 获取文件编码集 * @date Jul 21, 2011 * @param file 文件对象 * @return 文件编码集名称 */ public static String getFileCharacterEnding(File file) { String fileCharacterEnding = "UTF-8"; info.monitorenter.cpdetector.io.CodepageDetectorProxy detector = CodepageDetectorProxy .getInstance(); detector.add(JChardetFacade.getInstance()); Charset charset = null; try { charset = detector.detectCodepage(file.toURL()); } catch (Exception e) { e.printStackTrace(); } if (charset != null) { fileCharacterEnding = charset.name(); } return fileCharacterEnding; }
本代码需要两个jar包
cpdetector_1.0.8.jar和chardet-1.0.jar