获取文件编码集

在读取文本文件时,通常需要先获取文件的编码集。

可以采用

  /**
   * @description 获取文件编码集
   * @date Jul 21, 2011
   * @param file 文件对象
   * @return 文件编码集名称
   */
  public static String getFileCharacterEnding(File file) {

    String fileCharacterEnding = "UTF-8";
    info.monitorenter.cpdetector.io.CodepageDetectorProxy detector = CodepageDetectorProxy
        .getInstance();
    detector.add(JChardetFacade.getInstance());

    Charset charset = null;
    try {
      charset = detector.detectCodepage(file.toURL());
    }
    catch (Exception e) {
      e.printStackTrace();
    }
    if (charset != null) {
      fileCharacterEnding = charset.name();
    }

    return fileCharacterEnding;
  }

本代码需要两个jar包

cpdetector_1.0.8.jar和chardet-1.0.jar

posted @ 2011-09-22 11:04  gmartincn  阅读(340)  评论(0编辑  收藏  举报