java 读取文件——按照行取出(使用BufferedReader和一次将数据保存到内存两种实现方式)

1、实现目标

  读取文件,将文件中的数据一行行的取出。

2、代码实现

1)、方式1:

  通过BufferedReader的readLine()方法。

/**
     * 功能:Java读取txt文件的内容 步骤:1:先获得文件句柄 2:获得文件句柄当做是输入一个字节码流,需要对这个输入流进行读取
     * 3:读取到输入流后,需要读取生成字节流 4:一行一行的输出。readline()。 备注:需要考虑的是异常情况
     * 
     * @param filePath
     *            文件路径[到达文件:如: D:\aa.txt]
     * @return 将这个文件按照每一行切割成数组存放到list中。
     */
    public static List<String> readTxtFileIntoStringArrList(String filePath)
    {
        List<String> list = new ArrayList<String>();
        try
        {
            String encoding = "GBK";
            File file = new File(filePath);
            if (file.isFile() && file.exists())
            { // 判断文件是否存在
                InputStreamReader read = new InputStreamReader(
                        new FileInputStream(file), encoding);// 考虑到编码格式
                BufferedReader bufferedReader = new BufferedReader(read);
                String lineTxt = null;

                while ((lineTxt = bufferedReader.readLine()) != null)
                {
                    list.add(lineTxt);
                }
                bufferedReader.close();
                read.close();
            }
            else
            {
                System.out.println("找不到指定的文件");
            }
        }
        catch (Exception e)
        {
            System.out.println("读取文件内容出错");
            e.printStackTrace();
        }

        return list;
    }

2)、方式2

  通过文件byte数组暂存文件中内容,将其转换为String数据,再按照 “回车换行” 进行分割。

/**
     * 读取filePath的文件,将文件中的数据按照行读取到String数组中
     * @param filePath    文件的路径
     * @return            文件中一行一行的数据
     */
    public static String[] readToString(String filePath)
    {
        File file = new File(filePath);
        Long filelength = file.length(); // 获取文件长度
        byte[] filecontent = new byte[filelength.intValue()];
        try
        {
            FileInputStream in = new FileInputStream(file);
            in.read(filecontent);
            in.close();
        } catch (FileNotFoundException e)
        {
            e.printStackTrace();
        } catch (IOException e)
        {
            e.printStackTrace();
        }
        
        String[] fileContentArr = new String(filecontent).split("\r\n");
        
        return fileContentArr;// 返回文件内容,默认编码
    }

3)、测试

public static void main(String[] args)
    {

        
        List<String> stringList = readTxtFileIntoStringArrList("C:\\soft\\java\\tomcat\\apache-tomcat-7.0.40\\webapps\\appDataGenerate\\log4j\\lepai_recognize_cache.log");
        
        System.out.println("-------使用BufferedReader读取-----------");
        for(String str : stringList)
        {
            System.out.println(str);
        }
        
        System.out.println("\n---------使用byte直接缓存整个文件到内存----------------");
        
        String[] stringArr = readToString("C:\\soft\\java\\tomcat\\apache-tomcat-7.0.40\\webapps\\appDataGenerate\\log4j\\lepai_recognize_cache.log");
        for(int i = 0 ; i < stringArr.length ; i ++)
        {
            System.out.println(stringArr[i]);
        }
        
        
    }

结果:

-------使用BufferedReader读取-----------
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-12-01 14:52:04] [RecognizeCache] [INFO] : 读取文件:4209bad42de0f6e55c0daf0bd24b635a.txt

---------使用byte直接缓存整个文件到内存----------------
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-12-01 14:52:04] [RecognizeCache] [INFO] : 读取文件:4209bad42de0f6e55c0daf0bd24b635a.txt

3、比较

  方式1是将文件的一部分或全部数据读取出来用BufferReader缓存起来,需要再冲缓存中取数据,这样比要得时候去文件中读取要快一些。

  方式2是一次把文本的原始内容直接读取到内存中再做处理(暂时不考虑内存大小),这样做效率也会提高。同时,可以处理当你使用第1方式用readLine()方法时,文件又有线程在不断的向文件中写数据【只处理现在已经在文件中的数据】。另外,用readline()之类的方法,可能需要反复访问文件,而且每次readline()都会调用编码转换,降低了速度,所以,在已知编码的情况下,按字节流方式先将文件都读入内存,再一次性编码转换是最快的方式。

  有错误的希望大牛不吝赐教。 想了解一下,

  1、通过ftp取一个文件到本地,我如何判断对方的文件是否已经写完了。

  2、当我使用上面的BufferedReader的readLine()方法一行行读取文件的时候,我还向文件中添加数据,会不会出现文件读取结束不了的情况。

源码下载:

https://github.com/zcr1007391008/demo 的TestReadAllFileToMemory。

  致谢:感谢您的阅读!

posted on 2015-12-01 14:25  WhyWin  阅读(79613)  评论(0编辑  收藏  举报

导航