java 读取文件——按照行取出（使用BufferedReader和一次将数据保存到内存两种实现方式）

1、实现目标

　　读取文件，将文件中的数据一行行的取出。

2、代码实现

1）、方式1：

　　通过BufferedReader的readLine()方法。

/**
     * 功能：Java读取txt文件的内容 步骤：1：先获得文件句柄 2：获得文件句柄当做是输入一个字节码流，需要对这个输入流进行读取
     * 3：读取到输入流后，需要读取生成字节流 4：一行一行的输出。readline()。 备注：需要考虑的是异常情况
     * 
     * @param filePath
     *            文件路径[到达文件:如： D:\aa.txt]
     * @return 将这个文件按照每一行切割成数组存放到list中。
     */
    public static List<String> readTxtFileIntoStringArrList(String filePath)
    {
        List<String> list = new ArrayList<String>();
        try
        {
            String encoding = "GBK";
            File file = new File(filePath);
            if (file.isFile() && file.exists())
            { // 判断文件是否存在
                InputStreamReader read = new InputStreamReader(
                        new FileInputStream(file), encoding);// 考虑到编码格式
                BufferedReader bufferedReader = new BufferedReader(read);
                String lineTxt = null;

                while ((lineTxt = bufferedReader.readLine()) != null)
                {
                    list.add(lineTxt);
                }
                bufferedReader.close();
                read.close();
            }
            else
            {
                System.out.println("找不到指定的文件");
            }
        }
        catch (Exception e)
        {
            System.out.println("读取文件内容出错");
            e.printStackTrace();
        }

        return list;
    }

2）、方式2

　　通过文件byte数组暂存文件中内容，将其转换为String数据，再按照 “回车换行” 进行分割。

/**
     * 读取filePath的文件，将文件中的数据按照行读取到String数组中
     * @param filePath    文件的路径
     * @return            文件中一行一行的数据
     */
    public static String[] readToString(String filePath)
    {
        File file = new File(filePath);
        Long filelength = file.length(); // 获取文件长度
        byte[] filecontent = new byte[filelength.intValue()];
        try
        {
            FileInputStream in = new FileInputStream(file);
            in.read(filecontent);
            in.close();
        } catch (FileNotFoundException e)
        {
            e.printStackTrace();
        } catch (IOException e)
        {
            e.printStackTrace();
        }
        
        String[] fileContentArr = new String(filecontent).split("\r\n");
        
        return fileContentArr;// 返回文件内容,默认编码
    }

3）、测试

public static void main(String[] args)
    {

        
        List<String> stringList = readTxtFileIntoStringArrList("C:\\soft\\java\\tomcat\\apache-tomcat-7.0.40\\webapps\\appDataGenerate\\log4j\\lepai_recognize_cache.log");
        
        System.out.println("-------使用BufferedReader读取-----------");
        for(String str : stringList)
        {
            System.out.println(str);
        }
        
        System.out.println("\n---------使用byte直接缓存整个文件到内存----------------");
        
        String[] stringArr = readToString("C:\\soft\\java\\tomcat\\apache-tomcat-7.0.40\\webapps\\appDataGenerate\\log4j\\lepai_recognize_cache.log");
        for(int i = 0 ; i < stringArr.length ; i ++)
        {
            System.out.println(stringArr[i]);
        }
        
        
    }

结果：

-------使用BufferedReader读取-----------
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-12-01 14:52:04] [RecognizeCache] [INFO] : 读取文件：4209bad42de0f6e55c0daf0bd24b635a.txt

---------使用byte直接缓存整个文件到内存----------------
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-12-01 14:52:04] [RecognizeCache] [INFO] : 读取文件：4209bad42de0f6e55c0daf0bd24b635a.txt

3、比较

　　方式1是将文件的一部分或全部数据读取出来用BufferReader缓存起来，需要再冲缓存中取数据，这样比要得时候去文件中读取要快一些。

　　方式2是一次把文本的原始内容直接读取到内存中再做处理（暂时不考虑内存大小），这样做效率也会提高。同时，可以处理当你使用第1方式用readLine()方法时，文件又有线程在不断的向文件中写数据【只处理现在已经在文件中的数据】。另外，用readline()之类的方法，可能需要反复访问文件，而且每次readline()都会调用编码转换，降低了速度，所以，在已知编码的情况下，按字节流方式先将文件都读入内存，再一次性编码转换是最快的方式。

　　有错误的希望大牛不吝赐教。想了解一下，

　　1、通过ftp取一个文件到本地，我如何判断对方的文件是否已经写完了。

　　2、当我使用上面的BufferedReader的readLine()方法一行行读取文件的时候，我还向文件中添加数据，会不会出现文件读取结束不了的情况。

源码下载：

https://github.com/zcr1007391008/demo 的TestReadAllFileToMemory。

　　致谢：感谢您的阅读！

posted on 2015-12-01 14:25 WhyWin 阅读(80120) 评论(0) 收藏举报

刷新页面返回顶部

java 读取文件——按照行取出（使用BufferedReader和一次将数据保存到内存两种实现方式）

导航

公告