1. 本周学习总结

2. 书面作业

将Student对象(属性:int id, String name,int age,double grade)写入文件student.data、从文件读出显示。

字符流与文本文件:使用 PrintWriter(写),BufferedReader(读)

1.1 生成的三个学生对象,使用PrintWriter的println方法写入student.txt,每行一个学生,学生的每个属性之间用|作为分隔。使用Scanner或者BufferedReader将student.txt的数据读出。(截图关键代码,出现学号)

1.2 生成文件大小多少?分析该文件大小

分析:生成的文件大小是51字节
     第一行:3是1个字节,回车符是2个字节,所以2+1=3;
     第二行:id是1个字节,分隔符|是1个字节,name两个汉字是4个字节,age是2个字节,grade是4个字节,回车符是2个字节,所以1+4+2+4+2+1*3=16;
     第三行与第四行和第二行情况相同,所以文件总共大小是3+16*3=51字节。

1.3 如果调用PrintWriter的println方法,但在后面不close。文件大小是多少?为什么?

答:后面不加close的文件大小是0字节,因为缓冲区数据没有真正实现写出,想要实现真正的写出我们需要用flush方法,而该方法一般是在缓冲流关闭时先调用的,所以如果没有关闭缓冲流即没有close,那么数据会在缓冲区丢失。

缓冲流

2.1 使用PrintWriter往文件里写入1千万行(随便什么内容都行),然后对比使用BufferedReader与使用Scanner从该文件中读取数据的速度(只读取,不输出),使用哪种方法快?请详细分析原因?提示:可以使用junit4对比运行时间

答:使用BufferedReader更快,而且BufferedReader速度比Scanner速度快了10倍还要多一些,这是因为BufferedReader是先把数据读到缓存区然后在写到硬盘里,而Scanner是直接往硬盘写数据,因此Scanner的速度不如BufferedReader速度快。
junit4运行时间对比如下:

2.2 将PrintWriter换成BufferedWriter,观察写入文件的速度是否有提升。记录两者的运行时间。试分析原因

答:速度有提升,因为在构造BufferedWriter的时候有一个方法是可以规定缓冲区大小的,因此BufferedWriter是带有缓冲区的,而PrintWriter没有,所以BufferedWriter写入文件的速度比PrintWriter快的多。
两者运行时间对比如下:

字符编码

3.1 现有EncodeTest.txt 文件,该文件使用UTF-8编码。使用FileReader与BufferedReader将EncodeTest.txt的文本读入并输出。是否有乱码?为什么会有乱码?如何解决?(截图关键代码,出现学号)

是乱码,因为默认编码指的是本地编码表,也就是GBK编码,而改该文件使用UTF-8编码,所以会出现乱码。解决方法如下:

3.2 编写一个方法convertGBK2UTF8(String src, String dst),可以将以GBK编码的源文件src转换成以UTF8编码的目的文件dst

字节流、二进制文件:DataInputStream, DataOutputStream、ObjectInputStream

4.1 参考DataStream目录相关代码,尝试将三个学生对象的数据写入文件,然后从文件读出并显示。(截图关键代码,出现学号)

4.2 生成的文件有多大?分析该文件大小?将该文件大小和题目1生成的文件对比是大了还是小了,为什么?

答:生成的文件有72字节,int型是4个字节,所以id有4个字节,名字有6个字节,年龄有4个字节,grade是double型有8个字节,标识符有2个字节,所以一个同学是24个字节,三个就是72字节。和题目一相比是大了

4.3 使用wxMEdit的16进制模式(或者其他文本编辑器的16进制模式)打开student.data,分析数据在文件中是如何存储的。

4.4 使用ObjectInputStream(读), ObjectOutputStream(写)读写学生。(截图关键代码,出现学号) //参考ObjectStreamTest目录

基本概念

5.编写public static List readStudents(String fileName);从fileName指定的文本文件中读取所有学生,并将其放入到一个List中。应该使用那些IO相关的类?说说你的选择理由。

答:选择的IO相关类是BufferedReader,利用其缓冲区提高效率    

文件操作

编写一个程序,可以根据指定目录和文件名,搜索该目录及子目录下的所有文件,如果没有找到指定文件名,则显示无匹配,否则将所有找到的文件名与文件夹名显示出来。

7.1 编写public static void findFile(String path,String filename)函数,以path指定的路径为根目录,在其目录与子目录下查找所有和filename相同的文件名,一旦找到就马上输出到控制台。(截图关键代码,出现学号)

7.2 加分点:使用队列、使用图形界面、使用Java NIO.2完成(任选1)

7.3 选做:实现删掉指定目录及其子目录下的所有空文件夹。

正则表达式

8.1 如何判断一个给定的字符串是否是10进制数字格式?尝试编程进行验证。(截图关键代码,出现学号)

结果是:

8.2 选做:修改HrefMatch.java,尝试匹配网页中的数字字符串、匹配网页中的图片字符串。

8.3 选做(较难):进一步改造上面的程序,获得图片的链接,如IMG src="images/mail1.gif",然后经过处理,生成该图片的实际链接地址http://cec.jmu.edu.com/images/mail1.gif。最后将生成的若干地址,放入一个队列。编写方法,可以依照该队列的所有图片地址,一次将图片下载下来。

3. 码云及PTA

3.1. 码云代码提交记录

3.2 PTA以前未完成的题目

4.选做:课外阅读

4.1 尝试翻译Lesson: Basic I/O中的Summary

4.2 尝试完成Questions and Exercise

4.3 字符集与编码

4.4 Java正则表达式的语法与示例