201521123017 《Java程序设计》第12周学习总结
1. 本周学习总结
2. 书面作业
Q1.字符流与文本文件:使用 PrintWriter(写),BufferedReader(读)
1.1 生成的三个学生对象,使用PrintWriter的println方法写入student.txt,每行一个学生,学生的每个属性之间用|作为分隔。使用Scanner或者BufferedReader将student.txt的数据读出。(截图关键代码,出现学号)
1.2 生成文件大小多少?分析该文件大小
1.3 如果调用PrintWriter的println方法,但在后面不close。文件大小是多少?为什么?
参考:本题具体要求见流与文件实验任务书-题目1-2.1
参考代码:TextFileTest.java
1.1 关键代码截图
1.2 student.dat文件大小51字节
student.dat文件
第一行:int数字3占1个字节,行末尾占2个字节=>共3个字节
第二行:int数字1占1个字节,int数字19占2个字节,String两个汉字占4个字节,3个"|"占3个字节,double数字65.0占4个字节,行末尾占2个字节=>共16个字节
第三行,第四行和第二行一样,每行占11个字节,总共3+3*16=51个字节
1.3 0字节,数据在缓存区上,close()方法自动调用flush,若是去掉,则数据会丢失
Q2.缓冲流
2.1 使用PrintWriter往文件里写入1千万行(随便什么内容都行),然后对比使用BufferedReader与使用Scanner从该文件中读取数据的速度(只读取,不输出),使用哪种方法快?请详细分析原因?提示:可以使用junit4对比运行时间
2.2 将PrintWriter换成BufferedWriter,观察写入文件的速度是否有提升。记录两者的运行时间。试分析原因。
参考:本题具体要求见流与文件实验任务书-题目1-2.2到2.3
参考代码:BufferedReaderTest.java
JUnit4常用注解
JUnit4学习
- 本题运行时出现Failures,只有理论部分
2.1 用BufferedReader更快,缓存区可以减少I/O操作,不用每次的读写请求(即使请求的数据很少)直接由低层OS处理,会造成效率低下 比如读1个字节,进行一次物理上的I/O操作,提高效率,故用BufferedReader更快
2.2 有提升,原因是BufferedReader提供缓存作用
Q3.字符编码
3.1 现有EncodeTest.txt 文件,该文件使用UTF-8编码。使用FileReader与BufferedReader将EncodeTest.txt的文本读入并输出。是否有乱码?为什么会有乱码?如何解决?(截图关键代码,出现学号)
3.2 编写一个方法convertGBK2UTF8(String src, String dst),可以将以GBK编码的源文件src转换成以UTF8编码的目的文件dst。
参考:InputStreamReaderTest.java与教学PPT
3.1 截图
- 会出现乱码,FileReader只能按系统默认的字符集来解码,将默认编码的字符使用UTF-8编码来解析,会出现乱码;解决方法:可以自己设置UTF-8编码来解码
关键代码截图
输出
3.2 使用 Apache Common 组件和commons-io.jar
关键代码截图
Q4.字节流、二进制文件:DataInputStream, DataOutputStream、ObjectInputStream
4.1 参考DataStream目录相关代码,尝试将三个学生对象的数据写入文件,然后从文件读出并显示。(截图关键代码,出现学号)
4.2 生成的文件有多大?分析该文件大小?将该文件大小和题目1生成的文件对比是大了还是小了,为什么?
4.3 使用wxMEdit的16进制模式(或者其他文本编辑器的16进制模式)打开student.data,分析数据在文件中是如何存储的。
4.4 使用ObjectInputStream(读), ObjectOutputStream(写)读写学生。(截图关键代码,出现学号) //参考ObjectStreamTest目录
参考:本题具体要求见流与文件实验任务书-题目1-1
4.1 关键代码截图
运行结果截图
4.2 66字节,一个学生信息中,两个int数据,一个int占4个字节=>int全部占8个字节,一个double数据8个字节,一个String两个汉字,占4个字节,行末尾占2个字节,一个学生信息总共22个字节=>3个学生信息66个字节
4.3 截图
- 数据分析(以行数来分析)
行数 | 分析 |
---|---|
00h行 | 00 00 00 01=>1 |
00 06=>标志符 | |
E5 BC A0 E4 B8 89=>张三 | |
00 00 00 13=>19 | |
01h行 | 40 50 40 00 00 00 00 00=>65.0 |
00 00 00 02=>2 | |
00 06=>标志符 | |
E6 9D 8E E5 9B 9B=>李四 | |
02h行 | 00 00 00 13=>19 |
40 52 c0 00 00 00 00 00=>75.0 | |
03h行 | 00 00 00 03=>3 |
00 06=>标志符 | |
E7 8E 8B E4 BA 94=>王五 | |
00 00 00 14=>20 | |
04h行 | 40 55 40 00 00 00 00 00=>85.0 |
4.4 关键代码截图
Q5.Scanner基本概念组装对象
编写public static List<Student> readStudents(String fileName)
从fileName指定的文本文件中读取所有学生,并将其放入到一个List中。应该使用那些IO相关的类?说说你的选择理由
实验文件:Students.txt
参考:TextFileTest目录下TextFileTest.java
File:java.io.FileReader;java.io.PrintWriter;java.util.Scanner(文件的读取与写入)
List:java.util.ArrayList;import java.util.List(将文件内容存入List,需要ArrayList和List的类)
关键代码截图
Q6.选做:RandomAccessFile
6.1 使用RandomAccessFile实现题目1.1。(截图关键代码,出现学号)
6.2 分析文件大小
6.1 关键代码截图(与Data Streams用法类似)
运行结果
6.2 66字节,一个学生信息中,两个int数据,一个int占4个字节=>int全部占8个字节,一个double数据8个字节,一个String两个汉字,占4个字节,行末尾占2个字节,一个学生信息总共22个字节=>3个学生信息66个字节
Q7.文件操作
编写一个程序,可以根据指定目录和文件名,搜索该目录及子目录下的所有文件,如果没有找到指定文件名,则显示无匹配,否则将所有找到的文件名与文件夹名显示出来。
7.1 编写public static void findFile(String path,String filename)函数,以path指定的路径为根目录,在其目录与子目录下查找所有和filename相同的文件名,一旦找到就马上输出到控制台。(截图关键代码,出现学号)
7.2 加分点:使用队列、使用图形界面、使用Java NIO.2完成(任选1)
7.3 选做:实现删掉指定目录及其子目录下的所有空文件夹。
参考代码:FindDirectories.java
参考:本题具体要求见流与文件实验任务书-题目2
7.4 选做:将指定目录及子目录下的所有.java文件,转化成UTF-8编码格式,并测试。
参考资料:判断文件的编码格式
7.1 关键代码截图
7.2 关键代码截图
8. 正则表达式
8.1 如何判断一个给定的字符串是否是10进制数字格式?尝试编程进行验证。(截图关键代码,出现学号)
8.2 选做:修改HrefMatch.java,尝试匹配网页中的数字字符串、匹配网页中的图片字符串。
参考:本题具体要求见流与文件实验任务书-题目3
8.3 选做(较难):进一步改造上面的程序,获得图片的链接,如IMG src="images/mail1.gif",然后经过处理,生成该图片的实际链接地址http://cec.jmu.edu.com/images/mail1.gif。最后将生成的若干地址,放入一个队列。编写方法,可以依照该队列的所有图片地址,一次将图片下载下来。
正则表达式参考文章
8.1 关键代码截图
3. 码云上代码提交记录及PTA实验总结
3.1. 码云代码提交记录
- 在码云的项目中,依次选择“统计-Commits历史-设置时间段”, 然后搜索并截图
3.2 截图多线程PTA提交列表