第二次作业

博客班级 https://edu.cnblogs.com/campus/fzzcxy/2018SE2
作业要求 https://edu.cnblogs.com/campus/fzzcxy/2018SE2/homework/11169
作业目标 <学会用git,爬取网页内容>
作业源代码 https://gitee.com/zhao-beibei/xue.git
学号 <211806425>
1 代码行数

2 需求分析时间大概160分钟,编码时间120分钟
| 需求分析 | 160分钟 |
| ---- | ---- | ---- |
| 编码时间 | 120分钟 |
| 写博客时间| 50分钟 |
3 分解需求的思路:
先考虑代码编程的思路,首先去思考如何在网页上爬取自己所需要的内容。`File small = new File("D:\ZuoYeBao\RuanJiangongChengYuUML\Lesson01\small.html");

File all = new File("D:\ZuoYeBao\RuanJiangongChengYuUML\Lesson01\all.html");`
在网上搜索,加上参考同学大佬的博客然后用的一个包叫jsoup,下载地址是https://jsoup.org/download,刚开始我并不会导入包,后来搜索找到一个博客里有写,博客地址为https://blog.csdn.net/qq_43597899/article/details/98744572。导入之后分析网页内容去找对需要的内容的特殊样式,去过滤截取,然后根据老师要求的权值去写不同的代码。
再去考虑git的链接mail,name。再去创建远程仓库,链接远程仓库上传自己写的代码。在老师云班课资源里有git的用法里有具体过程。

4 记录不会的知识的学习过程、记录修改优化的过程:
在做作业的过程中几乎每一步都会卡住很久,去找办法解决,中间导包,爬取文件,将文件导入到java中都有遇到问题。就去问同学,参考同学的代码来自我完善。

posted @ 2020-09-13 22:51  霰雪  阅读(161)  评论(1编辑  收藏  举报