第二次结对作业

作业要求 班级成绩表
作业目标 爬取云班课的成绩并汇总排序输出
作业源代码 https://gitee.com/zhuang-yufeng/pair
队员1 211806363庄宇锋
队员2 211806365曹千成

时间记录

  • 代码169行

  • 分析时间1.5小时

  • 编码时间4小时
    本次作业,主要内容是读取config.properties文件,然后向云班课网站模拟发送GET请求,对返回的报文使用jsoup解析处理,按照学号来统计累加每位同学的经验值,最后输出到score.txt文件。


结对感受

结对编程的快乐,超乎我的想象,我有问题,你查资料,我有bug,你来分析,共同谱写作业的编程篇章,无结对,不快乐。


搭档评价

同为舍友.老搭档,合作愈加熟练,互相学习,共同就进步


需求分析

1、cookie的导入

浏览器打开F12,network可以直接抓取到请求中所用的cookie

将url和cookie写入到config.properties文件

2、分析html结构

对于每一个作业,是使用class = 'interactoin-row'

我们先将这部分取出来,然后得到其中的data-url,请求这个data-url就会得到这个作业每个学生的完成情况

3、代码解析


优化过程

将正则表达式声明为单例全局变量,后面循环的时候不用每次compile,这样可以节省效率,提升性能。


作业小结

对jsoup使用地更加熟练。


参考文献

正则表达式[https://www.runoob.com/regexp/regexp-tutorial.html]

posted @ 2020-10-04 17:26  庄YF  阅读(110)  评论(0编辑  收藏  举报