第九周助教总结—第五组
1.助教博客链接:https://home.cnblogs.com/u/lesliechan/
2.作业情况::
3.优秀博客:、
廖湛博:https://www.cnblogs.com/busishum/
陈畅:https://www.cnblogs.com/chenchang-rjgc/p/11830244.html
4.存在的问题:
大多数同学都写的关于简单爬虫去爬取51 job网的职位信息, 除了陈畅有一定的对网页源代码的结构分析外,其他同学都是直接调用的bs4.BeautfulSoup方法来定位
自己所需要的数据。 这种思维非常不好,在以后遇到更加复杂的网页,随之而更复杂的是他的网页源代码,如果再只是使用soup的方法来定位的话会非常困难。 解决方法就是
多多做网页分析的步骤,更加深入的了解Soup的方法。同时也可以了解更多的定位元素的方法,如Xpath,正则表达式等。
5.组员学习情况:
大多数同学写的简易爬虫,廖湛博同学自制了一个比对中文文本相似度的小算法函数,值得一看。
6.下周改进计划:
让大家的内容更加丰富,完善,对问题的理解,剖析更加的透彻
7.人工评分条形图
等统计数量达到四周后,会进行折线图的统计,这样更加直观每位组员的成绩波动。