第九周助教总结—第五组

1.助教博客链接:https://home.cnblogs.com/u/lesliechan/

2.作业情况::

 

  

3.优秀博客:、

廖湛博:https://www.cnblogs.com/busishum/

陈畅:https://www.cnblogs.com/chenchang-rjgc/p/11830244.html

 

4.存在的问题:

  大多数同学都写的关于简单爬虫去爬取51 job网的职位信息, 除了陈畅有一定的对网页源代码的结构分析外,其他同学都是直接调用的bs4.BeautfulSoup方法来定位

自己所需要的数据。 这种思维非常不好,在以后遇到更加复杂的网页,随之而更复杂的是他的网页源代码,如果再只是使用soup的方法来定位的话会非常困难。 解决方法就是

多多做网页分析的步骤,更加深入的了解Soup的方法。同时也可以了解更多的定位元素的方法,如Xpath,正则表达式等。

 

5.组员学习情况:

   大多数同学写的简易爬虫,廖湛博同学自制了一个比对中文文本相似度的小算法函数,值得一看。

6.下周改进计划:

  让大家的内容更加丰富,完善,对问题的理解,剖析更加的透彻

 7.人工评分条形图

 

 

等统计数量达到四周后,会进行折线图的统计,这样更加直观每位组员的成绩波动。

posted @ 2019-11-11 11:15  Leslie_Chan  阅读(196)  评论(0编辑  收藏  举报