第十周助教总结--第五组

1.助教博客链接:https://home.cnblogs.com/u/lesliechan/

 

2.作业情况:

 

 3.优秀博客:

鲁尧尧:https://www.cnblogs.com/lyy135146/p/11867754.html

陈畅:https://www.cnblogs.com/chenchang-rjgc/p/11877301.html

 

4.存在的问题:

  大多数同学在继续爬虫项目,有的写了面向对象方面的self的使用方法,写的很全面,非常值得一看。其他同学在爬取网页的过程中,

大多使用的是书本介绍的find_all,这样的方法对于构造简单的网页没有任何问题,但是对于网页源代码复杂的多的网页就很难定位到自己所

需要的内容。

  当然,也有陈畅同学使用了正则表达式,正则表达式的学习是一个循序渐进的过程,花一两天的时间可能可以做到看得懂他人写的正则表达式,

但是要自己写出能准确表达出自己意思的正则表达式还需要长期的积累。 所以我建议,大家多多使用bs4的BeautifulSoup和Xpath来定位网页元素。

 

5.组员学习情况:

   大多数同学写的简易爬虫,王龙写的是关于self的用法,值得一看。

6.下周改进计划:

  让大家的内容更加丰富,完善,对问题的理解,剖析更加的透彻

 7.人工评分条形图

  

 

 

下周将结合组员前四周的表现,制作折线图,更加直观。

 

posted @ 2019-11-19 19:07  Leslie_Chan  阅读(97)  评论(0编辑  收藏  举报