2016年8月27日

摘要: 一个关于豆瓣影评的爬虫,涉及:模拟登陆,翻页抓取。直接上代码: 这里有两个问题: 1.首先,登陆的时候,可能会不需要验证码(当然也不会抓到验证码的图片。。),加上try就可以了。 2.数据抓取不全。。。总是剩下1/5左右的数据抓不到,,目前还未解决,请看到的大神指点! 阅读全文

posted @ 2016-08-27 16:41 不秩稚童 阅读(1279) 评论(0) 推荐(2) 编辑

摘要: 专业统计的我,自然免不了学R的,今天仔细看了这篇教程(感谢学姐的推荐@喜欢算法的女青年),就学着用R仿照着做一个,作为R语言学习的起点吧。 影评数据是用python爬的,之后会在python爬虫系列补充上爬虫程序。 这里选取的影片是《完美陌生人》,豆瓣评分挺高的,并未看过。。。。爬好的数据为了方便同 阅读全文

posted @ 2016-08-27 16:23 不秩稚童 阅读(1139) 评论(0) 推荐(0) 编辑