摘要: 我们先看一下豆瓣的robot.txt 然后我们查看top250的网页链接和源代码 通过对比不难发现网页间只是start数字发生了变化。 我们可以知道电影内容都存在ol标签下的 div class属性为hd下的a标签下的span标签的字符串 我利用的是BeautifulSoup库和requests库。 阅读全文
posted @ 2019-11-18 15:49 贾铭梓 阅读(172) 评论(0) 推荐(0) 编辑