摘要: XPath 简介: (1) 前面我们爬取一个网页,都是使用正则表达式来提取想要的信息,但是这种方式比较复杂,一旦有一个地方写错,就匹配不出来了,因此我们可以使用 XPath 来进行提取(2) XPath 即 XML Path Language,XML路径语言,起初是用来在 XML 文档中提取信息的, 阅读全文
posted @ 2019-03-13 16:02 孔雀东南飞 阅读(239) 评论(0) 推荐(0) 编辑
摘要: 使用 XPath 使用 Beautiful Soup 使用 PyQuery 阅读全文
posted @ 2019-03-13 11:50 孔雀东南飞 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 利用 requests 抓取豆瓣电影 Top 250: 执行结果: 阅读全文
posted @ 2019-03-13 11:45 孔雀东南飞 阅读(318) 评论(0) 推荐(0) 编辑