摘要:
XPath 简介: (1) 前面我们爬取一个网页,都是使用正则表达式来提取想要的信息,但是这种方式比较复杂,一旦有一个地方写错,就匹配不出来了,因此我们可以使用 XPath 来进行提取(2) XPath 即 XML Path Language,XML路径语言,起初是用来在 XML 文档中提取信息的, 阅读全文
摘要:
使用 XPath 使用 Beautiful Soup 使用 PyQuery 阅读全文
摘要:
利用 requests 抓取豆瓣电影 Top 250: 执行结果: 阅读全文