摘要:
在“利用Python和BeautifulSoup抓取网页内容”中谈到的方法在处理网页中含有JavaScript执行结果时会遇到问题,比如我想抓取去哪儿网上的机票搜索结果时,抓取到的结果是“请稍等,您查询的结果正在实时搜索中”。这并不是我想要的结果。我在stackoverflow上提出了这个问题,得到的回复是利用Python中urllib模块无法解决这个问题,因为这个网页中调用了JavaScript函数去执行搜索并载入搜索结果。该回复给出的解决方法是PyQt或Selenium。因为我还是想利用Python解决该问题,所以尝试了一下PyQt。 PyQt是一套为Nokia Qt应用框架开发... 阅读全文
posted @ 2012-08-11 21:06 SamWei 阅读(2152) 评论(2) 推荐(1) 编辑