2015年9月29日

Python 网页爬虫

摘要: 解决问题:获取网页上的内容。特别是加载主框架后,再用AJAX获取数据生成内容的网页。 PyQuery:可以像jQuery的py实现。你给他一个PyQuery一个HTML,他给你一个类似jQuery的操作.只能获取普通网页。AJAX的网页就无能为力。 Ghost.py:一个封装Webkit(浏览器核心)的类库。就是模拟浏览器访问网页。 安装类库 pip install PyQuery p... 阅读全文

posted @ 2015-09-29 08:58 李嘉伦 阅读(578) 评论(0) 推荐(0) 编辑

导航