摘要: 模拟搜索引擎的关键是知道该搜索引擎的关键词接口 百度的关键词接口是:http://www.baidu.com/s?wd=KEYWORD 360搜索的关键词接口是:http://www.so.com/s?q=KEYWORD 百度搜索Python: import requestskeyword = "P 阅读全文
posted @ 2017-10-12 13:07 飞起的小田 阅读(148) 评论(0) 推荐(0) 编辑
摘要: Python爬虫程序获取源码中的内容 requests库用来获取源码: requests.get(url)返回URL页面的源码 requests.raise_for_status()检测链接是否建立成功,只有返回200是成功,其余都会抛出错误给except requests.encoding = r 阅读全文
posted @ 2017-10-12 12:39 飞起的小田 阅读(181) 评论(0) 推荐(0) 编辑