摘要: request能取到网页上面的数据,但是这些是属于结构化的数据,我们不能直接使用,需要将这些数据进行转化,从而方便使用 BeautifulSoup能将标签移除掉,从而获得网页上的数据以及内容 1、将特定标签的内容取出来 单个标签 阅读全文
posted @ 2016-11-27 16:11 飞教主 阅读(733) 评论(0) 推荐(0) 编辑
摘要: import requestsres=requests.get('http://news.sina.com.cn/china/')res.encoding='utf-8'print(res.text) 阅读全文
posted @ 2016-11-27 15:19 飞教主 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 使用Python进行爬虫要有相应的安装环境 1、安装Python 这个随便在百度上面进行搜索就可以了 2、安装完之后打开cmd输入pip install requests pip install BeautifulSoup4 pip install jupyter如果第一次安装不成功的话,多安装几次 阅读全文
posted @ 2016-11-27 14:59 飞教主 阅读(1138) 评论(0) 推荐(0) 编辑