2017年6月15日

Python之爬取网页时遇到的问题——BeautifulSoup

摘要: 记下两个与本文内容不太相关的知识点。 import re 对正则表达式支持的包。 str(soup.p).decode('utf-8') 对标签内容转码。 Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树。 它提供简单又常用的导航 阅读全文

posted @ 2017-06-15 16:54 勤学才是王道 阅读(4679) 评论(0) 推荐(0) 编辑

Python之爬取网页时到的问题——urllib2

摘要: 本文通过摘取 http://blog.csdn.net/howeblue/article/details/47426265 博客上的内容整理而成,有兴趣的可以去看看原文。 urllib和urllib2模块都做与请求URL相关的操作,但他们提供不同的功能。本文主要是描述urllib2。 urllib2 阅读全文

posted @ 2017-06-15 11:31 勤学才是王道 阅读(822) 评论(0) 推荐(0) 编辑

导航