2017 年 6月 15 日随笔档案 - 勤学才是王道

2017年6月15日

Python之爬取网页时遇到的问题——BeautifulSoup

摘要：记下两个与本文内容不太相关的知识点。 import re 对正则表达式支持的包。 str(soup.p).decode('utf-8') 对标签内容转码。 Beautiful Soup 是用Python写的一个HTML/XML的解析器，它可以很好的处理不规范标记并生成剖析树。它提供简单又常用的导航阅读全文

posted @ 2017-06-15 16:54 勤学才是王道阅读(4679) 评论(0) 推荐(0) 编辑

Python之爬取网页时到的问题——urllib2

摘要：本文通过摘取 http://blog.csdn.net/howeblue/article/details/47426265 博客上的内容整理而成，有兴趣的可以去看看原文。 urllib和urllib2模块都做与请求URL相关的操作，但他们提供不同的功能。本文主要是描述urllib2。 urllib2 阅读全文

posted @ 2017-06-15 11:31 勤学才是王道阅读(822) 评论(0) 推荐(0) 编辑

勤学才是王道

Python之爬取网页时遇到的问题——BeautifulSoup

Python之爬取网页时到的问题——urllib2

导航

公告