随笔分类 -  Python

字符集与编码
摘要:作为非英语用户的我们,日常编程中一旦涉及到字符串的处理,我们就必须考虑到字符串的字符集与编码问题。具体说来,就是一个表示字符串的二进制流应该如何解释,哪些片段表示哪个字符。例如,第一位到第十六位是不是表示一个字符,这个字符究竟是什么字符,是“中”,还是“国”,是”B”还是“β”。此外,现在的字符集和... 阅读全文

posted @ 2014-11-17 15:05 wpjamer 阅读(326) 评论(0) 推荐(0) 编辑

Python网页解析
摘要:续上篇文章,网页抓取到手之后就是解析网页了。在Python中解析网页的库不少,我最开始使用的是BeautifulSoup,貌似这个也是Python中最知名的HTML解析库。它主要的特点就是容错性很好,能很好地处理实际生活中各种乱七八糟的网页,而且它的API也相当灵活而且丰富。但是我在自己的正文提取项... 阅读全文

posted @ 2014-11-15 15:27 wpjamer 阅读(4861) 评论(1) 推荐(1) 编辑

用Python抓网页的注意事项
摘要:用Python编一个抓网页的程序是非常快的,下面就是一个例子:import urllib2 html = urllib2.urlopen('http://blog.raphaelzhang.com').read()但是在实际工作中,这种写法是远远不够的,至少会遇到下面几个问题:网络会出错,任何错误都... 阅读全文

posted @ 2014-11-15 15:14 wpjamer 阅读(1574) 评论(2) 推荐(1) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示