摘要: 获取网页中文本信息试验中用到www.17k.com的资源,参考了http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html的博文。 1 from urllib import urlopen 2 import re 3 4 # 将正则表达式编译成Pattern对象 5 # re.S(DOTALL): 点任意匹配模式,改变'.'的行为。不加匹配不到内容? 6 p = re.compile(r'<div class="p" id="chapterContent">( 阅读全文
posted @ 2012-11-22 22:42 SubmarineX 阅读(3377) 评论(0) 推荐(0) 编辑