熊咪

2015年5月15日

爬虫学习----案例

摘要: # -*- coding: utf-8 -*-#---------------------------------------# 程序:山东大学爬虫# 版本:0.1# 作者:why# 日期:2013-07-12# 语言:Python 2.7# 操作:输入学号和密码# 功能... 阅读全文

posted @ 2015-05-15 12:38 熊咪 阅读(172) 评论(1) 推荐(0) 编辑
爬虫学习---模拟提交

摘要: import urllib import urllib.requestimport http.cookiejarcookie = http.cookiejar.CookieJar() opener = urllib.request.build_opener(urllib.request.HTTPC... 阅读全文

posted @ 2015-05-15 11:13 熊咪 阅读(247) 评论(0) 推荐(0) 编辑
爬虫学习---糗事百科

摘要: 由于我用的3.3.这个是2.7的,所以测试未通过,但是可以作为参照学习的呀# -*- coding: utf-8 -*- import urllib2 import urllib import re import thread import time #----------- 加... 阅读全文

posted @ 2015-05-15 10:17 熊咪 阅读(149) 评论(0) 推荐(0) 编辑
爬虫学习----pattern

摘要: 1.matchmatch(string[, pos[, endpos]]) | re.match(pattern, string[, flags]):这个方法将从string的pos下标处起尝试匹配pattern;如果pattern结束时仍可匹配,则返回一个Match对象;如果匹配过程中patter... 阅读全文

posted @ 2015-05-15 09:37 熊咪 阅读(340) 评论(0) 推荐(0) 编辑
爬虫学习----正则表达式

摘要: 1.Python通过re模块提供对正则表达式的支持。使用re的一般步骤是:Step1:先将正则表达式的字符串形式编译为Pattern实例。Step2:然后使用Pattern实例处理文本并获得匹配结果(一个Match实例)。Step3:最后使用Match实例获得信息,进行其他的操作。# -*- cod... 阅读全文

posted @ 2015-05-15 09:08 熊咪 阅读(134) 评论(0) 推荐(0) 编辑