会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
熊咪
博客园
首页
新随笔
联系
订阅
管理
公告
2015年5月15日
爬虫学习----案例
摘要: # -*- coding: utf-8 -*-#---------------------------------------# 程序:山东大学爬虫# 版本:0.1# 作者:why# 日期:2013-07-12# 语言:Python 2.7# 操作:输入学号和密码# 功能...
阅读全文
posted @ 2015-05-15 12:38 熊咪
阅读(172)
评论(1)
推荐(0)
编辑
爬虫学习---模拟提交
摘要: import urllib import urllib.requestimport http.cookiejarcookie = http.cookiejar.CookieJar() opener = urllib.request.build_opener(urllib.request.HTTPC...
阅读全文
posted @ 2015-05-15 11:13 熊咪
阅读(247)
评论(0)
推荐(0)
编辑
爬虫学习---糗事百科
摘要: 由于我用的3.3.这个是2.7的,所以测试未通过,但是可以作为参照学习的呀# -*- coding: utf-8 -*- import urllib2 import urllib import re import thread import time #----------- 加...
阅读全文
posted @ 2015-05-15 10:17 熊咪
阅读(149)
评论(0)
推荐(0)
编辑
爬虫学习----pattern
摘要: 1.matchmatch(string[, pos[, endpos]]) | re.match(pattern, string[, flags]):这个方法将从string的pos下标处起尝试匹配pattern;如果pattern结束时仍可匹配,则返回一个Match对象;如果匹配过程中patter...
阅读全文
posted @ 2015-05-15 09:37 熊咪
阅读(340)
评论(0)
推荐(0)
编辑
爬虫学习----正则表达式
摘要: 1.Python通过re模块提供对正则表达式的支持。使用re的一般步骤是:Step1:先将正则表达式的字符串形式编译为Pattern实例。Step2:然后使用Pattern实例处理文本并获得匹配结果(一个Match实例)。Step3:最后使用Match实例获得信息,进行其他的操作。# -*- cod...
阅读全文
posted @ 2015-05-15 09:08 熊咪
阅读(134)
评论(0)
推荐(0)
编辑