摘要: import requestsfrom lxml import etree# http://www.dajiangtai.com/login/check.dopost_url='http://www.dajiangtai.com/login/check.do'mysession=requests.S 阅读全文
posted @ 2019-10-01 20:48 天天见和 阅读(102) 评论(0) 推荐(0) 编辑
摘要: import requests#通过cookies登录post_url='http://pythonscraping.com/pages/cookies/welcome.php'userdata={"username":"zhangsan","password":"password"}post_re 阅读全文
posted @ 2019-10-01 20:02 天天见和 阅读(832) 评论(0) 推荐(0) 编辑
摘要: import requestsfrom bs4 import BeautifulSoupimport pandas as pdfrom pandas import DataFrame url='https://search.51job.com/list/120300,000000,0000,32,9 阅读全文
posted @ 2019-09-29 23:13 天天见和 阅读(320) 评论(0) 推荐(0) 编辑
摘要: from bs4 import BeautifulSoup text='''<?xml version="1.0" encoding="ISO-8859-1"?><bookstore><book><title lang='eng'>Harry Potter</title><price>29.9</p 阅读全文
posted @ 2019-09-29 21:07 天天见和 阅读(610) 评论(0) 推荐(0) 编辑
摘要: import requestsimport re #获得本要IP url='http://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=ip' res=requests.get(url)res.encoding='utf-8' 阅读全文
posted @ 2019-09-28 06:51 天天见和 阅读(871) 评论(0) 推荐(0) 编辑
摘要: import requestsfrom lxml import etreeimport randomfrom fake_useragent import UserAgent ua=UserAgent()uas=[]for i in range(5): uas.append(ua.random) #生 阅读全文
posted @ 2019-09-26 22:51 天天见和 阅读(551) 评论(0) 推荐(0) 编辑
摘要: import requestsfrom lxml import etree url='https://ie.icoa.cn/'head={'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like 阅读全文
posted @ 2019-09-26 22:15 天天见和 阅读(920) 评论(0) 推荐(0) 编辑
摘要: import requestsimport re url='http://tieba.baidu.com/photo/g/bw/picture/list?kw=%E6%9D%A8%E6%B4%8B&alt=jview&rn=200&tid=4748284434&pn=1&ps=1&pe=40&inf 阅读全文
posted @ 2019-09-25 23:03 天天见和 阅读(138) 评论(0) 推荐(0) 编辑
摘要: \d[{n},{n,},{n,m}] 匹配十进制数字 n次,最少n次,最少n次最多m次 \D 匹配非十进制数字 [...] 表示一组字符,匹配里面任一字符 [^...]不在里面的任一字符 +匹配前面的子表达式; \s 空白字符; \S 除空白字符 (?:pattern)匹配但不取结果; ^ 表示开始 阅读全文
posted @ 2019-09-24 22:31 天天见和 阅读(548) 评论(0) 推荐(0) 编辑
摘要: import requestsimport re url='https://list.jd.com/list.html?cat=9987,653,655'res=requests.get(url)image_pat='<img width="220" height="220" data-img="1 阅读全文
posted @ 2019-09-24 22:14 天天见和 阅读(938) 评论(0) 推荐(0) 编辑