2018年8月23日
摘要: Scrapy安装 1,Pip install wheel 2,pip install 复制路径+文件名Twisted-18.7.0-cp36-cp36m-win_amd64.whl 3,Pip install scrapy https://germey.gitbooks.io/python3webs 阅读全文
posted @ 2018-08-23 21:32 卧铺车—站 阅读(80) 评论(0) 推荐(0) 编辑
摘要: import requestsimport json# 1. urlurl = 'http://fanyi.baidu.com/sug'# 2. form/ data/ bodydef translate(kw): form = { 'kw': kw } # # 2.1 字典转换成str # for 阅读全文
posted @ 2018-08-23 21:26 卧铺车—站 阅读(179) 评论(0) 推荐(0) 编辑
摘要: import re #正则的包 line = "huang123" match_res = re.match('h', line)#以 h 开头匹配 match_res = re.match('h.', line) #以h开头后面跟着一个字符 line = 'h\n' match_res = re. 阅读全文
posted @ 2018-08-23 21:25 卧铺车—站 阅读(133) 评论(0) 推荐(0) 编辑
  2018年8月14日
摘要: from lianxi import sessionimport json# urlurl = 'http://www.renren.com/ajaxLogin/login?1=1&uniqueTimestamp=201872158696'# formform = { 'email': '17744 阅读全文
posted @ 2018-08-14 21:55 卧铺车—站 阅读(142) 评论(0) 推荐(0) 编辑
摘要: from urllib import request, parsefrom urllib.error import HTTPError,URLError#保存cookiefrom http import cookiejarclass session(object): def __init__(sel 阅读全文
posted @ 2018-08-14 21:54 卧铺车—站 阅读(96) 评论(0) 推荐(0) 编辑
  2018年8月13日
摘要: 1了解需求2根据需求找网站3请求4获取5存储from urllib import request, parsefrom urllib.error import HTTPError, URLErrordef get(url, headers=None): return urlrequests(url, 阅读全文
posted @ 2018-08-13 22:55 卧铺车—站 阅读(250) 评论(0) 推荐(0) 编辑
摘要: from urllib import request, parsefrom urllib.error import HTTPError, URLErrordef get(url, headers=None): return urlrequests(url, headers=headers) #必须写 阅读全文
posted @ 2018-08-13 22:52 卧铺车—站 阅读(210) 评论(0) 推荐(0) 编辑
摘要: Session是存储在服务器端的,Cookie是存储在客户端的。 Cookie是客户端保存用户信息的一种机制,用来记录用户的一些信息。如何识别特定的客户呢?cookie就可以做到。每次HTTP请求时,客户端都会发送相应的Cookie信息到服务端。它的过期时间可以任意设置,如果你不主动清除它,在很长一 阅读全文
posted @ 2018-08-13 20:02 卧铺车—站 阅读(100) 评论(0) 推荐(0) 编辑