卧铺车—站 - 博客园

2018年8月23日

摘要： Scrapy安装 1，Pip install wheel 2，pip install 复制路径+文件名Twisted-18.7.0-cp36-cp36m-win_amd64.whl 3，Pip install scrapy https://germey.gitbooks.io/python3webs 阅读全文

posted @ 2018-08-23 21:32 卧铺车—站阅读(85) 评论(0) 推荐(0)

关于有道翻译

摘要： import requestsimport json# 1. urlurl = 'http://fanyi.baidu.com/sug'# 2. form/ data/ bodydef translate(kw): form = { 'kw': kw } # # 2.1 字典转换成str # for 阅读全文

posted @ 2018-08-23 21:26 卧铺车—站阅读(191) 评论(0) 推荐(0)

关于正则匹配

摘要： import re #正则的包 line = "huang123" match_res = re.match('h', line)#以 h 开头匹配 match_res = re.match('h.', line) #以h开头后面跟着一个字符 line = 'h\n' match_res = re. 阅读全文

posted @ 2018-08-23 21:25 卧铺车—站阅读(142) 评论(0) 推荐(0)

2018年8月14日

关于人人网的form查找和打印

摘要： from lianxi import sessionimport json# urlurl = 'http://www.renren.com/ajaxLogin/login?1=1&uniqueTimestamp=201872158696'# formform = { 'email': '17744 阅读全文

posted @ 2018-08-14 21:55 卧铺车—站阅读(154) 评论(0) 推荐(0)

保存cookie状态封装

摘要： from urllib import request, parsefrom urllib.error import HTTPError,URLError#保存cookiefrom http import cookiejarclass session(object): def __init__(sel 阅读全文

posted @ 2018-08-14 21:54 卧铺车—站阅读(102) 评论(0) 推荐(0)

2018年8月13日

gat和post封装代码和爬虫的5个步奏

摘要： 1了解需求2根据需求找网站3请求4获取5存储from urllib import request, parsefrom urllib.error import HTTPError, URLErrordef get(url, headers=None): return urlrequests(url, 阅读全文

posted @ 2018-08-13 22:55 卧铺车—站阅读(259) 评论(0) 推荐(0)

gat和post封装代码

摘要： from urllib import request, parsefrom urllib.error import HTTPError, URLErrordef get(url, headers=None): return urlrequests(url, headers=headers) #必须写阅读全文

posted @ 2018-08-13 22:52 卧铺车—站阅读(221) 评论(0) 推荐(0)

session和cookie的区别是什么，他们都是什么.

摘要： Session是存储在服务器端的，Cookie是存储在客户端的。 Cookie是客户端保存用户信息的一种机制，用来记录用户的一些信息。如何识别特定的客户呢？cookie就可以做到。每次HTTP请求时，客户端都会发送相应的Cookie信息到服务端。它的过期时间可以任意设置，如果你不主动清除它，在很长一阅读全文

posted @ 2018-08-13 20:02 卧铺车—站阅读(117) 评论(0) 推荐(0)

公告