摘要: 1 from lxml import etree 2 from selenium import webdriver 3 import pymysql 4 5 def Geturl(fullurl):#获取每个招聘网页的链接 6 browser.get(fullurl) 7 shouye_html_text = browser.page_source 8 ... 阅读全文
posted @ 2018-08-20 22:21 razryang 阅读(677) 评论(0) 推荐(0) 编辑
摘要: 新学习了selenium,啪一下腾讯招聘 1 from lxml import etree 2 from selenium import webdriver 3 import pymysql 4 def Geturl(fullurl):#获取每个招聘网页的链接 5 browser.get(fullurl) 6 shouye_html_text = browse... 阅读全文
posted @ 2018-08-19 16:19 razryang 阅读(660) 评论(0) 推荐(0) 编辑
摘要: 祝大家七夕愉快 妹子图 阅读全文
posted @ 2018-08-18 20:23 razryang 阅读(614) 评论(0) 推荐(1) 编辑
摘要: 爬取高匿代理 阅读全文
posted @ 2018-08-17 16:52 razryang 阅读(476) 评论(0) 推荐(0) 编辑
摘要: # 头条街拍图片爬取 1 import re 2 import requests 3 from urllib import request 4 import json 5 import os 6 i = 0 7 headers = { 8 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537... 阅读全文
posted @ 2018-08-16 23:26 razryang 阅读(716) 评论(0) 推荐(0) 编辑
摘要: requests: 练手 雪qiu网 阅读全文
posted @ 2018-08-15 23:34 razryang 阅读(337) 评论(0) 推荐(0) 编辑
摘要: #对第一章的百度翻译封装的函数进行更新 1 from urllib import request, parse 2 from urllib.error import HTTPError, URLError 3 # 保存cookie 4 from http import cookiejar 5 6 class session(object): 7 def __init__(... 阅读全文
posted @ 2018-08-14 22:42 razryang 阅读(257) 评论(2) 推荐(0) 编辑
摘要: cookiejar模块: 管理储存cookie,将传出的http请求添加cookie cookie存储在内存中,CookieJar示例回收后cookie将自动消失 实例:用cookjar访问人人网主页 python Proxy代理 有道词典翻译接口 阅读全文
posted @ 2018-08-14 21:40 razryang 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 爬: 爬一个网站需要几步? 确定用户的需求 根据需求,寻找网址 读取网页 urllib request requests 定位并提取数据 存储数据 mysql redis 文件存储 爬取百度首页:(确定用户需求) cookie和session之间的爱情故事: 啥是cookie: 当你在浏览网站的时候 阅读全文
posted @ 2018-08-13 21:44 razryang 阅读(333) 评论(0) 推荐(0) 编辑
摘要: 一.镜像下载: 根据需求下载自己需要的版本 从官网下载kali 2018.2 的安装包:https://www.kali.org/downloads/ 二.烧录: 这里推荐用 win32 disk imager 尝试了好几款烧录工具,这个是相对最稳定的 打开win32后 第一步 选中镜像位置 ,第二 阅读全文
posted @ 2018-08-09 10:47 razryang 阅读(996) 评论(0) 推荐(0) 编辑