大江东去,浪淘尽,千古风流人物。故垒西边,人道是,三国周郎赤壁。乱石穿空,惊涛拍岸,卷起千堆雪。江山如画,一时多少豪杰。遥想公瑾当年,小乔初嫁了,雄姿英发。羽扇纶巾,谈笑间,樯橹灰飞烟灭。故国神游,多情应笑我,早生华发。人生如梦,一尊还酹江月。

人生苦短 我用Python

扩大
缩小
上一页 1 ··· 6 7 8 9 10 11 12 13 14 15 下一页

2019年4月25日

Scrapy 代理IP

摘要: Scrapy 代理IP 一、Scarpy使用代理IP 1.在setting.py 配置 代理服务器IP 2.在middlermares.py 配置 downloadmiddlermare(下载中间件) Scrapy代理IP、User-Agent的切换都是通过DOWNLOADER_MIDDLEWARE 阅读全文

posted @ 2019-04-25 13:50 GuoZeping 阅读(421) 评论(0) 推荐(0) 编辑

Scrapy 原理

摘要: Scrapy 原理 一、原理 scrapy 是一个为了爬取网站数据,提取结构性数据而编写的应用框架。可以应用在包括数据挖掘,信息处理或存储历史数据等一系列程序中。 二、工作流程 Scrapy Engine(引擎): 负责Spider、ItemPipeline、Downloader、Scheduler 阅读全文

posted @ 2019-04-25 13:25 GuoZeping 阅读(961) 评论(0) 推荐(0) 编辑

爬虫 目录

摘要: 爬虫 目录 一、 二、selenium selenium安装 阅读全文

posted @ 2019-04-25 13:00 GuoZeping 阅读(239) 评论(0) 推荐(0) 编辑

2019年4月24日

正则表达式匹配两个特殊字符中间的内容

摘要: 正则表达式匹配两个特殊字符中间的内容 匹配两个字符串A与B中间的字符串包含A与B: 表达式: A.*?B(“.“表示任意字符,“?”表示匹配0个或多个) 示例: Abaidu.comB 结果: Awww.apizl.comB 匹配两个字符串A与B中间的字符串包含A但是不包含B: 表达式: A.*?( 阅读全文

posted @ 2019-04-24 17:31 GuoZeping 阅读(22521) 评论(0) 推荐(0) 编辑

正则表达式

摘要: 正则表达式 阅读全文

posted @ 2019-04-24 16:57 GuoZeping 阅读(255) 评论(0) 推荐(0) 编辑

网页解析

摘要: 网页解析 https://www.jianshu.com/p/41d06a4ed896 https://blog.csdn.net/mouday/article/details/80455560 https://blog.csdn.net/PbGc396Dwxjb77F2je/article/det 阅读全文

posted @ 2019-04-24 15:59 GuoZeping 阅读(391) 评论(0) 推荐(0) 编辑

Django 工作流程

摘要: 四、Django 数据库迁移 DATABASES = { # Django默认配置使用sqlite3数据库 # 'default': { # 'ENGINE': 'django.db.backends.sqlite3', # 'NAME': os.path.join(BASE_DIR, 'db.sq 阅读全文

posted @ 2019-04-24 09:48 GuoZeping 阅读(274) 评论(0) 推荐(0) 编辑

2019年4月23日

代理IP

摘要: 代理IP 一、获取代理IP 二、使用代理IP 1.requests 2. selenium 2.1 selenium+chrome 2.2 selenium+Firefox 2.3 selenium+phantomjs 2.4 selenium无头 http://www.51testing.com/ 阅读全文

posted @ 2019-04-23 15:03 GuoZeping 阅读(451) 评论(0) 推荐(0) 编辑

selenium 网络请求

摘要: selenium 网络请求 browser.find_element_by_id("id的name")browser.find_element("")browser.find_element_by_tag_name("标签name")browser.find_element_by_class_nam 阅读全文

posted @ 2019-04-23 14:13 GuoZeping 阅读(791) 评论(0) 推荐(0) 编辑

selenium 安装

摘要: selenium 安装 一、chromerdriver 1.浏览器版本 1)检查谷歌浏览器版本 打开chrome输入 "chrome://version/"查看版本,如图所示; 2.下载对应谷歌插件版本 1)插件版本 网址:http://chromedriver.storage.googleapis 阅读全文

posted @ 2019-04-23 11:37 GuoZeping 阅读(160) 评论(0) 推荐(0) 编辑

创建项目/执行

摘要: 创建项目 一、创建项目 1.conda创建环境 1)安装anaconda后,使用conda向指定工作目录下创建虚拟环境; 命令:conda create --prefix=w:\work_preject\Scrapy_project\venv python=3.6 解释:在工作目录下,首先创建con 阅读全文

posted @ 2019-04-23 10:51 GuoZeping 阅读(276) 评论(0) 推荐(0) 编辑

2019年4月22日

Git 创建版本库

摘要: Git 创建版本库 阅读全文

posted @ 2019-04-22 23:30 GuoZeping 阅读(272) 评论(0) 推荐(0) 编辑

Git 命令汇总

摘要: Git 命令汇总 $ rm -rf .git # 删除本地仓库 $ cat .git/config # 查看git配置 阅读全文

posted @ 2019-04-22 23:20 GuoZeping 阅读(264) 评论(0) 推荐(0) 编辑

Git 概念

摘要: Git 概念 一、Git 工作流程 ~ Workspace:工作区 ~ Index/ Stage:暂存区 ~ Repository:仓库区(或本地仓库) ~ Remote:远程仓库 工作区 进行开发改动的地方,是当前的,也是最新的。平常我们开发就是拷贝远程仓库中的一个分支,基于该分支进行开发。在开发 阅读全文

posted @ 2019-04-22 22:25 GuoZeping 阅读(240) 评论(0) 推荐(0) 编辑

外部排序(基数排序)

摘要: 外部排序(基数排序) 阅读全文

posted @ 2019-04-22 16:21 GuoZeping 阅读(486) 评论(0) 推荐(0) 编辑

上一页 1 ··· 6 7 8 9 10 11 12 13 14 15 下一页

导航