摘要: Python版本:Python3.5.2 一、安装Pyinstaller 1、安装pywin32 下载安装文件:查找到跟自己适用的python版本及window系统版本匹配的pywin32,下载后安装 使用pip命令安装:pip install pywin32 下载安装文件:查找到跟自己适用的pyt 阅读全文
posted @ 2017-01-21 19:08 晴空行 阅读(226564) 评论(13) 推荐(12) 编辑
摘要: 之前在鱼C论坛的时候,看到很多人都在用Python写爬虫爬煎蛋网的妹子图,当时我也写过,爬了很多的妹子图片。后来煎蛋网把妹子图的网页改进了,对图片的地址进行了加密,所以论坛里面的人经常有人问怎么请求的页面没有链接。这篇文章就来说一下煎蛋网OOXX妹子图的链接获取方式。 首先说明一下,之前煎蛋网之所以 阅读全文
posted @ 2018-03-17 19:36 晴空行 阅读(32403) 评论(1) 推荐(1) 编辑
摘要: 本编博客是关于爬取天猫店铺中指定店铺的所有商品基础信息的爬虫,爬虫运行只需要输入相应店铺的域名名称即可,信息将以csv表格的形式保存,可以单店爬取也可以增加一个循环进行同时爬取。 源码展示 首先还是完整代码展示,后面会分解每个函数的意义。 上面代码是选择了优衣库作为测试店铺,直接输入优衣库店铺的域名 阅读全文
posted @ 2017-11-23 15:25 晴空行 阅读(18005) 评论(2) 推荐(1) 编辑
摘要: 本次爬虫的目标是汽车之家的二手车销售信息,范围是全国,不过很可惜,汽车之家只显示100页信息,每页48条,也就是说最多只能够爬取4800条信息。 由于这次爬虫的主要目的是使用lxml解析器,所以在信息的查找上面完全只会涉及lxml中选择器的用法,虽然lxml可以同时使用CSS选择器和Xpath选择器 阅读全文
posted @ 2017-11-07 22:23 晴空行 阅读(1933) 评论(0) 推荐(0) 编辑
摘要: 这期的爬虫是爬取“简书”的搜索结果页,篇幅将会分为两部分来写,第一部分是爬虫部分,主要涉及搜索文章的提取和数据保存,第二部分涉及基本的数据分析和可视化,本篇文章属于爬虫篇。 爬虫源代码 首先看一下整个爬虫的源代码,每个函数的用处已经写在函数说明中,后面也会进行代码解读。 爬虫思路 基本思路 爬虫的基 阅读全文
posted @ 2017-10-31 11:11 晴空行 阅读(806) 评论(0) 推荐(0) 编辑
摘要: 由于工作需要,需要提取到天猫400个指定商品页面中指定的信息,于是有了这个爬虫。这是一个使用 selenium 爬取天猫商品信息的爬虫,虽然功能单一,但是也算是 selenium 爬虫的基本用法了。 源码展示 源码解析 这个爬虫主要由三个步骤构成: 读取文本中的信息 由于是爬取给定的商品ID的宝贝的 阅读全文
posted @ 2017-10-26 10:03 晴空行 阅读(7680) 评论(0) 推荐(1) 编辑
摘要: Python可以操作Excel的模块不止一种,我习惯使用的写入模块是xlwt(一般都是读写模块分开的) 按照模块使用pip install xlwt 就行了,很常规的方式 直接进代码解析,本文源码 第一句:创建一个工作簿,设置编码格式为“utf-8”,默认格式是ASCII,为了方便写入中文,一般都要 阅读全文
posted @ 2017-07-22 19:18 晴空行 阅读(4544) 评论(0) 推荐(0) 编辑
摘要: 之前经常在写入文件的时候遇到这种报错, 'gbk' codec can't encode character '\u3164' in position 0: illegal multibyte sequence 之前的解决方式是使用try...except语句把报错的不写入,这样虽然能解决程序报错停 阅读全文
posted @ 2017-03-26 01:55 晴空行 阅读(1619) 评论(0) 推荐(0) 编辑
摘要: 系统是WIN10 64位Python是3.5.2今天安装pip install Scrapy 来安装发现报错Microsoft Visual C++ 14.0 is required 检查发现电脑中其实是有Microsoft Visual C++ 14.0的,但是无论怎么都无法安装成功 后来解决办法 阅读全文
posted @ 2017-03-06 22:19 晴空行 阅读(10705) 评论(0) 推荐(1) 编辑
摘要: 最近一段时间开始使用MySQL,使用的是pymysql库。 其中遇到过一些小问题,值得记录一下,以便今后使用的时候注意到。 其中tb_name就是自己定的表格名称,在使用过程中发现,当表格名称的字符串中带有'-'的时候(如test-abc),会报错,似乎是'-'在MySQL代码中有特殊意义所以让程序 阅读全文
posted @ 2017-03-03 23:20 晴空行 阅读(2304) 评论(0) 推荐(0) 编辑
摘要: 中文文档 官方教学网页源码: 中文文档 官方教学网页源码: find方法的参数及意义 find方法的参数及意义 find(name=None, attrs={}, recursive=True, text=None, **kwargs) 1,按照tag(标签)搜索: 2,按照attrs(属性)搜索: 阅读全文
posted @ 2017-02-12 01:23 晴空行 阅读(39186) 评论(0) 推荐(1) 编辑