eliwang

2021年5月15日

摘要：在Linux系统下运行python终端，发现方向键失灵，总是出现「^[[C^[[D」等，可通过安装gnureadline模块解决如下： sudo pip3 install gnureadline 阅读全文

posted @ 2021-05-15 02:10 eliwang 阅读(703) 评论(0) 推荐(0) 编辑

2021年5月14日

摘要：一、认识Excel文件 Excel文件也被称做工作簿（workbook）。每个工作簿可以包含多个工作表（sheet）。用户当前查看的表或关闭Excel前最后查看的表，被称为活动表。每张表都是由行和列组成。列是以A开始的字母表示，行是以1开始的数字表示。由特定行和列所指定的方格被称为单元格（ce 阅读全文

posted @ 2021-05-14 03:36 eliwang 阅读(724) 评论(0) 推荐(0) 编辑

2021年5月13日

CSS选择器

摘要： css选择器常用的选择器有如下几种： 1、标签选择器标签选择器，此种选择器影响范围大，建议尽量应用在层级选择器中。举例： *{margin:0;padding:0} div{color:red} <div>....</div>  <div class="box" 阅读全文

posted @ 2021-05-13 23:06 eliwang 阅读(128) 评论(0) 推荐(0) 编辑

2021年5月12日

爬虫--如何使用requests模拟登陆知乎

摘要：知乎登陆验证码问题比较棘手，所以我们可以考虑通过cookie来模拟登陆。思路： 1、通过浏览器手动登陆知乎，利用抓包工具（如Fiddler等）来获取登陆后的cookie信息，并将其处理成dict类型。 2、然后使用requests的会话（Session）对象来携带cookie信息发送请求，因为同一阅读全文

posted @ 2021-05-12 21:15 eliwang 阅读(240) 评论(0) 推荐(0) 编辑

scrapy-Redis分布式爬虫案例----阳光问政平台爬虫

摘要：我们将之前的阳光热线问政平台爬虫案例，改写成Scrapy-redis分布式爬虫 1.items.py import scrapy class MyprojectItem(scrapy.Item): number = scrapy.Field() #帖子编号 title = scrapy.Field( 阅读全文

posted @ 2021-05-12 01:07 eliwang 阅读(281) 评论(0) 推荐(0) 编辑

scrapy-redis分布式爬虫

摘要： Scrapy 是一个通用的爬虫框架，但是不支持分布式，Scrapy-redis是为了更方便地实现Scrapy分布式爬取，而提供了一些以redis为基础的组件(仅有组件)。一、Scrapy-Redis分布式策略： Master端(核心服务器)：搭建一个Redis数据库，并开启redis-server 阅读全文

posted @ 2021-05-12 00:26 eliwang 阅读(393) 评论(0) 推荐(0) 编辑

2021年5月10日

多线程爬虫案例--爬取世纪佳缘网

摘要：一、要求爬取世纪佳缘网当中（20-28周岁、来自北京、有图片的女孩）信息，包括昵称、婚姻状况、身高、年龄、学历、工作地点、自我介绍、择偶要求、个人主页链接以及个人图片链接。二、分析网站数据采用的js分页，通过Fiddler抓包工具分析： url：https://search.jiayuan.c 阅读全文

posted @ 2021-05-10 21:17 eliwang 阅读(336) 评论(0) 推荐(0) 编辑

python图片处理库PIL的简单使用

摘要：一、安装 sudo pip3 install pillow 二、简单使用 # coding:utf-8 from PIL import Image,ImageDraw,ImageFont from io import BytesIO #打开图片 img = Image.open('图片名')#从本地阅读全文

posted @ 2021-05-10 16:02 eliwang 阅读(538) 评论(0) 推荐(0) 编辑

python如何存储数据为Excel表格文件格式（.xlsx）?

摘要：我们可以借助python的第三方库openpyxl来实现安装openpyxl： pip3 install openpyxl 演示：创建一个学生信息表（stuInfo.xlsx） from openpyxl import Workbook wb = Workbook() #创建工作簿 ws = wb 阅读全文

posted @ 2021-05-10 00:22 eliwang 阅读(5234) 评论(0) 推荐(0) 编辑

2021年4月29日

python定时任务的实现（在特定时间段内，间隔一定时间执行一次任务）

摘要：有时候，我们想让程序在某个特定时间段内去多次执行某个任务，比如每天凌晨3点-4点，隔10秒执行一次任务，接下来，我们就用python自带的datetime模块和threading模块去实现它，代码如下： import datetime import threading #任务描述：每天凌晨3-4点，阅读全文

posted @ 2021-04-29 14:31 eliwang 阅读(8805) 评论(0) 推荐(0) 编辑

学无止境的小渣渣

公告