2022 年 9月随笔档案 - 湖南陈冠希

再趴一趴（爬）

摘要：验证码的学习通过爬虫实现登录指定用户并且爬取相应的信息看的视频里面搞得识别验证码的方法需要利用，自动识别验证码的软件来使用，由于该软件已经倒闭，就没进行实操但是具体的方法还是可以记录一下第一步就是获取识别验证码的账户信息，并且进行一个登录操作，然后利用那里面的操作方法来识别识别的图片是通过阅读全文

posted @ 2022-09-28 22:10 湖南陈冠希阅读(21) 评论(0) 推荐(0) 编辑

爬虫api的学习

摘要：刚刚写作业的时候发现有许多的api我确实不咋会用所以我在这里统计一下，防止下次忘记 get的意思是在表达式里面找到需要的元素如但是题目很明显不是这样的，答案输出的结果为d 还得是这个，别的讲的太啰嗦了。接下来就是zip(x,y)这个api的方法这个方法作用就是合并这个随时间改变颜色还是很不阅读全文

posted @ 2022-09-22 22:20 湖南陈冠希阅读(24) 评论(0) 推荐(0) 编辑

今天是虚拟机

摘要：乌班图打开终端的方法ctrl+alt+t 接下来就是关于使用xftp来实现连接虚拟机这儿就拿重点来讲一下获取虚拟机的ip地址通过打开虚拟机的终端（别的虚拟机如何打开不清楚，但是这个打开的方法我放在上面）输入ifconfig，如果非虚拟机的话就输入ipconfig 如果没有显示虚拟机的ip的话阅读全文

posted @ 2022-09-21 22:29 湖南陈冠希阅读(36) 评论(0) 推荐(0) 编辑

爬起来--5

摘要：xpath里面下面是使用xpath来实现数据的爬取这一步可以有效改变编码格式变成utf-8 如果上面的方法不行，可以采用下面的方法爬取城市名称的代码这里插一个小知识关于python里面的replace函数的使用阅读全文

posted @ 2022-09-15 21:43 湖南陈冠希阅读(17) 评论(0) 推荐(0) 编辑

爬过来爬过去--4

摘要：下面这个方法返回是，页面第一个出现的div 多个方法的使用这样就可以直接获取a里面的文本信息可以直接获取标签里面的数据上面一串代码的意思就是找到class为.tang的然后找到ul里面的a第一个herf 这里，之前我的BeautifulSoup爆红了，后来一检查才发现是文件名写的是bs4，结阅读全文

posted @ 2022-09-13 22:12 湖南陈冠希阅读(22) 评论(0) 推荐(0) 编辑

一起爬开--3

摘要：爬取图片数据需要导的包爬取网页上面的图片，直接从网站页面进行爬取图片下载的相关的代码相对于正常的信息读取，图片的下载多了许多的操作上面是正则方法，了解即可重点还是放在别的上面好这一步是实现多页面的爬取，找到url的规律，然后把其中代表页码的部分用参数来代替即可，具体操作如上 20 阅读全文

posted @ 2022-09-08 22:09 湖南陈冠希阅读(21) 评论(0) 推荐(0) 编辑

爬了个寂寞-2

摘要：下面是我自己纯手工敲出来的代码 # -*- codeing = utf-8 -*- # @Time : 2022/9/7 14:43 # @Name : 王星 # @File :kfc.py # @Software: PyCharm import requests import json if __ 阅读全文

posted @ 2022-09-07 22:15 湖南陈冠希阅读(21) 评论(0) 推荐(0) 编辑

爬的没意识了--1

摘要：https的相关的理解操作三种联系的方法：1.直接传，2.公钥+私钥，3.对应的证书基于网络请求的模块关于requests模块的作用是属于在python里面原装的掌握了requests就相当于掌握了爬虫的半壁江山手动在python里面添加requests 这样就搭建好了环境超级简单的爬阅读全文

posted @ 2022-09-06 22:00 湖南陈冠希阅读(28) 评论(0) 推荐(0) 编辑

湖南陈冠希

09 2022 档案

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

最新评论