09 2022 档案
摘要:验证码的学习 通过爬虫实现登录指定用户并且爬取相应的信息 看的视频里面搞得识别验证码的方法需要利用,自动识别验证码的软件来使用,由于该软件已经倒闭,就没进行实操 但是具体的方法还是可以记录一下 第一步就是获取识别验证码的账户信息,并且进行一个登录操作,然后利用那里面的操作方法来识别 识别的图片是通过
阅读全文
摘要:刚刚写作业的时候发现有许多的api我确实不咋会用 所以我在这里统计一下,防止下次忘记 get的意思是在表达式里面找到需要的元素如 但是题目很明显不是这样的,答案输出的结果为d 还得是这个,别的讲的太啰嗦了。 接下来就是zip(x,y)这个api的方法 这个方法作用就是合并 这个随时间改变颜色还是很不
阅读全文
摘要:乌班图打开终端的方法ctrl+alt+t 接下来就是关于使用xftp来实现连接虚拟机 这儿就拿重点来讲一下 获取虚拟机的ip地址 通过打开虚拟机的终端(别的虚拟机如何打开不清楚,但是这个打开的方法我放在上面) 输入ifconfig,如果非虚拟机的话就输入ipconfig 如果没有显示虚拟机的ip的话
阅读全文
摘要:xpath里面 下面是使用xpath来实现数据的爬取 这一步可以有效改变编码格式变成utf-8 如果上面的方法不行,可以采用下面的方法 爬取城市名称的代码 这里插一个小知识 关于python里面的replace函数的使用
阅读全文
摘要:下面 这个方法返回是,页面第一个出现的div 多个方法的使用 这样就可以直接获取a里面的文本信息 可以直接获取标签里面的数据 上面一串代码的意思就是找到class为.tang的然后找到ul里面的a第一个herf 这里,之前我的BeautifulSoup爆红了,后来一检查才发现是文件名写的是bs4,结
阅读全文
摘要:爬取图片数据 需要导的包 爬取网页上面的图片,直接从网站页面进行爬取 图片下载的相关的代码 相对于正常的信息读取,图片的下载多了许多的操作 上面是正则方法,了解即可 重点还是放在别的上面好 这一步是实现多页面的爬取,找到url的规律,然后把其中代表页码的部分用参数来代替即可,具体操作如上 20
阅读全文
摘要:下面是我自己纯手工敲出来的代码 # -*- codeing = utf-8 -*- # @Time : 2022/9/7 14:43 # @Name : 王星 # @File :kfc.py # @Software: PyCharm import requests import json if __
阅读全文
摘要:https的相关的理解操作 三种联系的方法:1.直接传,2.公钥+私钥,3.对应的证书 基于网络请求的模块 关于requests模块的作用 是属于在python里面原装的 掌握了requests就相当于掌握了爬虫的半壁江山 手动在python里面添加requests 这样就搭建好了环境 超级简单的爬
阅读全文