爬的没意识了--1

 

 https的相关的理解操作

三种联系的方法:1.直接传,2.公钥+私钥,3.对应的证书

基于网络请求的模块

 

 关于requests模块的作用

 

 是属于在python里面原装的

掌握了requests就相当于掌握了爬虫的半壁江山

 

 手动在python里面添加requests

 

 这样就搭建好了环境

 

 超级简单的爬虫

 

 可以将你爬过来的代码转换成正常的样子

 

 之前长这样

 

 

一.项目查找搜索后的界面

 

 UA伪装:将自己的一个地址伪装成一个浏览器,这样就不会被网站给拒绝访问

 

 所以咱们爬的时候要将这个放到我们的浏览器里面去

 

 爬取成功

之前把那个params的s忘记打了一直报错

  二.爬取百度翻译

获取整个页面的部分信息【即翻译出来的那一部分】

 

 全部里面就是全部的请求

具体代码

 

 这样子就可以只获取需要的部分

json.dump()方法就是将python获取到的数据转换成json字符串的形式,当然要使用这个方法首先要这个获取到的是json格式的才行

三.爬取豆瓣电影

 

 参数数据所在的位置

10

  爬取豆瓣的代码

posted @   湖南陈冠希  阅读(28)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
点击右上角即可分享
微信分享提示