每日一学--python--02

https代表的是指保密状况下的页面

开始实现爬虫操作

爬虫就是找到复杂里面的规律

 

 在上面定义函数,在下面那个里面执行方法

python里面一个文件夹里面可以引用另外一个文件夹里面的方法

具体的调用的方法

from 包名 import 方法名

然后就可以直接调用了:模块名.函数名

 

 

 爬取数据的基本思路

 

urllib

如果爬的时候发现418代表对方已经发现你是一个爬虫,芜湖

如果我们想在爬取对面网站的一个信息的时候对面无法发现你是一个爬虫,

 

 找个假的信息来骗,哎嘿

 

 这样咱们就可以骗到豆瓣了

posted @   湖南陈冠希  阅读(21)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【译】Visual Studio 中新的强大生产力特性
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
· 字符编码:从基础到乱码解决
点击右上角即可分享
微信分享提示