html不规则需要格式化小技巧

当python爬虫遇到html不规则怎么办?
比如爬取微博个人信息,在这给大家讲一个小技巧
https://weibo.com/a1937000700?is_hot=1


需要解析html提取个人信息

第一步、在pycharm 新建HTML file

第二步、复制html中的元素到新建HTML file并打开

第三步、按F12 HTML标签结构一目了然



复制如果您觉得阅读本文对您有帮助,请点一下“推荐”按钮,您的“推荐”将是我最大的写作动力!欢迎各位转载!
posted @   莫贞俊晗  阅读(57)  评论(0编辑  收藏  举报
编辑推荐:
· Java 中堆内存和栈内存上的数据分布和特点
· 开发中对象命名的一点思考
· .NET Core内存结构体系(Windows环境)底层原理浅谈
· C# 深度学习:对抗生成网络(GAN)训练头像生成模型
· .NET 适配 HarmonyOS 进展
阅读排行:
· 如何给本地部署的DeepSeek投喂数据,让他更懂你
· 超详细,DeepSeek 接入PyCharm实现AI编程!(支持本地部署DeepSeek及官方Dee
· 用 DeepSeek 给对象做个网站,她一定感动坏了
· .NET 8.0 + Linux 香橙派,实现高效的 IoT 数据采集与控制解决方案
· DeepSeek处理自有业务的案例:让AI给你写一份小众编辑器(EverEdit)的语法着色文件
历史上的今天:
2020-09-24 使用 Java Math.random() 生成指定位数随机数 对应 python 生成指定位数随机数
点击右上角即可分享
微信分享提示