随笔分类 -  高德news2021

java爬虫系列(二)——爬取动态网页
摘要:java爬虫系列(二)——爬取动态网页 Mr_OOO 2018-01-01 15:59:40 11440 收藏 11 分类专栏: 爬虫 入门专栏 最简单的java爬虫 文章标签: java 爬虫 seimiagent seimicrawler动态网页 版权 准备工作 项目地址 网页解析工具地址 启动 阅读全文

posted @ 2020-10-21 23:45 shuzihua 阅读(1042) 评论(0) 推荐(0) 编辑

Python爬虫爬取动态网页
摘要:Python爬虫爬取动态网页 我们经常会遇到直接把网页地址栏中的url传到get请求中无法直接获取到网页的数据的情况,而且右键查看网页源代码也无法看到网页的数据,同时点击第二页、第三页等进行翻页的时候,网页地址栏中的url也没变,这些就是动态网页,例如:http://www.neeq.com.cn/ 阅读全文

posted @ 2020-10-21 23:42 shuzihua 阅读(3649) 评论(0) 推荐(0) 编辑

Python3网络爬虫:requests爬取动态网页内容
摘要:Python3网络爬虫:requests爬取动态网页内容 Python版本:python3.+ 运行环境:OSX IDE:pycharm 一、工具准备 抓包工具:在OSX下,我使用的是Charles4.0 下载链接以及安装教程:http://www.sdifen.com/charles4.html 阅读全文

posted @ 2020-10-21 23:39 shuzihua 阅读(1075) 评论(0) 推荐(0) 编辑

python语法动态页面爬取
摘要:动态页面爬取 好久没有写爬虫了,今天敲了一份爬虫出来——爬取百度百科的历史记录,结果在时隔四个月之后再次遇到的对手居然是一个动态页面(一开始把百度想的太简单了),不过在一番努力之后还是达到了我的目标,然后就当复习似的写了篇博客。 一、概念 动态页面其实是相对于静态页面而言的。在面对静态页面的时候直接 阅读全文

posted @ 2020-10-21 23:37 shuzihua 阅读(308) 评论(0) 推荐(0) 编辑

Java将对象保存到文件中/从文件中读取对象
摘要:Java类实现serializable qq_38632641 2018-05-15 14:20:35 824 收藏 1 Java序列化与反序列化是什么?为什么需要序列化与反序列化?如何实现Java序列化与反序列化?本文围绕这些问题进行了探讨。 1.Java序列化与反序列化 Java序列化是指把Ja 阅读全文

posted @ 2020-09-17 00:02 shuzihua 阅读(2649) 评论(0) 推荐(0) 编辑

Python对象的永久存储
摘要:Python对象的永久存储 Python对象的永久存储 1.使用Python的pickle模块 import pickle class A: def __init__(self,name,a): self.name=name self.a=a def rewrite(self,args): self 阅读全文

posted @ 2020-09-16 23:59 shuzihua 阅读(1067) 评论(0) 推荐(0) 编辑

Python 程序能用很多方式处理日期和时间
摘要:https://docs.python.org/zh-cn/3/library/time.html https://www.runoob.com/python3/python3-date-time.html Python 程序能用很多方式处理日期和时间,转换日期格式是一个常见的功能。 Python 阅读全文

posted @ 2020-09-01 20:11 shuzihua 阅读(228) 评论(0) 推荐(0) 编辑

BeautifulSoup最主要的功能是从网页抓取数据
摘要:https://www.runoob.com/python3/python3-date-time.html BeautifulSoup最主要的功能是从网页抓取数据,Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。BeautifulSoup支持Pyth 阅读全文

posted @ 2020-09-01 10:16 shuzihua 阅读(192) 评论(0) 推荐(0) 编辑

多个站点同时抓取!怎么做到的?
摘要:多个站点同时抓取!怎么做到的? https://cuiqingcai.com/ 1. 看完之后你会得到什么 返回 yield; eval 的使用; 多个代理网站同时抓取; 使用异步测试代理是否可用; Python 的元类编程简单介绍; 正则表达式、PyQuery 提取数据; 模块化编程; 废话不多说 阅读全文

posted @ 2020-09-01 10:14 shuzihua 阅读(242) 评论(0) 推荐(0) 编辑

Python爬虫2Python爬虫入门一之综述
摘要:Python爬虫入门一之综述 -->在此将自己的学习系统地整理下来,如果大家有兴趣学习爬虫的话,可以将这些文章作为参考,也欢迎大家一共分享学习经验。 Python版本:2.7,Python 3请另寻其他博文。 首先爬虫是什么? 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为 阅读全文

posted @ 2020-09-01 10:10 shuzihua 阅读(45) 评论(0) 推荐(0) 编辑

Python爬虫1-数据提取-BeautifulSoup4
摘要:https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/ Beautiful Soup 4.4.0 文档¶ Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档 阅读全文

posted @ 2020-09-01 10:05 shuzihua 阅读(273) 评论(0) 推荐(0) 编辑

优秀的 Java 爬虫项目?
摘要:优秀的 Java 爬虫项目? GitHub 上有哪些优秀的 Java 爬虫项目? 关注者 4,744 被浏览 351,839 关注问题​写回答 ​邀请回答 ​好问题 4 ​1 条评论 ​分享 ​ 登录一下,更多精彩内容等你发现 贡献精彩回答,参与评论互动 登录 查看全部 27 个回答 九章算法 美帝 阅读全文

posted @ 2020-08-29 23:31 shuzihua 阅读(809) 评论(0) 推荐(0) 编辑

用Python复制文件的9个方法
摘要:用Python复制文件的9个方法 https://docs.python.org/zh-cn/3/library/time.html https://www.runoob.com/python3/python3-date-time.html Python 中有许多“开盖即食”的模块(比如 os,su 阅读全文

posted @ 2020-08-29 23:30 shuzihua 阅读(1248) 评论(0) 推荐(0) 编辑

Burp Post、Get数据包转为上传multipart/form-data格式数据包
摘要:Burp Post、Get数据包转为上传multipart/form-data格式数据包 方法一: 新建一个网页进行上传,代码代码如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 阅读全文

posted @ 2020-07-12 17:15 shuzihua 阅读(1144) 评论(0) 推荐(0) 编辑

导航