随笔分类 -  网络爬虫

摘要:1、手机连个wifi,然后wifi修改自动为手动; 2、主机名称设置为电脑端的IPv4; 3、端口默认8888,点击保存; 4、打开fiddler,点击手机调试看看有没有包; 5、fiddler 上也要进行设置,本人电脑已经设置好,详细自己百度; 阅读全文
posted @ 2021-11-24 17:10 皇问天 阅读(103) 评论(0) 推荐(0) 编辑
摘要:需要下载jsoup-1.8.1.jar包 jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 网页获取和解析速度飞快,推荐使用。主要功能如下: 1. 从一个UR 阅读全文
posted @ 2017-03-01 15:58 皇问天 阅读(1363) 评论(3) 推荐(0) 编辑
摘要:什么是网络爬虫? 网络爬虫又叫蜘蛛,网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这 阅读全文
posted @ 2017-03-01 15:32 皇问天 阅读(14299) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示