会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
释然的蛋
博客园
首页
新随笔
联系
订阅
管理
2018年10月22日
吐槽一下jsoup
摘要: 网络爬虫的本质就是通过域名加上特定的路由方式与远程资源建立一个短暂的连接,然后通过io流的方式读取。然后说一下jsoup,jsoup可以说是目前的爬虫工具包里面对java底层的工具类封装最简单的一种了,轻便很好用,但是有一些莫名奇妙的限制,用jsoup请求网络资源时,默认读取的最大长度是1024*1
阅读全文
posted @ 2018-10-22 14:44 释然的蛋
阅读(262)
评论(0)
推荐(1)
编辑
公告