2017 年 4月 13 日随笔档案 - 曲高终和寡

2017年4月13日

摘要：之前我写脚本,是想获取HTML内容的. 但是呢...一方面编码困扰着我,于是我写了这个: java根据URL获取网页编码然后呢,每个网站是不是GZIP还得判断,贼麻烦... 但是没办法啊,麻烦也得写呗,业务需求啊... 正当我写着方法,把HTML转为Document对象,进行下一步解析标签时... 阅读全文

posted @ 2017-04-13 15:54 曲高终和寡阅读(14419) 评论(1) 推荐(2) 编辑

java根据URL获取网页编码

摘要：由于很多原因,我们要获取网页的编码(多半是写批量抓取的脚本吧...嘻嘻嘻) 注意: 如果你的目的是获取不乱码的网页内容(而不是根据网址发送post请求获取返回值),切记切记,移步这里 java根据URL获取HTML内容先说思路: 有三种方法: 1,根据responseHeaders获取Conten 阅读全文

posted @ 2017-04-13 15:32 曲高终和寡阅读(4179) 评论(0) 推荐(2) 编辑

曲高终和寡

公告