摘要: 之前我写脚本,是想获取HTML内容的. 但是呢...一方面编码困扰着我,于是我写了这个: java根据URL获取网页编码 然后呢,每个网站是不是GZIP还得判断,贼麻烦... 但是没办法啊,麻烦也得写呗,业务需求啊... 正当我写着方法,把HTML转为Document对象,进行下一步解析标签时... 阅读全文
posted @ 2017-04-13 15:54 曲高终和寡 阅读(14419) 评论(1) 推荐(2) 编辑
摘要: 由于很多原因,我们要获取网页的编码(多半是写批量抓取的脚本吧...嘻嘻嘻) 注意: 如果你的目的是获取不乱码的网页内容(而不是根据网址发送post请求获取返回值),切记切记,移步这里 java根据URL获取HTML内容 先说思路: 有三种方法: 1,根据responseHeaders获取Conten 阅读全文
posted @ 2017-04-13 15:32 曲高终和寡 阅读(4179) 评论(0) 推荐(2) 编辑