随笔分类 -  爬虫

学习Java、Python编写的爬虫程序
通过java.net.URLConnection发送HTTP请求(原生、爬虫)
摘要:目录 1. 运用原生Java Api发送简单的Get请求、Post请求 2. 简单封装 3. 简单测试 目录 1. 运用原生Java Api发送简单的Get请求、Post请求 2. 简单封装 3. 简单测试 如何通过Java发送HTTP请求,通俗点讲,如何通过Java(模拟浏览器)发送HTTP请求。 阅读全文
posted @ 2017-09-14 00:34 kosamino 阅读(683) 评论(0) 推荐(0) 编辑
java爬取网页Unicode转UTF-8中文
摘要:unicode编码简而言之就是将每一个字符用16位2进制数标识。但是通常都用4位的16进制数标识。 例如: 1)中文字符串"你好"的unicode码为:\u60\u597d; 2)英文字符串"ab"的unicode码为:\u0061\u0062; 其中\u是标识unicode码用的,后面的4位16进 阅读全文
posted @ 2017-09-06 15:52 kosamino 阅读(1419) 评论(0) 推荐(0) 编辑