会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
自行车上的程序员
学无止境
博客园
首页
新随笔
联系
管理
2014年1月23日
使用java爬取国家统计局的12位行政区划代码
摘要: 前言: 本文基于j2ee的原始url进行都写,解析指定内容时也是使用很傻的形式去查找指定格式的字符串来实现的。 更优雅的方式是可以使用apache的HttpClient和某些文档模型将HTML字符串构建成doc来进行解析。 目前已经修改代码适配最新的2015年的抓取。 爬取的原因:统计局网站提供的页
阅读全文
posted @ 2014-01-23 09:50 自行车上的程序员
阅读(7628)
评论(12)
推荐(1)
编辑
公告