会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
黑白
长路漫漫明明月,残影俩俩细细声。
博客园
首页
新随笔
联系
订阅
管理
2017年7月20日
编写一个可配置的网页信息提取组件
摘要: 引言 最近项目有需求从一个老的站点抓取信息然后倒入到新的系统中。由于老的系统已经没有人维护,数据又比较分散,而要提取的数据在网页上表现的反而更统一,所以计划通过网络请求然后分析页面的方式来提取数据。而两年前的这个时候,我似乎做过相同的事情——缘分这件事情,真是有趣。 设想 在采集信息这件事情中,最麻
阅读全文
posted @ 2017-07-20 21:33 LibraJM
阅读(1647)
评论(3)
推荐(1)
编辑
公告