会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
我的博客
想要进步,想要一个更好的环境。
博客园
首页
新随笔
联系
订阅
管理
2010年12月3日
简陋的信息采集方式
摘要: 以前因工作需求,制作过新闻采集器,因为没有系统学习过这方面,故而只是使用自己掌握的基础和现学了一点正则表达式来制作了一个匹配个别网站新闻栏目的特殊字符后采集文章内容的小程序。写出来主要是将采集的方法留备以后查看,也可以给初入门的一个参考(但愿不会误导吧)。例:www.whhouse.com里的大部分新闻和房产信息均是采集的其他网站(实际工作人员不超过5人,普通维护人员1名,租的服务器,成本非常低)...
阅读全文
posted @ 2010-12-03 13:06 花祭果凛
阅读(2550)
评论(5)
推荐(1)
编辑