最近在做一个关于web scraping的项目,这几天一直在看相关的资料。国内好像研究不多,baidu找了很久都找不到需要的,而google上太多了。主要看了看dapper,一个API自定义网站,可以把网页中特定内容模块抽取出来,组成用户想要的内容信息,可以生成html,xml,rss..等。这里有一个demo,看了就会用 [dapper demo]。

 posted on 2007-04-25 11:06  紫色阴影  阅读(860)  评论(5编辑  收藏  举报
我要啦免费统计