会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
自由、创新、研究、探索
.NET CloudNative Development/dotnet云原生应用开发
博客园
首页
新随笔
联系
订阅
管理
2012年7月31日
网络采集库NCrawler
摘要: NCrawler是一款国外的开源网络爬虫软件,遵循LGPL许可协议。其HTML处理使用的是htmlagilitypack开源库,采用xpath的方式处理定位网页元素,十分方便。同时其采用HttpWebRequest异步的方式获取网页,采集效率较高。台湾微软MSDN有一篇如何使用NCrawler参考文章。 官方地址:http://ncrawler.codeplex.com/
阅读全文
posted @ 2012-07-31 22:23 张善友
阅读(4171)
评论(2)
推荐(1)
编辑
公告