会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
蛙蛙池塘
人生价值的最好体现就是做好本职工作...
CnBlogs
Home
New Post
Contact
Admin
Subscription
2011年2月22日
蛙蛙推荐:利用IronPython做更灵活的网页爬虫
由于各种原因,我们经常需要去别的网站采集一些信息,.net下所有相关的技术都已经非常成熟,用Webrequest抓取页面,既支持自定义Reference头,又支持cookie,解析页面一般都是用正则,而且对方网站结构一变,还得重新改代码,重新编译,发布。如果有了IronPython,可以把抓取和分析的逻辑做成Python脚本,如果对方页面结构变了,只需修改脚本就行了,不需重新编译软件,这样可以用c#做交互和界面部分,用Python封装预期经常变化的部分。
Read More
posted @ 2011-02-22 09:33 蛙蛙王子
Views(5533)
Comments(19)
Diggs(7)
Edit
公告