会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
啸寒
长啸于寒风之中,于冰天雪地里度过那似水流年!
博客园
首页
新随笔
联系
管理
订阅
2013年7月21日
怎样抓取网页内容
摘要: 如果给你一个网页链接, 来抓取指定的内容, 比如豆瓣电影排行榜, 那要怎样才能做到了? 其实网页内容的结构很是类似于XML, 那么我们就可以用解析XML的方式来解析HTML, 不过两者之间的差距还是很大的, 好了, 废话不多说, 我们开始解析HTML。 那么解析XML的库比较多, 这里选用libxml来解析, 因为libxml是c语言接口, 找了一个用objective-c包装接口的库-hpple...
阅读全文
posted @ 2013-07-21 16:21 啸寒
阅读(6232)
评论(0)
推荐(0)
编辑
公告