程序猿刚子的博客

大龄程序猿,分享互联网开发相关知识!前端、后端,架构等内容,欢迎关注公众号 chengxuyuangangzi

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2011年9月15日

摘要: 程序目的: 前段时间弄了个论坛(http://www.yyjun.net),懒于手动找贴发帖,特写个抓取指定url中帖子内容的小程序(完善中) 已经实现功能: 由于我们需要抓取页面特定DOM下的链接,如程序中,我们抓取 http://news.sina.com.cn/society/ 页面中大标题的链接,因此可以用函数getlink获取,返回list型结果,代码如下: url="http://news.sina.com.cn/society/" sinaurls=getlink(url, 'h1', {}),花括号为我们指定了附属条件,可以添加附加条件限制 阅读全文
posted @ 2011-09-15 14:36 程序猿刚子 阅读(1004) 评论(0) 推荐(0) 编辑