1957

无聊蛋疼的1957写的低端博客
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

ruby爬虫

Posted on 2012-11-27 19:30  1957  阅读(806)  评论(0编辑  收藏  举报
require 'open-uri'

url = "http://cstest.scu.edu.cn"

open(url) do |page|
	page_content = page.read()
	links = page_content.scan(/<a href=\"(.*?)\"/).flatten
	links.each {|link| puts url+'/'+link}
end

 - -还不会。。。先写个简单的