Mechanize抓取数据【Ruby】

创建: 2017/08/05

更新: 2018/01/08 修正: ele_inner_text -> ele.inner_text

                          补充: inner_text和text一样
 第一步   gemfile里面加上
# 2017/08/05  拉取数据  这行是注释,自己随便写点啥
gem 'mechanize'
 第二步  bundle install
在项目目录下运行,安装Mechanize
 第三步  新建文件 scraping.rb
 位置 app/models
 先自己标点注释,
 实际第一行加上 require 'mechanize'
 
 
 
 
 
 
 
 
   
   
   
   

 
 Mechanize方法
 创建  agent = Mechanize.new
 读取  page = agent.get('...')

 ''内部放网址
 获取特定标签内容
 满足条件的所有内容
 elements = page.search('..')
 获取标签内部文本   elements.each do |ele|
    puts ele.inner_text
 end
 获取特定标签内容
 满足条件的一个内容
 elements = page.at('..')
 获取内部属性  elements.each do |ele|
    link = ele.get_attribute(:href)
 end

 或者简写为ele[:href]
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   

 

posted @ 2017-08-05 22:56  懒虫哥哥  阅读(174)  评论(0编辑  收藏  举报