Mechanize抓取数据【Ruby】
创建: 2017/08/05
更新: 2018/01/08 修正: ele_inner_text -> ele.inner_text
补充: inner_text和text一样
第一步 | gemfile里面加上
# 2017/08/05 拉取数据
这行是注释,自己随便写点啥
gem 'mechanize'
|
第二步 | bundle install 在项目目录下运行,安装Mechanize |
第三步 | 新建文件 scraping.rb 位置 app/models |
先自己标点注释, 实际第一行加上 require 'mechanize' |
|
Mechanize方法 | |
创建 | agent = Mechanize.new |
读取 | page = agent.get('...') ''内部放网址 |
获取特定标签内容 满足条件的所有内容 |
elements = page.search('..') |
获取标签内部文本 | elements.each do |ele| puts ele.inner_text end |
获取特定标签内容 满足条件的一个内容 |
elements = page.at('..') |
获取内部属性 | elements.each do |ele| link = ele.get_attribute(:href) end 或者简写为ele[:href] |