Excel操作-用excel实现爬取网站上表格数据

 

 

  • Excel下,数据-获取数据-自网站输入网站,即可选择想要抓取的数据。
  • 抓取数据要定期更新,可以找到刷新-链接属性,设置刷新频率。
  • 数据抓取需要网页自带表格,无表格则要用爬虫工具或更深入知识。 

 

获取豆瓣电影

  使用excel爬取豆瓣网 https://movie.douban.com/coming 即将要上映电影的数据,并快速将数据保存到excel单元格中。

  点击“数据-获取数据-自其他来源-自网站”或者直接点击"数据-自网站"。

 

 

获取股票实时行情

  这次要获取股票实时行情数据 http://q.10jqka.com.cn/

  相比获取豆瓣要上映电影有点不一样,获取股票实时行情需要每一分钟都要自动更新数据。

  同理我们和获取豆瓣电影即将上映电影数据操作一样

 

  将股票实时行情数据保存在excel数据表格中后,右击表格,可以看到表格中有个"刷新"按钮。可以通过点击"刷新"使excel重新获取网页上的表单数据。(学习的时候是晚上十点多,已经收市,点击刷新表格数据没有发生变化)

 

  可以通过"数据"-"全部刷新"-“链接属性”-"查询属性",设置excel自动刷新表单频率,就可以实现excel自动刷新表单上的数据。

 

 

  对比excel和爬虫一样的编程语言去爬取网站内上数据,excel有一个比较大的缺点,excel只能爬取网站上表格类型的数据,不能爬取结构化的数据。

 

 

 

posted @ 2022-03-20 22:29  Cynical丶Gary  阅读(3798)  评论(0编辑  收藏  举报