Excel操作-用excel实现爬取网站上表格数据
- Excel下,数据-获取数据-自网站输入网站,即可选择想要抓取的数据。
- 抓取数据要定期更新,可以找到刷新-链接属性,设置刷新频率。
- 数据抓取需要网页自带表格,无表格则要用爬虫工具或更深入知识。
获取豆瓣电影
使用excel爬取豆瓣网 https://movie.douban.com/coming 即将要上映电影的数据,并快速将数据保存到excel单元格中。
点击“数据-获取数据-自其他来源-自网站”或者直接点击"数据-自网站"。
获取股票实时行情
这次要获取股票实时行情数据 http://q.10jqka.com.cn/
相比获取豆瓣要上映电影有点不一样,获取股票实时行情需要每一分钟都要自动更新数据。
同理我们和获取豆瓣电影即将上映电影数据操作一样
将股票实时行情数据保存在excel数据表格中后,右击表格,可以看到表格中有个"刷新"按钮。可以通过点击"刷新"使excel重新获取网页上的表单数据。(学习的时候是晚上十点多,已经收市,点击刷新表格数据没有发生变化)
可以通过"数据"-"全部刷新"-“链接属性”-"查询属性",设置excel自动刷新表单频率,就可以实现excel自动刷新表单上的数据。
对比excel和爬虫一样的编程语言去爬取网站内上数据,excel有一个比较大的缺点,excel只能爬取网站上表格类型的数据,不能爬取结构化的数据。
(如需转载学习,请标明出处)