2021年2月28日
摘要: 新浪财经是金融新闻类数据挖掘很重要的一个数据来源,它的新闻质量一般都很高。在这里使用爬虫的方法来获取新浪财经的一些新闻资讯。 第一步: 打开新浪财经网站 第二步: 搜索‘工商银行’ 第三步: 获取新浪财经里的‘工商银行’的url url = 'https://search.sina.com.cn/? 阅读全文
posted @ 2021-02-28 20:57 桌子哥 阅读(852) 评论(0) 推荐(0) 编辑
摘要: 对于网络爬虫来说header是很重要的一环,因为有些网站只认可浏览器发送的访问请求。 网上的例子多是Chrome的,Firefox的较少。 第一步: 使用百度打开一个网页 第二步: 按F12进入开发者模式 第三步: 选择网络 第四步: 点击一项进去 右下角可以看到User-Agent 有这个就可以进 阅读全文
posted @ 2021-02-28 10:45 桌子哥 阅读(603) 评论(0) 推荐(0) 编辑