小叶入门之Python爬虫(一)

一、Python简洁的简介

Python是一种跨平台的计算机程序设计语言。它是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。(摘自百度Python
Python的别名叫胶水语言,这个还是我们公司的技术钞钞告诉我的,我的理解是它就像一个中间处理模块,可以与多种程序组合使用,处理大批量数据等等。
二、什么是爬虫?

爬虫这个热门词汇至少这几年来很火,我也听过不下数十次,那么到底是爬虫?爬虫是否具有一定的危险性?网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。(摘自百度爬虫
爬虫如果用在正确的方面上,我们就可以获得有效且准确的数据,拿来做数据分析或者找资源都是极棒的。
三、爬!需要几步?

  1. 找到需要爬取数据的网页URL
  2. 按下F12,就是你我都懂的那个键:)点击它,你就可以看到网页的真面目,飒
  3. 在源码中寻找你要提取的数据,嘿嘿嘿
  4. 写Python代码进行请求、解析
  5. 存储爬到的数据

以上是一般情况下的步骤......

这是我博客园的第一篇,新起点,新征程!

posted @ 2020-11-24 01:04  葉謙虛  阅读(78)  评论(0编辑  收藏  举报