小叶入门之Python爬虫（一）

一、Python简洁的简介

Python是一种跨平台的计算机程序设计语言。它是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell)，随着版本的不断更新和语言新功能的添加，越多被用于独立的、大型项目的开发。（摘自百度Python）
Python的别名叫胶水语言，这个还是我们公司的技术钞钞告诉我的，我的理解是它就像一个中间处理模块，可以与多种程序组合使用，处理大批量数据等等。
二、什么是爬虫？

爬虫这个热门词汇至少这几年来很火，我也听过不下数十次，那么到底是爬虫？爬虫是否具有一定的危险性？网络爬虫（又称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。（摘自百度爬虫）
爬虫如果用在正确的方面上，我们就可以获得有效且准确的数据，拿来做数据分析或者找资源都是极棒的。
三、爬！需要几步？

找到需要爬取数据的网页URL
按下F12，就是你我都懂的那个键:)点击它，你就可以看到网页的真面目，飒
在源码中寻找你要提取的数据，嘿嘿嘿
写Python代码进行请求、解析
存储爬到的数据

以上是一般情况下的步骤......

这是我博客园的第一篇，新起点，新征程！

posted @ 2020-11-24 01:04 葉謙虛阅读(90) 评论(0) 收藏举报

刷新页面返回顶部

葉謙虛

小叶入门之Python爬虫（一）

公告