随笔分类 -  爬虫

摘要:一、什么是matplotlib Matplotlib 是一款用于数据可视化的 Python 软件包,支持跨平台运行,它能够根据 NumPy ndarray 数组来绘制 2D 图像,它使用简单、代码清晰易懂,深受广大技术爱好者喜爱。 Matplotlib是Python的绘图库,它能让使用者很轻松地将数 阅读全文
posted @ 2022-05-08 23:30 文明老人 阅读(360) 评论(0) 推荐(0) 编辑
摘要:一、什么是pandas pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效 阅读全文
posted @ 2022-05-01 22:02 文明老人 阅读(132) 评论(0) 推荐(0) 编辑
摘要:一、NumPy 是什么 NumPy是Python中科学计算的基础包。它是一个Python库,提供多维数组对象,各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种API,有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数,基本统计运算和随机模拟等等。 NumPy包 阅读全文
posted @ 2022-04-19 20:15 文明老人 阅读(72) 评论(0) 推荐(0) 编辑
摘要:一、XPath介绍 XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。 XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 都构建于 XPath 表达之上。 因此,对 XPath 的理解是很多高级 X 阅读全文
posted @ 2022-04-10 18:55 文明老人 阅读(391) 评论(0) 推荐(0) 编辑
摘要:一、什么是Scrapy Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。 Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试. 其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的, 后台也应用在获取API所返回的 阅读全文
posted @ 2022-04-02 16:13 文明老人 阅读(111) 评论(0) 推荐(0) 编辑
摘要:通过爬取百度贴吧的案例来了解爬虫的基本使用 from urllib import request import re # 定义了一个URL page = 100 url = "https://tieba.baidu.com/f?kw=%E6%AE%B5%E5%AD%90&ie=utf-8&pn=" 阅读全文
posted @ 2022-03-20 14:25 文明老人 阅读(37) 评论(0) 推荐(0) 编辑
摘要:一、什么是爬虫 爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息。 二、Python爬虫架构 Python 爬虫架构主要由五个部分组成,分别是调度器、URL管理器、网页下载器、网页解析器、应用程序(爬取的有价值数据)。 调度器:相当于一台电脑的CPU,主要负责调度URL管理器、 阅读全文
posted @ 2022-03-13 20:36 文明老人 阅读(93) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示