爬虫 - 随笔分类 - 文明老人

Python_matplotlib

摘要：一、什么是matplotlib Matplotlib 是一款用于数据可视化的 Python 软件包，支持跨平台运行，它能够根据 NumPy ndarray 数组来绘制 2D 图像，它使用简单、代码清晰易懂，深受广大技术爱好者喜爱。 Matplotlib是Python的绘图库，它能让使用者很轻松地将数阅读全文

posted @ 2022-05-08 23:30 文明老人阅读(432) 评论(0) 推荐(0)

Python_pandas

摘要：一、什么是pandas pandas 是基于NumPy 的一种工具，该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成为强大而高效阅读全文

posted @ 2022-05-01 22:02 文明老人阅读(165) 评论(0) 推荐(0)

Python_numpy

摘要：一、NumPy 是什么 NumPy是Python中科学计算的基础包。它是一个Python库，提供多维数组对象，各种派生对象（如掩码数组和矩阵），以及用于数组快速操作的各种API，有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数，基本统计运算和随机模拟等等。 NumPy包阅读全文

posted @ 2022-04-19 20:15 文明老人阅读(98) 评论(0) 推荐(0)

Python爬虫_XPath

摘要：一、XPath介绍 XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。 XPath 是 W3C XSLT 标准的主要元素，并且 XQuery 和 XPointer 都构建于 XPath 表达之上。因此，对 XPath 的理解是很多高级 X 阅读全文

posted @ 2022-04-10 18:55 文明老人阅读(422) 评论(0) 推荐(0)

Python_Scrapy框架

摘要：一、什么是Scrapy Scrapy，Python开发的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。 Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试. 其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的，后台也应用在获取API所返回的阅读全文

posted @ 2022-04-02 16:13 文明老人阅读(135) 评论(0) 推荐(0)

爬虫案例_刘益长

摘要：通过爬取百度贴吧的案例来了解爬虫的基本使用 from urllib import request import re # 定义了一个URL page = 100 url = "https://tieba.baidu.com/f?kw=%E6%AE%B5%E5%AD%90&ie=utf-8&pn=" 阅读全文

posted @ 2022-03-20 14:25 文明老人阅读(53) 评论(0) 推荐(0)

爬虫基础_刘益长

摘要：一、什么是爬虫爬虫：一段自动抓取互联网信息的程序，从互联网上抓取对于我们有价值的信息。二、Python爬虫架构 Python 爬虫架构主要由五个部分组成，分别是调度器、URL管理器、网页下载器、网页解析器、应用程序（爬取的有价值数据）。调度器：相当于一台电脑的CPU，主要负责调度URL管理器、阅读全文

posted @ 2022-03-13 20:36 文明老人阅读(121) 评论(0) 推荐(0)

文明老人

随笔分类 - 爬虫

公告