Python的工作库有三种类型,分别是Python内置标准库、第三方库和自定义库。
·内置标准库是Python安装之后自带的库和包,例如re、string、datetime等,读者可在https://docs.python.org/2/library/index.html查看所有。
·第三方库是除了Python程序之外的,第三方主体开发的流行库,例如Sklearn、Numpy、Pandas等,一般是直接通过网络相关资源下载到本地安装或者使用pip命令在线安装。
·自定义库是本地的相关程序,一般是自定义的功能模块。
Python中导入不同类型的库,约定俗成的位置顺序是:
·Python标准库。
·Python第三方库。
·自定义库。
例如:
import re # Python标准库
import numpy as np # Python第三方库
import apriori # 自定义库
数据采集层:包括在线数据和外部数据的采集。
·数据处理层:在线数据在采集规则的约束下完成原始数据采集、处理和预运算,同时根据处理规则整合外部接入数据并做整合计算,最终可供外部调用的数据仓库数据或服务数据。
·数据应用层:根据外部特定请求以报告、数据源、数据服务、数据API、数据仓库等形式返回结果。
1、文件读写
文件的读写包括常见的txt、Excel、xml、二进制文件以及其他格式的数据文本,主要用于本地数据的读写。
2.网络抓取和解析
网络抓取和解析用于从互联网中抓取信息,并对HTML对象进行处理,有关xml对象的解析和处理的库在“1.文件读写”中找到。
3.数据库连接
数据库连接可用于连接众多数据库以及访问通用数据库接口,可用于数据库维护、管理和增、删、改、查等日常操作。
4.数据清洗转换
数据清洗转换主用于数据正式应用之前的预处理工作。
5.数据计算和统计分析
数据计算和统计分析主要用于数据探查、计算和初步数据分析等工作。
6.自然语言处理和文本挖掘
自然语言处理和文本挖掘库主要用于以自然语言文本为对象的数据处理和建模。
7.图像和视频处理
图像处理和视频处理主要适用于基于图像的操作、处理、分析和挖掘,如人脸识别、图像识别、目标跟踪、图像理解等。
8.音频处理
音频处理主要适用于基于声音的处理、分析和建模,主要应用于语音识别、语音合成、语义理解等。
9.数据挖掘/机器学习/深度学习
数据挖掘、机器学习和深度学习等是Python进行数据建模和挖掘学习的核心模块。
10.数据可视化
数据可视化主要用于做数据结果展示、数据模型验证、图形交互和探查等方面。
11.交互学习和集成开发
交互学习和集成开发主要用来做Python开发、调试和集成之用,包括Python集成开发环境和IDE。
12.其他Python协同数据工作工具
其他Python协同数据工作工具指除了上述主题以外,其他在数据工作中常用的工具或库。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
2016-08-19 Ipad2
2016-08-19 ipad2 恢复