09 2022 档案
摘要:机器学习的概念 总体概念 机器学习的基本过程:经验归纳、总结规律、预测未来 机器学习的发展过程:统计方法——>简单算法——>概率推理——>反向传播——>数据驱动——>无监督学习——>深度学习 数据集的概念 一行数据我们称为一个样本 一列数据我们称为一个特征 有些数据有目标值(标签值),有些数据没有目
阅读全文
摘要:爬虫基础——静态网页与动态网页 在爬虫前应首先名确待爬取的页面是静态的,还是动态的,只有确定了页面类型,才方便后续对网页进行分析和程序编写。对于不同的网页类型,编写爬虫程序时所使用的方法也不尽相同 静态网页 静态网页是标准的 HTML 文件,通过 GET 请求方法可以直接获取,文件的扩展名是.htm
阅读全文
摘要:pandas基础知识 pandas的数据结构 Series Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型 Series 由索引(index)和列组成,函数如下: Series只能输出一个一维表格 pandas.Series( data, ind
阅读全文
摘要:从pdf中抽取数据到excel 在日常工作中遇到需要批量处理的pdf表格,并将表格中的数据批量处理至excel中,以水质监测的报告为例 import os import pdfplumber import numpy as np import pandas as pd import xlwings
阅读全文
摘要:python打包代码为exe 1.先安装pyinstaller,直接pip install pyinstaller就好了 2.cd到py文件位置,输入以下命令: -C:\Users\lenovo\PycharmProjects\pythonProject12>pyinstaller -F --hid
阅读全文
摘要:报错ModuleNotFoundError:No module named setuptools._distutils 如图 原因:setuptools版本太高,需要重新安装低于5.0.0的版本 -解决:如安装低版本的setuptools:pip install setuptools==49.1.2
阅读全文