摘要:
Series对象 Series对象是一个带索引构成的一维数组,可以用一个数组创建Series对象: import pandas as pd In [2]: pd.Series([1,2,3,4,5,6]) Out[2]: 0 1 1 2 2 3 3 4 4 5 5 6 dtype: int64 In 阅读全文
2024年1月28日
2023年12月23日
摘要:
目录Ipython帮助文档用符号?来查来文档用??来获取源代码补全方法利用tab利用*加?来补全Ipython快捷键Ipython魔法命令粘贴代码块执行外部代码计算代码运行时间内存分析魔法函数帮助错误和调试控制异常:%xmode调试模型:%debug输入输出历史禁止输出历史输入Ipython和she 阅读全文
2023年5月7日
摘要:
(声明:这些代码只是看书的时候跟着敲一敲,留个印象,为的是以后用到有个方便快速查找看个思路,并没有真正运行。) 数据挖掘建模过程 数据挖掘建模过程: 定义挖掘目标:明确挖掘目标,弄清用户需求。 数据采样: 采样标准(相关性、可靠性、有效性) 采样方法:随机、分层、等距 数据探索:进行探索、审核和加工 阅读全文
2023年3月13日
摘要:
import matplotlib.pyplot as plt import numpy as np import matplotlib.dates as mdates from datetime import datetime plt.rcParams['font.sans-serif']=['s 阅读全文
2022年11月28日
摘要:
第二章 线性代数 标量、向量、矩阵和张量 标量:一个单独的数字就是标量,通常斜体表示标量。 向量:一列数,这些数是有序排列的。一般用粗体的小写$\mathbf{x}$。如果每个元素都属于R,并且该向量有n个元素,那么该向量属于实数集R的n次笛卡尔乘积构成的集合,记为$R^n$,索引这些元素时如果是一 阅读全文
2020年10月5日
摘要:
逻辑回归思路 线性回归的模型是求输出特征向量Y与样本矩阵X之间的线性关系,如果我们想要的Y是离散的话,可以对Y再做一次函数转换,变为g(Y)。如果我们设定g(Y)的值在某个实数区间的时候是类别A,在另一个实数区间是类别B,那么就得到一个分类模型。 分布假设 LR假设噪声是高斯分布,数据是伯努利分布, 阅读全文
2020年9月28日
摘要:
GBDT三要素 GBDT算法思路是希望把多个弱模型进行一个聚合,变成一个更强大的模型,通过多个弱模型的预测结果更好的拟合数据。 在GBDT算法主要有三个要素对应上面的思路:决策树模型, BOOSTING和梯度提升。分别对应上面提到的弱模型选用的就是决策树模型、Boosting就是怎么组合弱模型,梯度 阅读全文
2019年10月11日
摘要:
用Python处理excel文件,通常会选用xlrd和xlwt这两个库,xlrd是用来读excel,xlwt是写excel的库。 xlrd可以读取.xls或者.xlsx格式的文件数据。 xlwt可以写入.xls文件数据。 xlrd 安装 pip install xlrd 读取excel 通过xlrd 阅读全文
2019年4月29日