摘要:
# defaultdict详解 - 今天在看博文的时候,无意间看到了defaultdic的用法,觉得挺有意思的,分享下 - **defaultdict**是一个字典(`dict`)的子类,它提供了一种更方便的方式来处理缺失键(key)的情况。与普通的字典不同,`defaultdict`在初始化时需要 阅读全文
摘要:
# Tkinter ## 1、Label & Button 标签和按钮 ~~~python #一、基础的命名与标签 #1.窗体的设置 window = tk.Tk()#实例化一个窗体 window.title("my window") #给窗体起一个名字 window.geometry("200x1 阅读全文
摘要:
pandas日期类型汇总 时间序列数据的特点是有规律地随着时间变化而变化,它们的变化趋势可以被分析和预测。时间序列分析是一种用于预测未来值或评估过去值的统计方法,常常被用于预测未来趋势、季节性变化、周期性变化、随机波动等。 1.日期类型 原始数据中,日期一般会存储为各种类型字符串,比如: • 202 阅读全文
摘要:
pandas中的catagory 类型 pandas中的category类型是一种用于处理分类变量的数据类型。 它可以大大提高数据处理和计算效率,并减少内存占用。 在某些情况下,数据中的一些变量只包含有限的可能取值,例如“性别”、“地区”等,这些变量可以归类为分类变量。 如果将这些变量存储为字符串或 阅读全文
摘要:
基本概念 各种函数 损失函数(Loss Function)度量单样本****或者一个批次的样本预测的错误程度,损失函数越小,模型就越好。常用的损失函数包括:0-1损失函数、平方损失函数、绝对损失函数、对数损失函数等 代价函数(Cost Function)度量全部样本集的平均误差。常用的代价函数包括均 阅读全文
摘要:
numpy中np.linspace函数与np.arange函数的区别 NumPy 中的linspace()和arange()函数都可以用于创建数字序列,但它们之间有一些关键的区别。 arange()函数创建一个一维的数组,其中元素从指定的开始值开始,按指定的间隔增加,并一直到结束值(但不包括结束值) 阅读全文
摘要:
时间特征索引 import pandas as pd filepath = r"E:\Desktop\配套代码和数据集\配套代码和数据集\第3章:Pandas\Pandas代码\data\flowdata.csv" df = pd.read_csv(filepath,index_col=0,pars 阅读全文
摘要:
pivot数据透视表 filepath = r"E:\Desktop\配套代码和数据集\配套代码和数据集\第3章:Pandas\Pandas代码\data\titanic.csv" df = pd.read_csv(filepath) df.pivot_table(index="Sex",colum 阅读全文
摘要:
pandas的突出显示(style.highlight方法) Pandas提供了一些常用的内置样式,可快速对表格数据进行格式化展示,要记住的是该方法只能在jupyter notebook中显示出来,并不能在pycharm中显示,并且不可用print打印,但是可以将筛选出的文件保存至文件中 空值高亮 阅读全文
摘要:
多重索引 参考来源:Pandas基础教程五_多重索引 - 知乎 (zhihu.com) 1.多重索引的构建 #待完善 2.多重索引值得获取 创建测试数据集 import pandas as pd import numpy as np iterables = [['1', '2', '3'], ['b 阅读全文