02 2023 档案
摘要:jupyter notebook的设置问题 更改主题、字体等 在命令行中输入 pip install jupyterthemes 安装主题 安装和更新成功以后,可以查看可用主题:jt -l 设置主题,字体,字体大小,宽度… jt -t monokai -f fira -fs 16 -cellw 94
阅读全文
摘要:numpy中的矩阵 1.矩阵 矩阵,和array的区别是矩阵必须是2维的,但array可以是多维的 2.向量 3.加法和标量相乘 4.矩阵向量乘法 矩阵乘法遵循准则:(M行,N列)*(N行,L列)=(M行,L列) 5.矩阵乘法 6.矩阵乘法的性质 矩阵的乘法不满足交换律:A×B ≠ B×A 矩阵的乘
阅读全文
摘要:数组间运算 1.数组与数的运算 arr = np.array([[1,2,3,2,1,4],[5,6,1,2,3,1]]) arr + 1#每个元素分别+1 """ array([[2, 3, 4, 3, 2, 5], [6, 7, 2, 3, 4, 2]]) """ arr/2#每个元素分别除2
阅读全文
摘要:ndarray的运算 1.逻辑运算 score = np.random.randint(40,100,(10,5))#生成一个10行5列取值在40-50之间的数组 test_sore = score[6:,0:5]#从第6行开始到末尾,5列,取出4名同学用于逻辑判断 test_sore>60 tes
阅读全文
摘要:python中debug的几种方法对比 1.断点+单步调试 断点+单步调试是目前应用最广的debug方法 流程为: 在关键的代码位置加上print语句,通过分析print的值将范围缩小,这个过程可能需要重复多次。将范围缩小到一个比较完整的功能模块中 在可能出现bug的模块中的关键部分打上断点,进入到
阅读全文
摘要:数据合并merge #参数解释 merge( self, right: DataFrame | Series, how: str = "inner",#连接方式:‘inner’(默认);还有,‘outer’、‘left’、‘right’ on: IndexLabel | None = None,#用
阅读全文
摘要:jupyter notebook nbextension常用扩展模块不显示 nbextension不显示有很多的可能,看了许多博客,试过无数种方法之后发现问题还是解决不了其实这最后的问题就是jupyter notebook版本的问题,你只需要降低你notebook的版本即可解决问题: 命令行输入:p
阅读全文
摘要:数组的基本操作 1.数组的索引、切片 一维、二维、三维的数组切片 直接进行索引,切片 对象[:,:]—先行后列 #对于二维数组 x1 = np.random.uniform(0,1,[4,5]) #生成一个4行5列的波动区间在4~5之间的数组 a = x1[0,0:3]#获取第一行,前3列的数据 #
阅读全文
摘要:生成数组的方法 1.生成0和1数组 np.ones(shape,dtype) np.ones_like(a,dtype) np.zeros(shape,dtype) np.zeros_like(shape,dtype) score = np.array([[80,89,86,67,79],[78,9
阅读全文
摘要:数据合并concat #concat 函数 #参数解释 concat( objs: Iterable[NDFrame] | Mapping[HashableT, NDFrame], axis: Axis = 0, join: str = "outer",#设置函数的并集、交集问题 ignore_in
阅读全文
摘要:缺失值的处理 缺失值的类型 numpy库中的:np.nan/ np.NaN,不区分大小写 None,区分大小写 pandas中:pd.NA/pd.NaT:区分大小写 缺失值判断 #isna()/isnull() data = [[3,8,31], [np.nan,np.nan,2], [np.nan
阅读全文
摘要:numpy 1.numpy基础 一个开元的python科学计算库 计算起来要比python简洁高效 Numpy使用ndarray对象来处理多维数组 ndarry的优势 内存块风格 python中的list—分离式存储,存储内容多样化 ndarry—一体存储,存储类型必须一样 ndarry支持并行化运
阅读全文
摘要:#query函数 a = {"name":["lemon","jack","peter","Emma","james"], "city":["长沙","上海","深圳","北京","北京"], "a":[80,90,60,73,89], "b":[80,75,80,85,83], "c":[70,7
阅读全文
摘要:import matplotlib.pyplot as plt import random from pylab import mpl #设置显示中文字体 mpl.rcParams["font.sans-serif"] = ["SimHei"] #设置正常显示符号 mpl.rcParams["axe
阅读全文
摘要:数据筛选3 #1.at与iat #at 通过设置行或列的索引名称来获取单个单元格的数据 #at的功能比较单一,所有的功能均可有loc来完成 var = df.at[1,"name"]#选取整个数据框 #以下为获取单元格的几种常见的方法 df.at["e","name"] df.loc["e"].at
阅读全文
摘要:pandas中loc与iloc的用法 a = {"name":["lemon","jack","peter","Emma","james"], "city":["长沙","上海","深圳","北京","北京"], "a":[80,90,60,73,89], "b":[80,75,80,85,83],
阅读全文
摘要:数据筛选 #1.头部数据与尾部数据 #head df.head(2) #获取前2行数据 2.tail df.tail(2) #获取后2行数据 #2.数据列的的获取 df["name"] #df+列名称 df.name #此种方法列名称不能有空格 df[["name","age"]] #通过列表选取多
阅读全文
摘要:4.在一个坐标下绘制多个图形 import matplotlib.pyplot as plt import random from pylab import mpl #设置显示中文字体 mpl.rcParams["font.sans-serif"] = ["SimHei"] #设置正常显示符号 mp
阅读全文
摘要:数据统计 #1.中位数 median #median()参数解释 median( self, axis: Axis | None | lib.NoDefault = lib.no_default,#轴方向 skipna: bool_t = True,#处理NA值,默认为true,即跳过NA值 lev
阅读全文
摘要:Matplotlib 1.什么是matplotlib 专门用于开发2D图表(包括3D图表,但不怎么擅长3D图表) 以渐、交互式实现数据可视化 2. hello_matplotlib 简单折线图的绘制 import matplotlib.pyplot as plt #1.创建画布 plt.figu
阅读全文
摘要:机器学习基本概念 1.基本定义 机器学习 : 是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。 2.机器学习的工作流程 1.获取数据 2.数据的基本处理 3.特征工程 4.机器学习(模型训练) 5.模型评估 结果达到要求,上线服务 未达到要求,重复上述步骤 2.1获取数
阅读全文