07 2022 档案

摘要:本周收获 总结一下本周学习内容: 1、《深入浅出Pandas》的第16章:Pandas可视化 16.1 plot()方法~ 16.2常用可视化图形 :car:博客: Pandas:可视化 2、《机器学习》第10章:降维与度量学习 10.1 K近邻学习 10.2 低维嵌入 10.3 主成分分析 10. 阅读全文
posted @ 2022-07-30 22:26 朝南烟 阅读(46) 评论(0) 推荐(0) 编辑
摘要:1、plot()方法 plot() 方法的绘制方法可绘制的图形主要有: Plot 绘图参数 plot.line 折线图 plot.pie 饼图 plot.bar 柱状图 plot.hist 直方图 plot.box 箱形图 plot.area 面积图 plot.scatter 散点图 plot.he 阅读全文
posted @ 2022-07-30 22:16 朝南烟 阅读(54) 评论(0) 推荐(0) 编辑
摘要:1、权重衰减 过拟合现象:模型的训练误差远小于它在测试集上的误差。 虽然增大训练数据集可能会减轻过拟合,但是获取额外的训练数据往往代价高昂。 本节介绍应对过拟合问题的常用方法:权重衰减(weight decay)。 方法 权重衰减等价于L2范数正则化(regularization)。正则化通过 阅读全文
posted @ 2022-07-30 21:18 朝南烟 阅读(340) 评论(0) 推荐(0) 编辑
摘要:1、K近邻学习 k近邻算法简称kNN(k-Nearest Neighbor),是一种经典的监督学习方法,数据挖掘十大算法之一。 工作机制:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。 通常,在分类任务中可使用“投票法”,即选择这k个样本 阅读全文
posted @ 2022-07-30 20:52 朝南烟 阅读(249) 评论(0) 推荐(0) 编辑
摘要:本周收获 总结一下本周学习内容: 1、《深入浅出Pandas》的第15章:Pandas样式 15.1 内置样式~ 15.3样式高级操作 :car:博客: Pandas样式 2、《机器学习》第9章:聚类 9.1 聚类任务 9.2 性能度量 9.3 距离计算 9.4 原型聚类 9.5 密度聚类 9.7 阅读全文
posted @ 2022-07-23 23:30 朝南烟 阅读(29) 评论(0) 推荐(0) 编辑
摘要:1、pandas 内置样式 空值高亮 highlight_null 最大最小值高亮 背景渐变 background_gradient 根据数值的大小背景颜色呈现梯度渐变,越深表示越大,越浅表示越小,类似于 Excel 的中的色阶样式。 条形图 bar 2、pandas 格式显示 我们在最终输出数据查 阅读全文
posted @ 2022-07-23 23:18 朝南烟 阅读(77) 评论(0) 推荐(0) 编辑
摘要:多层感知机 多层感知机就是含有至少一个隐藏层的由全连接层组成的神经网络,且每个隐藏层的输出通过激活函数进行变换。多层感知机的层数和各隐藏层中隐藏单元个数都是超参数。多层感知机按以下方式计算输出: $$ \begin{aligned} \boldsymbol{H} &= \phi(\boldsymbo 阅读全文
posted @ 2022-07-23 17:46 朝南烟 阅读(502) 评论(0) 推荐(0) 编辑
摘要:1、聚类任务 聚类是一种经典的无监督学习方法,无监督学习的目标是通过对无标记训练样本的学习,发掘和揭示数据集本身潜在的结构与规律,即不依赖于训练数据集的类标记信息。 聚类则是试图将数据集的样本划分为若干个互不相交的类簇,从而每个簇对应一个潜在的类别。 2、性能度量 性能度量为评价聚类结果的好坏提供了 阅读全文
posted @ 2022-07-23 17:26 朝南烟 阅读(291) 评论(0) 推荐(0) 编辑
摘要:本周收获 总结一下本周学习内容: 1、《深入浅出Pandas》的第14章:Pandas时序数据 14.4 时间偏移~ 14.6时间操作 :car:博客: Pandas:时序数据(下) 2、《机器学习》第8章:集成学习 8.1 个体与集成 8.2 Boosting 8.3 Bagging与随机森林 8 阅读全文
posted @ 2022-07-17 00:45 朝南烟 阅读(45) 评论(0) 推荐(0) 编辑
摘要:1、时间偏移 DateOffset 对象 DateOffset 类似于时间差 Timedelta ,但它使用日历中时间日期的规则,而不是直接进行时间性质的算术计算,让时间更符合实际生活。比如,有些地区使用夏令时时,每日偏移时间有可能是 23 或 24 小时,甚至 25 个小时。 移动偏移 应用偏移 阅读全文
posted @ 2022-07-17 00:34 朝南烟 阅读(154) 评论(0) 推荐(0) 编辑
摘要:1、个体与集成 集成学习(ensemble learning):构建并结合多个学习器来完成学习任务 集成学习可以只包含同种类型的个体学习器,如全是决策树、神经网络,称为“同质”(homogeneous);也可以包含不同类型的个体学习器,如同时包含决策树、神经网络,称为异质的(heterogeneou 阅读全文
posted @ 2022-07-16 20:53 朝南烟 阅读(218) 评论(0) 推荐(0) 编辑
摘要:1、线性回归 线性回归输出是一个连续值,因此适用于回归问题。回归问题在实际中很常见,如预测房屋价格、气温、销售额等连续值的问题。与回归问题不同,分类问题中模型的最终输出是一个离散值。我们所说的图像分类、垃圾邮件识别、疾病检测等输出为离散值的问题都属于分类问题的范畴。softmax回归则适用于分类问题 阅读全文
posted @ 2022-07-16 19:34 朝南烟 阅读(391) 评论(0) 推荐(0) 编辑
摘要:本周收获 总结一下本周学习内容: 1、《深入浅出Pandas》的第14章:Pandas时序数据 14.1 固定时间 14.2 时长数据 14.3 时间序列 :car:博客: Pandas:时序数据(上) 2、《机器学习》第7章:贝叶斯分类器 7.1 贝叶斯决策论 7.2 极大似然估计 7.3 朴素贝 阅读全文
posted @ 2022-07-10 08:50 朝南烟 阅读(34) 评论(0) 推荐(0) 编辑
摘要:1、 贝叶斯决策论 贝叶斯决策论(Bayesian decision theory)是概率框架下实施决策的基本方法,对分类任务来说,在所有相关概率都已知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。 决策论中将“期望损失”称为“风险” (risk). 我们的任务就是寻 阅读全文
posted @ 2022-07-10 08:39 朝南烟 阅读(744) 评论(0) 推荐(0) 编辑
摘要:1、安装运行环境 工欲善其事,必先利其器,每次安装运行环境都让我头痛不已,因为总有一些莫名奇妙的问题。但这次根据书本上p9页的安装步骤,还算顺利。 1)、下载Ananconda 之前一直没安装这个Anaconda,这次实在没办法了,就找个教程一步一步安装。 附上我参考的博文:python与anaco 阅读全文
posted @ 2022-07-10 00:03 朝南烟 阅读(69) 评论(0) 推荐(0) 编辑
摘要:时间是一个比较特殊的事物,不像数字有具体的进制,可以做相关的计算。比如时间分秒时是60进制,时和天又是24进制,一周又有7天,一月又有28到31天不等,等等。这就给我们处理时间问题带来了麻烦。为了更好地表达现实世界中的时间,计算机设计者提出了一些概念来进行表达。 固定时间 这个非常简单,它是一个独立 阅读全文
posted @ 2022-07-09 20:03 朝南烟 阅读(131) 评论(0) 推荐(0) 编辑
摘要:本周收获 总结一下本周学习内容: 1、《深入浅出Pandas》的第12章:Pandas分类数据 12.1 分类数据 12.2 分类的操作 :car:博客: Pandas分类数据 2、《深入浅出Pandas》的第13章:Pandas窗口计算 13.1 窗口计算 13.2 窗口操作 :car:博客: P 阅读全文
posted @ 2022-07-03 10:12 朝南烟 阅读(33) 评论(0) 推荐(0) 编辑
摘要:1、间隔与支持向量 支持向量机(support vector machine)是一种经典的二分类模型,基本模型定义为特征空间中最大间隔的线性分类器,其学习的优化目标便是间隔最大化,因此支持向量机本身可以转化为一个凸二次规划求解的问题。 对于二分类学习,假设现在的数据是线性可分的,这时分类学习最基本的 阅读全文
posted @ 2022-07-03 09:52 朝南烟 阅读(275) 评论(0) 推荐(0) 编辑
摘要:1、窗口计算 Pandas 窗口函数,为了处理数字数据,Pandas 提供几种窗口函数,如移动窗口函数(rolling()),扩展窗口函数(expanding()),指数加权滑动(ewm()),同时可在基基础上调用适合的统计函数,如求和、中位数、均值、协方差、方差、相关性等。 rolling(10) 阅读全文
posted @ 2022-07-03 09:19 朝南烟 阅读(499) 评论(0) 推荐(0) 编辑
摘要:1、分类数据 1.1创建分类数据 1.2 pd.Categorical() pandas.Categorical 可以创建一个类型数据序列到 DataFrame 中: 1.3CategoricalDtype对象 CategoricalDtype 是 pandas 的类型数据对象,它可以传入以下参数: 阅读全文
posted @ 2022-07-03 09:14 朝南烟 阅读(131) 评论(0) 推荐(0) 编辑

body { color: #000; background-color: #e6e6e6; font-family: "Helvetica Neue",Helvetica,Verdana,Arial,sans-serif; font-size: 12px; min-height: 101%; background: url(https://images.cnblogs.com/cnblogs_com/caolanying/1841633/o_2009041…ly1geq8oc9owbj21hc0u0th5.jpg) fixed; } #home { margin: 0 auto; opacity: 0.8; width: 65%; min-width: 1080px; background-color: #fff; padding: 30px; margin-top: 50px; margin-bottom: 50px; box-shadow: 0 2px 6px rgba(100, 100, 100, 0.3); }
点击右上角即可分享
微信分享提示