上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 27 下一页
摘要: 第六讲 取其精华、去其糟粕--降维 阅读全文
posted @ 2021-02-04 23:23 ziyuliu 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 00 阅读全文
posted @ 2021-02-03 23:39 ziyuliu 阅读(62) 评论(0) 推荐(0) 编辑
摘要: .. 阅读全文
posted @ 2021-02-02 00:23 ziyuliu 阅读(53) 评论(0) 推荐(0) 编辑
摘要: 主成分分析 什么是主成分分析(PCA) 定义:高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量 作用:是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。 应用:回归分析或者聚类分析当中 API sklearn.decomposition.PCA(n_compon 阅读全文
posted @ 2021-02-01 17:39 ziyuliu 阅读(375) 评论(0) 推荐(0) 编辑
摘要: 定义:降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程 降维的两种方式 特征选择 主成分分析(可以理解一种特征提取的方式) 什么是特征选择 定义:数据中包含冗余或无关变量(或称特征、属性、指标等),旨在从原有特征中找出主要特征。 方法: Filter(过滤式):主要 阅读全文
posted @ 2021-01-31 18:54 ziyuliu 阅读(518) 评论(0) 推荐(0) 编辑
摘要: 在后来的章节中,又介绍了“混乱大都市”和“设计之城”两个项目,将两种比较,形象的说出了好的架构与差的架构的一些特性。“混乱大都市”的最大问题是重复,它没有考虑好软件设计中最关键的品质,内聚和耦合。它的失败经验很值得我们借鉴:缺乏预见性和对架构的整体思考。版本的发布周期过于漫长;系统没有弹性,可扩展性 阅读全文
posted @ 2021-01-30 21:41 ziyuliu 阅读(41) 评论(0) 推荐(0) 编辑
摘要: 特征预处理 通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程 包含内容 数值型数据的无量纲化: 归一化 标准化 特征预处理API sklearn.preprocessing 为什么我们要进行归一化/标准化? 特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容 阅读全文
posted @ 2021-01-30 02:07 ziyuliu 阅读(435) 评论(0) 推荐(0) 编辑
摘要: 点到平面距离 梯度下降法 梯度是方向导数中的最大值,梯度一定是函数上升的方向, 最小值为0, 即到达山顶 随机梯度下降法 感知机、支持向量机和逻辑回归 感知机 感知机的优化目标 感知机算法(SGD) 支持向量机:间隔最大化 支持向量机:样本损失函数 优化目标 逻辑回归:赋予样本概率解释 似然函数和负 阅读全文
posted @ 2021-01-29 23:18 ziyuliu 阅读(139) 评论(0) 推荐(0) 编辑
摘要: plt.figure(figsize=(9, 6)) y_train_pred_ridge = ridge.predict(X_train[features_without_ones]) plt.scatter(y_train_pred_ridge, y_train_pred_ridge - y_t 阅读全文
posted @ 2021-01-28 23:53 ziyuliu 阅读(331) 评论(0) 推荐(0) 编辑
摘要: 文件读取与存储 我们的数据大部分存在于文件当中,所以pandas会支持复杂的IO操作,pandas的API支持众多的文件格式,如CSV、SQL、XLS、JSON、HDF5。 CSV 读取:read_csv pandas.read_csv(filepath_or_buffer, sep =',', u 阅读全文
posted @ 2021-01-28 23:04 ziyuliu 阅读(601) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 27 下一页