ziyuliu - 博客园

2021年2月4日

第六讲取其精华、去其糟粕--降维-----学习总结

摘要：第六讲取其精华、去其糟粕--降维阅读全文

posted @ 2021-02-04 23:23 ziyuliu 阅读(88) 评论(0) 推荐(0)

2021年2月3日

第五讲物以类聚，人以群分--聚类-----学习总结

摘要： 00 阅读全文

posted @ 2021-02-03 23:39 ziyuliu 阅读(67) 评论(0) 推荐(0)

2021年2月2日

第四讲三个臭皮匠，顶个诸葛亮--模型提升-----学习总结

摘要： .. 阅读全文

posted @ 2021-02-02 00:23 ziyuliu 阅读(62) 评论(0) 推荐(0)

2021年2月1日

主成分分析

摘要：主成分分析什么是主成分分析(PCA) 定义：高维数据转化为低维数据的过程，在此过程中可能会舍弃原有数据、创造新的变量作用：是数据维数压缩，尽可能降低原数据的维数（复杂度），损失少量信息。应用：回归分析或者聚类分析当中 API sklearn.decomposition.PCA(n_compon 阅读全文

posted @ 2021-02-01 17:39 ziyuliu 阅读(519) 评论(0) 推荐(0)

2021年1月31日

特征降维

摘要：定义：降维是指在某些限定条件下，降低随机变量(特征)个数，得到一组“不相关”主变量的过程降维的两种方式特征选择主成分分析（可以理解一种特征提取的方式）什么是特征选择定义：数据中包含冗余或无关变量（或称特征、属性、指标等），旨在从原有特征中找出主要特征。方法： Filter(过滤式)：主要阅读全文

posted @ 2021-01-31 18:54 ziyuliu 阅读(621) 评论(0) 推荐(0)

2021年1月30日

架构之美阅读笔记03

摘要：在后来的章节中，又介绍了“混乱大都市”和“设计之城”两个项目，将两种比较，形象的说出了好的架构与差的架构的一些特性。“混乱大都市”的最大问题是重复，它没有考虑好软件设计中最关键的品质，内聚和耦合。它的失败经验很值得我们借鉴：缺乏预见性和对架构的整体思考。版本的发布周期过于漫长；系统没有弹性，可扩展性阅读全文

posted @ 2021-01-30 21:41 ziyuliu 阅读(54) 评论(0) 推荐(0)

特征工程-数据预处理---归一化和标准化

摘要：特征预处理通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程包含内容数值型数据的无量纲化：归一化标准化特征预处理API sklearn.preprocessing 为什么我们要进行归一化/标准化？特征的单位或者大小相差较大，或者某特征的方差相比其他的特征要大出几个数量级，容阅读全文

posted @ 2021-01-30 02:07 ziyuliu 阅读(534) 评论(0) 推荐(0)

2021年1月29日

第三讲分门别类，各得其所--分类-----学习总结

摘要：点到平面距离梯度下降法梯度是方向导数中的最大值，梯度一定是函数上升的方向，最小值为0，即到达山顶随机梯度下降法感知机、支持向量机和逻辑回归感知机感知机的优化目标感知机算法（SGD）支持向量机：间隔最大化支持向量机：样本损失函数优化目标逻辑回归：赋予样本概率解释似然函数和负阅读全文

posted @ 2021-01-29 23:18 ziyuliu 阅读(163) 评论(0) 推荐(0)

2021年1月28日

第二讲回归初心，方得始终--回归-----学习总结

摘要： plt.figure(figsize=(9, 6)) y_train_pred_ridge = ridge.predict(X_train[features_without_ones]) plt.scatter(y_train_pred_ridge, y_train_pred_ridge - y_t 阅读全文

posted @ 2021-01-28 23:53 ziyuliu 阅读(411) 评论(0) 推荐(0)

pandas文件读取

摘要：文件读取与存储我们的数据大部分存在于文件当中，所以pandas会支持复杂的IO操作，pandas的API支持众多的文件格式，如CSV、SQL、XLS、JSON、HDF5。 CSV 读取：read_csv pandas.read_csv(filepath_or_buffer, sep =',', u 阅读全文

posted @ 2021-01-28 23:04 ziyuliu 阅读(659) 评论(0) 推荐(0)

Flamel

公告