摘要: ##线性回归的可解释性和更多的思考和线性回归的总结 我们知道线性回归是具有可解释性的,用操作来解释什么是可解释性 在notebook中 使用波士顿数据,划分好范围 import numpy as np import matplotlib.pyplot as plt from sklearn impo 阅读全文
posted @ 2021-01-15 17:32 DbWong_0918 阅读(368) 评论(0) 推荐(0) 编辑
摘要: ##使用sklearn解决回归问题 依然是加载数据 import numpy as np import matplotlib.pyplot as plt from sklearn import datasets boston = datasets.load_boston() X = boston.d 阅读全文
posted @ 2021-01-15 17:29 DbWong_0918 阅读(343) 评论(0) 推荐(0) 编辑
摘要: ##多元线性回归和正规方程解 在真实世界中,真实的样本是有很多的特征值的,这种也是可以使用线性回归解决的,通常我们称这种为多元线性回归问题 我们设一个样本的特征为xi,则 那么对应的y就是 这种直线仍然有截距,即 如果我们可以学习到这多个样本的话,那么我们就可以求出我们的多元线性回归对应的预测值 与 阅读全文
posted @ 2021-01-15 17:23 DbWong_0918 阅读(902) 评论(0) 推荐(0) 编辑
摘要: ##衡量线性回归法的指标 MSE,RMS,MAE以及评价回归算法 R Square ###衡量线性回归法的指标 对于分类问题来说,我们将原始数据分成了训练数据集和测试数据集两部分,我们使用训练数据集得到模型以后使用测试数据集进行测试然后和测试数据集自带的真实的标签进行对比,那么这样一来,我们就得到了 阅读全文
posted @ 2021-01-15 17:16 DbWong_0918 阅读(1741) 评论(0) 推荐(0) 编辑
摘要: ##简单的线性回归的实现以及向量化的实现 ###简单的线性回归的实现 首先我们在notebook上先加载上相应的库 import numpy as np import matplotlib.pyplot as plt 我们先使用自己设计的一个假的数据来实验 x = np.array([1,2,3,4 阅读全文
posted @ 2021-01-15 16:57 DbWong_0918 阅读(441) 评论(0) 推荐(0) 编辑
摘要: ##文件添加新的类以后notebook查询不到 在使用jupyter notebook的时候 当在自己写的函数库中新增了新的函数名或类想要调用的时候却一直提醒没有找到这个内容 Cannot import name 可以先试试重启并编译全部内容 有可能是因为之前你使用过这个py文件,导致其内容已经放在 阅读全文
posted @ 2021-01-15 16:46 DbWong_0918 阅读(93) 评论(0) 推荐(0) 编辑
摘要: ##线性回归算法 特点线性回归算法的特点: 其解决的是回归问题 其思想简单,实现容易 有许多强大的非线性模型的基础 结果具有很好的可解释性 蕴含机器学习中的很多的重要的思想 ###什么是线性回归算法呢 设立一个有横纵坐标的二维坐标系,在各个样本之间,我们寻找一条直线,最大程度的“拟合”样本特征和样本 阅读全文
posted @ 2021-01-14 17:36 DbWong_0918 阅读(212) 评论(0) 推荐(0) 编辑
摘要: ##更多的关于k近邻算法的思考 KNN(K- Nearest Neighbor)法即K最邻近法,数据挖掘分类技术中最简单的方法之一 对k近邻算法的总结: ####优点部分 其可以解决分类问题,同时可以天然的解决多分类问题 其具备着思想简单,效果强大优点 同时,还可以使用k近邻算法来解决回归问题 对于 阅读全文
posted @ 2021-01-14 15:59 DbWong_0918 阅读(486) 评论(0) 推荐(0) 编辑
摘要: ##scikit-learn中的数据归一化 在机器学习使用数据归一化的时候有一个重要的注意事项 我们对训练数据进行均值和方差的处理,得到mean_train以及std_train,但是在对测试数据进行归一化的时候,是不能直接用测试数据的均值和方差来进行归一化的,应该使用训练数据的均值和方差对测试数据 阅读全文
posted @ 2021-01-14 15:53 DbWong_0918 阅读(761) 评论(0) 推荐(0) 编辑
摘要: ##数据归一化 feature scaling 在分类的时候需要进行数据归一化 那么为什么要进行数据归一化? 像是肿瘤情况,当时间单位是天,大小单位是厘米,由于时间的跨度比大小的跨度差值大的太多,会导致样本间的距离被时间所主导,同理,将时间变成以年为单位一样会因为差值太大而导致模型不行 所谓的数据归 阅读全文
posted @ 2021-01-14 15:47 DbWong_0918 阅读(954) 评论(0) 推荐(0) 编辑