摘要: 特征和目标之间存在非线性关系,建模变得很困难 ⭐log和exp函数可以帮助调节数据的相对比例,改进线性模型或者神经网络的学习效果 ⭐大部分模型在每个特征遵循高斯分布时表现很好 ⭐在处理整数计数数据时,这种log,exp变换非常有用 1、模拟一些数据 模拟钟形分布的数据 from sklearn.li 阅读全文
posted @ 2022-05-13 13:32 朝南烟 阅读(175) 评论(0) 推荐(0) 编辑
摘要: ⭐想要丰富特征表示,可以通过添加原始数据的交互特征和多项式特征,尤其是对于线性模型而言。 如果想向分箱数据(4.2的内容)上的线性模型添加斜率:1、加入原始特征(图中的X轴),2、添加交互特征或乘积特征 1、加入原始特征 # 向分箱数据中加入原始特征 X,y = mglearn.datasets.m 阅读全文
posted @ 2022-05-13 11:28 朝南烟 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 1、线性模型与决策树在wave数据集上的表现 ⭐数据表示的最佳方法不仅取决于数据的语义,还取决于所使用的模型种类。 线性模型与基于树的模型(决策树、梯度提升树、随机森林)很常用的模型,但他们在处理不同特征表示时具有非常不同的性质。 ⭐下面是线性回归和决策树在make_wave数据集中的对比 impo 阅读全文
posted @ 2022-05-13 11:00 朝南烟 阅读(259) 评论(0) 推荐(0) 编辑
body { color: #000; background-color: #e6e6e6; font-family: "Helvetica Neue",Helvetica,Verdana,Arial,sans-serif; font-size: 12px; min-height: 101%; background: url(https://images.cnblogs.com/cnblogs_com/caolanying/1841633/o_2009041…ly1geq8oc9owbj21hc0u0th5.jpg) fixed; } #home { margin: 0 auto; opacity: 0.8; width: 65%; min-width: 1080px; background-color: #fff; padding: 30px; margin-top: 50px; margin-bottom: 50px; box-shadow: 0 2px 6px rgba(100, 100, 100, 0.3); }