摘要:
阅读全文
摘要:
阅读全文
摘要:
正则化 --在原有损失函数的基础上加上一个正则化项 通常用到的有均方根误差rmse和平均绝对误差mae 通过限制参数过多或者过大,避免模型更加复杂,简单来说就是降低模型的泛化错误率,避免模型过拟合 L1与L2的区别 L1可以实现让参数矩阵稀疏, 且L1正则化的损失函数不不是连续可导的, L2也称岭回 阅读全文
摘要:
逻辑回归算法原理和推导https://blog.csdn.net/kun_csdn/article/details/88876524 优缺点 http://mini.eastday.com/bdmip/190222014114424.html# https://blog.csdn.net/hzqga 阅读全文
摘要:
数据分析的步骤 1.定义问题,明确需要解决的需求是什么。 2.问题拆分。对于最终需要解决或探索的问题,进行细分,拆分成不同层面的问题。 3.确定指标。根据不同的细分问题,确定需要探索的指标 4.数据收集。收集整理分析项目所需的数据。 5.数据清洗。删除重复数据,异常值,缺失值处理她,特征筛选,数据归 阅读全文
摘要:
什么是聚类分析?聚类算法有哪几种?请选择一种详细描述其计算原理和步骤 聚类分析是一种无监督的学习方法,将一系列有特征无标签的数据划分成有意义或者有用的组(或簇),探索每个组的数据是否有联系. 典型的聚类算法有KMeans,DBSCAN,层次聚类,光谱聚类等. KMeans算法的计算原理:根据我们设定 阅读全文