随笔分类 - AI 机器学习
摘要:引言 将一枚硬币随机投掷次,其中正面朝上的次数为次,请估计硬币在一次随机投掷中,正面向上的概率为多少 频率学派:概率就是频率的极限,因此的估计值就是 贝叶斯学派:根据的先验分布、似然函数和观测值,再利用贝叶斯公式,就可以得到的后验
阅读全文
摘要:该项目主要包含以下四个步骤步骤 1.数据理解 2.数据预处理 3.数据建模 数据集可以在kaggle网站下载,也可以到博主的网盘下载 背景介绍 根据titanic乘客的信息预测其是否能存活 titanic数据集的样本共有11个特征,分别为 PassengerId:乘客的编号Pclass:船舱的等级N
阅读全文
摘要:特征选择 特征选择的原因:在数据集的多个特征中,可能存在一些特征属于冗余(意义重复的特征)或噪声(与标签无关的特征)
阅读全文
摘要:交叉验证:为了得到较为可靠的测试结果,测试集的样本数量不能太少,但在总体样本数量较少的情况下,如果拿出足够数量的样本组成测试集,则训练集样本会不足,此时可以使用交叉验证的方法(轮流取不同的样本做测试集),就不必担心测试集样本太少,极端情况下可取测试集样本数量为一,称为留一法。使用交叉验证可以在总样本
阅读全文