摘要:
DataFrame是一个二维标签数据结构,有行和列 可以看作是一个excel表格 创建: 1,横向创建 这种就是字典的方式 什么时候需要这种呢? 需要字典进行映射,然后要将结果转excel。那就需要这种方式 2,列向创建 这种就是列表的方式 阅读全文
摘要:
缺失值 判断各个单元格是否为空。 isnull() 判断各个单元格是否为空 删除包含缺失值的行 df.dropna(inplace=True) 填充缺失值 # 填充缺失值为指定值,例如0 df.fillna(0, inplace=True) # 或者填充缺失值为列的均值 df.fillna(df.m 阅读全文
摘要:
定义:KNN最核心的功能“分类”是通过多数表决来完成的,具体方法是在待分类点的K个最近邻中查看哪个类别占比最多。哪个类别多,待分类点就属于哪个类别 如果选择K=3,那么模型将考虑目标数据点的3个最近邻居, 对于图像的分类。他的邻居是什么 每个图像样本通常会被表示为一个特征向量,其中每个特征可以代表图 阅读全文
摘要:
K均值聚类算法是一种用于将数据集中的数据点分成不同组的方法。这些组通常称为簇。这个算法的核心思想是把相似的数据点放在同一个簇中,从而把数据分成几个组,每个组内的数据点彼此相似。 这是一个简单的K均值聚类过程: 选择簇的数量(K):首先,将数据分成k个簇。 随机选择K个点作为初始簇中心:从数据集中随机 阅读全文
摘要:
分类算法是一类监督学习算法,用于将数据点分为预定义的类别或标签之一。在分类问题中,算法通过学习从已知输入数据到其对应类别的映射来训练模型,然后使用该模型来对新的、未标记的数据进行分类。分类问题通常涉及到预测离散的输出,即将数据分为几个互斥的类别之一。 以下是一些常见的分类算法: 逻辑回归(Logis 阅读全文
摘要:
总结来说,监督学习侧重于从带有标签的数据中学习预测模型,用于分类或回归等任务,而非监督学习侧重于从未标记的数据中发现数据的内在结构和模式。这两种学习方式在机器学习中都具有重要作用,具体选择哪种取决于任务的性质和数据的特点 监督学习(Supervised Learning): 任务:监督学习是一种有监 阅读全文