07 2020 档案
摘要:K近邻算法(KNN,K-NearestNeighbor)是机器学习或数据分析中最基础、也是最简单的算法之一,这个算法的思路就如同它字面上的意思“K个最近的邻居”,想要得到某个样本的某个特征的值(一个样本通常有多个特征),就需要找到距离它最近的K个样本,然后根据这些样本的该特征的近似值作为它的特征值。
阅读全文
摘要:Pandas是一个基于Numpy的数据分析包,这个库就是为数据分析而生的,你可以像操作Excel一样操作Pandas,实现数据的选择排序、筛选过滤、统计分析等功能,实际上,Pandas就是Python中的Excel,在学习Pandas之后你会更加深刻的理解这句话是多么的形象准确的。 为了简化表示,本
阅读全文
摘要:Numpy是Python中用于处理数组的一个非常强大的库,同时也是Pandas等数据处理的库的核心,如果你有大量处理数组类型数据的操作,比如操作CSV文件数据或涉及数组的科学计算等,那么Numpy是一个非常好的选择。 注:此笔记中主要是以一维数组和二维数组作为示例,更高维的数组因为用的较少,同时原理
阅读全文