07 2020 档案

摘要:K近邻算法(KNN,K-NearestNeighbor)是机器学习或数据分析中最基础、也是最简单的算法之一,这个算法的思路就如同它字面上的意思“K个最近的邻居”,想要得到某个样本的某个特征的值(一个样本通常有多个特征),就需要找到距离它最近的K个样本,然后根据这些样本的该特征的近似值作为它的特征值。 阅读全文
posted @ 2020-07-24 20:27 山上下了雪-bky 阅读(1342) 评论(0) 推荐(1) 编辑
摘要:Pandas是一个基于Numpy的数据分析包,这个库就是为数据分析而生的,你可以像操作Excel一样操作Pandas,实现数据的选择排序、筛选过滤、统计分析等功能,实际上,Pandas就是Python中的Excel,在学习Pandas之后你会更加深刻的理解这句话是多么的形象准确的。 为了简化表示,本 阅读全文
posted @ 2020-07-17 00:55 山上下了雪-bky 阅读(1675) 评论(2) 推荐(0) 编辑
摘要:Numpy是Python中用于处理数组的一个非常强大的库,同时也是Pandas等数据处理的库的核心,如果你有大量处理数组类型数据的操作,比如操作CSV文件数据或涉及数组的科学计算等,那么Numpy是一个非常好的选择。 注:此笔记中主要是以一维数组和二维数组作为示例,更高维的数组因为用的较少,同时原理 阅读全文
posted @ 2020-07-12 19:01 山上下了雪-bky 阅读(1113) 评论(0) 推荐(0) 编辑