随笔分类 -  数据分析

python数据分析三件套的用法
摘要:" " 1. k近邻(knn) 1.1 步骤: 1.随机选择k个样本作为初始均值向量; 2.计算样本到各均值向量的距离,把它划到距离最小的簇; 3.计算新的均值向量; 4.迭代,直至均值向量未更新或到达最大次数。 优点: 1. 原理比较简单,实现也是很容易; 2. 算法的可解释度比较强; 3. 调参 阅读全文
posted @ 2019-12-13 11:28 Geoffrey_one 阅读(660) 评论(0) 推荐(0) 编辑
摘要:一个小案例,爬取的足球运动员数据,进行载入,预处理和初步绘图分析 详细查看请点击 阅读全文
posted @ 2018-11-09 18:06 Geoffrey_one 阅读(172) 评论(0) 推荐(0) 编辑
摘要:为方便查看,请点击链接,使用Jupyter notebook打开。 阅读全文
posted @ 2018-11-07 22:34 Geoffrey_one 阅读(184) 评论(0) 推荐(0) 编辑
摘要:为了更加清楚显示,请点击 "链接" 用Jupyter Notebook 查看:截图如下, 阅读全文
posted @ 2018-11-07 19:58 Geoffrey_one 阅读(145) 评论(0) 推荐(0) 编辑
摘要:数据加载 首先,我们需要将收集的数据加载到内存中,才能进行进一步的操作。pandas提供了非常多的读取数据的函数,分别应用在各种数据源环境中,我们常用的函数为: read_csv read_table read_sql q 1.1 加载csv数据 header 表标题,可以使用整形和或者整形列表来指 阅读全文
posted @ 2018-11-07 18:52 Geoffrey_one 阅读(413) 评论(0) 推荐(0) 编辑
摘要:1. 转换为灰度图 灰度图的数据可以看成是二维数组,元素取值为0 ~ 255,其中,0为黑色,255为白色。从0到255逐渐由暗色变为亮色。 灰度图转换(ITU R 601 2亮度变换): L = R \ 299 / 1000 + G \ 587 / 1000 + B \ 114 / 1000 R, 阅读全文
posted @ 2018-11-02 18:52 Geoffrey_one 阅读(8314) 评论(0) 推荐(0) 编辑
摘要:一、数组的创建 1. 创建二维数组 array([[1, 2, 3], [4, 6, 8]]) 数组宽度需要一致 array([list([1, 2, 3]), list([4, 6, 8, 7])], dtype=object) 2. 和python类似的range()函数 array([2. , 阅读全文
posted @ 2018-11-01 17:22 Geoffrey_one 阅读(219) 评论(0) 推荐(0) 编辑
摘要:今天使用dlib没有py37版本,因此创建了Version_36虚拟环境。但jupyter notebook默认的内核找不到新建的虚拟环境,解决方法是需要安装两个包: × ipykernel × nb_conda 安装完成后效果如下: 阅读全文
posted @ 2018-10-31 16:38 Geoffrey_one 阅读(2882) 评论(0) 推荐(0) 编辑
摘要:颜色空间 标签(空格分隔): 计算机视觉 颜色通常用三个独立的属性来描述,三个独立变量综合作用,自然就构成一个空间坐标,这就是颜色空间。 RGB和CMY颜色模型都是面向硬件的,而HSV(Hue Saturation Value)颜色模型是面向用户的。 1. RGB 在RGB颜色空间中,任意色光F都可 阅读全文
posted @ 2018-10-31 12:21 Geoffrey_one 阅读(838) 评论(0) 推荐(0) 编辑

/*
*/
主题色彩
点击右上角即可分享
微信分享提示