文章分类 - 机器学习实战
机器学习笔记
摘要:https://www.cnblogs.com/hunttown/p/5757886.html 1、方差:就是和中心偏离的程度!用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差。标准差是方差平方根。 公式: 举例:比如1.2.3.4.5 这五个数的平均数是3 方差就是
阅读全文
摘要:https://blog.csdn.net/starter_____/article/details/81365771 apply() apply()会将待处理的对象拆分成多个片段,然后对各片段调用传入的函数,最后尝试将各片段组合到一起。 用DataFrame的apply方法,可以将函数应用到由各列
阅读全文
摘要:https://blog.csdn.net/xiaocong1990/article/details/71267144 来源: 看两者是否算相关要看两方面:显著水平以及相关系数(1)显著水平,就是P值,这是首要的,因为如果不显著,相关系数再高也没用,可能只是因为偶然因素引起的,那么多少才算显著,一般
阅读全文
摘要:pandas加载文件方式: 注意,read_csv和read_table都是是加载带分隔符的数据,每一个分隔符作为一个数据的标志,但二者读出来的数据格式还是不一样的,read_table是以制表符 \t 作为数据的标志,也就是以行为单位进行存储。 read_csv 与 read_table 的区别
阅读全文
摘要:本文链接:https://blog.csdn.net/lllxxq141592654/article/details/81532855一句话解释numpy.meshgrid()——生成网格点坐标矩阵。关键词:网格点,坐标矩阵 网格点是什么?坐标矩阵又是什么鬼?看个图就明白了: 图中,每个交叉点都是网
阅读全文
摘要:来源: https://blog.csdn.net/qq_18989901/article/details/73142472 利用Python进行数据分析时,Numpy是最常用的库,经常用来对数组、矩阵等进行转置等,有时候用来做数据的存储。 在numpy中,转置transpose和轴对换是很基本的操
阅读全文
摘要:参考: https://www.cnblogs.com/Shawnyi/p/10370815.html
阅读全文
摘要:来源:https://www.cnblogs.com/Yanjy-OnlyOne/p/11195621.html 一、概述 1.1 什么是透视表? 透视表是一种可以对数据动态排布并且分类汇总的表格格式。或许大多数人都在Excel使用过数据透视表,也体会到它的强大功能,而在pandas中它被称作piv
阅读全文
摘要:上面代码主要为创建测试数据以及分类器 上面代码为P21-P24内容探索 上面为P25归一化代码比较简单主要是套用公式 newValue = (oldValue-min)/(max-min) 上面部分为约会网站最终测试分类成功率的代码在书里P27 下面代码为P28页完整使用各种方法分辨手写数字的函数,
阅读全文
摘要:链接:https://www.zhihu.com/question/26726794/answer/544818558 问题中涉及的几个算法都是数据分类的基本技术,其实当样本数据质量很好的时候,各个算法结果之间的差异不会特别大。这个时候可以根据样本的分布特点和具体要解决的业务问题等信息,选择一个或者
阅读全文
摘要:本文链接:https://blog.csdn.net/u012005313/article/details/49153261 《Machine Learning in Action》第二章 #######################################################
阅读全文