摘要: 因数指,如果有整数a、b、c,使得a*b=c,则称a和b为c得因数,c为a和b的倍数。换个方向理解呢,相当于能将整数c整除的所有数都是c的因数。 延伸出来的,有公因数,指某一整数a同时是b和c的因数,及能同时将b和c整除。 在什么地方用呢,比如如何求最大公因数(最大公约数): 辗转相除法(欧几里得算 阅读全文
posted @ 2017-02-09 20:26 隔壁老任 阅读(367) 评论(0) 推荐(0) 编辑
摘要: 茎叶图,又叫枝叶图。主要思路是将数据分成主干和分支两部分,再按照主干进行分类,这样就能大致的看出数据的分布情况。 话不多说,直接上: 图: 这里的数据,就是十位和个位,总的数据为:2,10,15,20,23,27。得知,该样本在20-30间的数值最多。 一般多的展示两组数据,三组以上就不方便看了。 阅读全文
posted @ 2017-02-09 20:25 隔壁老任 阅读(3322) 评论(0) 推荐(0) 编辑
摘要: #一日一词# 众数是在一组数据中,出现次数最多的数据,一组数据中的众数可以不止一个。 作用呢,也是作为描述性统计的一个指标,用来描述数据的分布情况。 众数不受极端值影响,尤其是在整体数据变动较大的情况下,众数更能描述数据的“集中趋势”。 相似延伸:众数不仅在数值型数据中可以使用,在文本数据中也可以。 阅读全文
posted @ 2017-02-09 20:24 隔壁老任 阅读(438) 评论(0) 推荐(0) 编辑
摘要: #一日一词# ​离差:指单项数值和平均值的差,正负可以作为方向。用来反映某一数值与平均值的偏离程度(距离)。 离差平方和,就是每个数据与平均数差的平方的和。 通常呢,离差都是用来求标准差和方差的。 标准差(sd):用来反映样本数据离散程度的指标。多用来反映样本是否“稳重”。比如一学生整个学期的数学成 阅读全文
posted @ 2017-02-09 20:24 隔壁老任 阅读(22639) 评论(0) 推荐(0) 编辑
摘要: #一日一词# 指​一个样本中,将整体数据按数值大小排列,能将整体划分为个数相等的两部分的书,一般取顺序排列的数组中间一个数或者中间两个数的平均值。 有啥用? 也是作为描述性统计中重要一个指标,主要是用来描述样本的分布情况,尤其是在数据的极差较大、偏斜度较高的情况下。 但是光从平均数和中位数来看样本分 阅读全文
posted @ 2017-02-09 20:23 隔壁老任 阅读(350) 评论(0) 推荐(0) 编辑
摘要: #一日一词# ​含义内容:平均数包括三种:算术平均数(最常见的),集合平均数,调和平均数。用Excel中的AVERAGE函数可以求出(Average)。 分开来说; 算术平均数(mean):又称均值。计算方法即是将n个样本相加除以n,一般用表示。公式就不写了,博客写公式只能用图片,懒。 几何平均数( 阅读全文
posted @ 2017-02-09 20:22 隔壁老任 阅读(732) 评论(0) 推荐(0) 编辑
摘要: 写图片摘要(选填) 写图片摘要(选填) 阅读全文
posted @ 2017-02-09 20:21 隔壁老任 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 前两天写了几个函数,对里面收获到的一些东西做一些记录。 函数str_comb,用于输入一个字符串或数值向量,返回由向量中元素组成的不重复的长度小于向量长度的所有组合,结果用矩阵形式输出。 函数使用结果如下: 思路很简单,在R中有个函数combn函数,能产生指定向量中元素组成的指定长度的组合,这个函数 阅读全文
posted @ 2017-02-09 20:21 隔壁老任 阅读(6196) 评论(1) 推荐(0) 编辑
摘要: #小魔仙 ​#参考:美Brett Lantz的《机器学习与R语言》,周志华老师的《机器学习》 #仅供个人学习用 #比较长和啰嗦,提醒自己:最好使用电脑看,手机看长篇大论总是不太合适 ​ 这两天学R与机器学习,真心赶脚R太简单化了,转到吴恩达老师的课时,又觉得脑子转不过来,基础没打好。关于决策树,首先 阅读全文
posted @ 2017-02-09 20:20 隔壁老任 阅读(795) 评论(0) 推荐(0) 编辑
摘要: (学*笔记,来源于美Brett Lantz著,李洪成译的《机器学*与R语言》) 也应当和算法学*类似,首先搞清楚算法/方法的原理,再考虑实现问题。 1、邻*分类概念 首先已经看出来这是用于分类的一类方法,不是某一个算法,原理是先把训练数据进行训练并标记,然后将未标记的案例归类为与之最相*的已标记的案 阅读全文
posted @ 2017-02-09 20:18 隔壁老任 阅读(652) 评论(0) 推荐(0) 编辑