摘要:
因数指,如果有整数a、b、c,使得a*b=c,则称a和b为c得因数,c为a和b的倍数。换个方向理解呢,相当于能将整数c整除的所有数都是c的因数。 延伸出来的,有公因数,指某一整数a同时是b和c的因数,及能同时将b和c整除。 在什么地方用呢,比如如何求最大公因数(最大公约数): 辗转相除法(欧几里得算 阅读全文
摘要:
茎叶图,又叫枝叶图。主要思路是将数据分成主干和分支两部分,再按照主干进行分类,这样就能大致的看出数据的分布情况。 话不多说,直接上: 图: 这里的数据,就是十位和个位,总的数据为:2,10,15,20,23,27。得知,该样本在20-30间的数值最多。 一般多的展示两组数据,三组以上就不方便看了。 阅读全文
摘要:
#一日一词# 众数是在一组数据中,出现次数最多的数据,一组数据中的众数可以不止一个。 作用呢,也是作为描述性统计的一个指标,用来描述数据的分布情况。 众数不受极端值影响,尤其是在整体数据变动较大的情况下,众数更能描述数据的“集中趋势”。 相似延伸:众数不仅在数值型数据中可以使用,在文本数据中也可以。 阅读全文
摘要:
#一日一词# 离差:指单项数值和平均值的差,正负可以作为方向。用来反映某一数值与平均值的偏离程度(距离)。 离差平方和,就是每个数据与平均数差的平方的和。 通常呢,离差都是用来求标准差和方差的。 标准差(sd):用来反映样本数据离散程度的指标。多用来反映样本是否“稳重”。比如一学生整个学期的数学成 阅读全文
摘要:
#一日一词# 指一个样本中,将整体数据按数值大小排列,能将整体划分为个数相等的两部分的书,一般取顺序排列的数组中间一个数或者中间两个数的平均值。 有啥用? 也是作为描述性统计中重要一个指标,主要是用来描述样本的分布情况,尤其是在数据的极差较大、偏斜度较高的情况下。 但是光从平均数和中位数来看样本分 阅读全文
摘要:
#一日一词# 含义内容:平均数包括三种:算术平均数(最常见的),集合平均数,调和平均数。用Excel中的AVERAGE函数可以求出(Average)。 分开来说; 算术平均数(mean):又称均值。计算方法即是将n个样本相加除以n,一般用表示。公式就不写了,博客写公式只能用图片,懒。 几何平均数( 阅读全文
摘要:
前两天写了几个函数,对里面收获到的一些东西做一些记录。 函数str_comb,用于输入一个字符串或数值向量,返回由向量中元素组成的不重复的长度小于向量长度的所有组合,结果用矩阵形式输出。 函数使用结果如下: 思路很简单,在R中有个函数combn函数,能产生指定向量中元素组成的指定长度的组合,这个函数 阅读全文
摘要:
写图片摘要(选填) 写图片摘要(选填) 阅读全文
摘要:
#小魔仙 #参考:美Brett Lantz的《机器学习与R语言》,周志华老师的《机器学习》 #仅供个人学习用 #比较长和啰嗦,提醒自己:最好使用电脑看,手机看长篇大论总是不太合适 这两天学R与机器学习,真心赶脚R太简单化了,转到吴恩达老师的课时,又觉得脑子转不过来,基础没打好。关于决策树,首先 阅读全文
摘要:
名词: 挖掘数据集:购物篮数据 挖掘目标:关联规则 关联规则:啤酒=>尿布(支持度0.02,置信度0.6) 支持度:所有数据中有2%的购物记录包含了啤酒和尿布 置信度:所有包含啤酒的购物记录里有60%包含尿布 最小支持度阈值和最小置信度阈值。 项集:项(商品)组成的集合 K-项集:k个项组成的集合 阅读全文