摘要: #今天花了半天研究,终于搞明白一些,高兴之余,借此经验,以免再忘。 #注意,此方法对xgboost包时,还需要加其他步骤,还没研究清楚,xgboost比较麻烦,此方法适合大部分 #先看完,在操作,不然会坑 首先说下我的环境:win7 64位,Python 2.7,用的PyCharm IDE。 我是在 阅读全文
posted @ 2017-02-09 20:43 隔壁老任 阅读(2254) 评论(0) 推荐(0) 编辑
摘要: Word害我重写=_=顺便重新整理下思路 背景:写论文时用到遗传算法,花了近一周时间,还算理解了算法以及能够进行基础的编程实现(保持谦虚)。 说明:具体的实现没敢细讲,主要是原理的方法上的介绍(讲解都算不上)。 先说说算法学习,个人觉得首先需要了解这个算法是拿来干嘛的,然后学习它的理论原理,多看懂几 阅读全文
posted @ 2017-02-09 20:41 隔壁老任 阅读(19993) 评论(4) 推荐(1) 编辑
摘要: #一日一词# 最优问题: 简单说,最优问题就是求一个多元函数在某个给定集合上的极值(及一个函数在一个自变量取值区间内的一个应变量极值)。集合所有类型的最优问题都可以表示为以下数学模型: 填写图片摘要(选 填写图片摘要(选 其中,K为某个给定的集合,称为可行集或可行域,f(x)为定义在集合K上的实值函 阅读全文
posted @ 2017-02-09 20:37 隔壁老任 阅读(660) 评论(0) 推荐(0) 编辑
摘要: #一日一词# 今天在学习Python的时候,遇到了递归问题,案例呢就是经典的汉诺塔游戏,表示虽然以前就接触过这游戏,解起来也很容易,不过放在编程里,几行的代码可够我手推了一个多小时。╭∩╮(︶︿︶)╭∩╮ 当然也是感受到了搞清楚一个(我认为的)难题的乐趣,心情大好,买条裤子。 (表示从晚上一直整理到 阅读全文
posted @ 2017-02-09 20:36 隔壁老任 阅读(351) 评论(0) 推荐(0) 编辑
摘要: #一日一词#(嗝屁啊( `д′)) 百度百科:随机变量(random variable)表示随机试验各种结果的实值单值函数。例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数等等,都是随机变量的实例。 某博客:设E是一个随机试验,其样本空间为S,若对每一个样本点e∈S,都有唯 阅读全文
posted @ 2017-02-09 20:31 隔壁老任 阅读(904) 评论(0) 推荐(0) 编辑
摘要: #一日一词# 欧几里德距离指多维空间中两点间的距离,它是在m维空间中两个点之间的真实距离,就是一种用直尺测量出来的距离。 如果两个点记为(p1,p2,p3,…)和(q1,q2,q3,…),则距离公式为: 欧氏距离看作信号的相似程度。距离越近就越相似,就越容易相互干扰,误码率就越高。具体说就是两个事物 阅读全文
posted @ 2017-02-09 20:30 隔壁老任 阅读(698) 评论(0) 推荐(0) 编辑
摘要: #一日一词# 在前一篇变异系数中,讲到不同样本不能直接比较其统计量。 在数据标准化中,首先说下针对不同组不同量纲的数据比较:样本数据标准化。如果比较两个样本中某一数值的大小,如班级中A同学的语文成绩和B两同学的数学成绩相比,谁更好?由于不能直接比较,(不能说语文108就没有数学123好)需要将样本数 阅读全文
posted @ 2017-02-09 20:30 隔壁老任 阅读(1523) 评论(0) 推荐(0) 编辑
摘要: #一日一词# 前一周找工作去了,整天累成狗 凸(艹皿艹 ),所以也没能做到一日一更,后续慢慢补上。( `д′) 结合之前的《标准差》 方差和标准差是用来反映一组数值变异程度的绝对值,其大小受到样本的值大小、计量单位等的影响,因此不能用于不同水平、不同计量单位的样本比较,即是说,针对来自不同总体的样本 阅读全文
posted @ 2017-02-09 20:29 隔壁老任 阅读(3122) 评论(0) 推荐(0) 编辑
摘要: #一日一词# 总体和样本 总体:指在某种共性的基础上由许多个别事物结合起来的整体。简言之总体是我们要调查或统计某一现象全部数据的集合。比如调查国内教师薪水情况中全中国的所有教师,调查某一高中高三学生成绩分布中所有的该校高三学生。(也是有一定范围的) 三大特点: ①同质性(共性)②大量性 ③差异性 总 阅读全文
posted @ 2017-02-09 20:28 隔壁老任 阅读(676) 评论(0) 推荐(0) 编辑
摘要: #一日一词# 素数,又叫质数,为在大于1的自然数中,除了1和它本身以外不再有其他因数的数。比如2、5、13。 合数,就是出素数以外的数,是除1和本身外还有其他因数的数。 作用? 作用大些的是素数,因为它很难找(指足够大的素数)。所以经常用在加密解密算法里,比如RSA算法。总之找一个足够大的素数和判断 阅读全文
posted @ 2017-02-09 20:27 隔壁老任 阅读(769) 评论(0) 推荐(0) 编辑
摘要: 因数指,如果有整数a、b、c,使得a*b=c,则称a和b为c得因数,c为a和b的倍数。换个方向理解呢,相当于能将整数c整除的所有数都是c的因数。 延伸出来的,有公因数,指某一整数a同时是b和c的因数,及能同时将b和c整除。 在什么地方用呢,比如如何求最大公因数(最大公约数): 辗转相除法(欧几里得算 阅读全文
posted @ 2017-02-09 20:26 隔壁老任 阅读(367) 评论(0) 推荐(0) 编辑
摘要: 茎叶图,又叫枝叶图。主要思路是将数据分成主干和分支两部分,再按照主干进行分类,这样就能大致的看出数据的分布情况。 话不多说,直接上: 图: 这里的数据,就是十位和个位,总的数据为:2,10,15,20,23,27。得知,该样本在20-30间的数值最多。 一般多的展示两组数据,三组以上就不方便看了。 阅读全文
posted @ 2017-02-09 20:25 隔壁老任 阅读(3322) 评论(0) 推荐(0) 编辑
摘要: #一日一词# 众数是在一组数据中,出现次数最多的数据,一组数据中的众数可以不止一个。 作用呢,也是作为描述性统计的一个指标,用来描述数据的分布情况。 众数不受极端值影响,尤其是在整体数据变动较大的情况下,众数更能描述数据的“集中趋势”。 相似延伸:众数不仅在数值型数据中可以使用,在文本数据中也可以。 阅读全文
posted @ 2017-02-09 20:24 隔壁老任 阅读(438) 评论(0) 推荐(0) 编辑
摘要: #一日一词# ​离差:指单项数值和平均值的差,正负可以作为方向。用来反映某一数值与平均值的偏离程度(距离)。 离差平方和,就是每个数据与平均数差的平方的和。 通常呢,离差都是用来求标准差和方差的。 标准差(sd):用来反映样本数据离散程度的指标。多用来反映样本是否“稳重”。比如一学生整个学期的数学成 阅读全文
posted @ 2017-02-09 20:24 隔壁老任 阅读(22639) 评论(0) 推荐(0) 编辑
摘要: #一日一词# 指​一个样本中,将整体数据按数值大小排列,能将整体划分为个数相等的两部分的书,一般取顺序排列的数组中间一个数或者中间两个数的平均值。 有啥用? 也是作为描述性统计中重要一个指标,主要是用来描述样本的分布情况,尤其是在数据的极差较大、偏斜度较高的情况下。 但是光从平均数和中位数来看样本分 阅读全文
posted @ 2017-02-09 20:23 隔壁老任 阅读(350) 评论(0) 推荐(0) 编辑
摘要: #一日一词# ​含义内容:平均数包括三种:算术平均数(最常见的),集合平均数,调和平均数。用Excel中的AVERAGE函数可以求出(Average)。 分开来说; 算术平均数(mean):又称均值。计算方法即是将n个样本相加除以n,一般用表示。公式就不写了,博客写公式只能用图片,懒。 几何平均数( 阅读全文
posted @ 2017-02-09 20:22 隔壁老任 阅读(732) 评论(0) 推荐(0) 编辑
摘要: 写图片摘要(选填) 写图片摘要(选填) 阅读全文
posted @ 2017-02-09 20:21 隔壁老任 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 前两天写了几个函数,对里面收获到的一些东西做一些记录。 函数str_comb,用于输入一个字符串或数值向量,返回由向量中元素组成的不重复的长度小于向量长度的所有组合,结果用矩阵形式输出。 函数使用结果如下: 思路很简单,在R中有个函数combn函数,能产生指定向量中元素组成的指定长度的组合,这个函数 阅读全文
posted @ 2017-02-09 20:21 隔壁老任 阅读(6196) 评论(1) 推荐(0) 编辑
摘要: #小魔仙 ​#参考:美Brett Lantz的《机器学习与R语言》,周志华老师的《机器学习》 #仅供个人学习用 #比较长和啰嗦,提醒自己:最好使用电脑看,手机看长篇大论总是不太合适 ​ 这两天学R与机器学习,真心赶脚R太简单化了,转到吴恩达老师的课时,又觉得脑子转不过来,基础没打好。关于决策树,首先 阅读全文
posted @ 2017-02-09 20:20 隔壁老任 阅读(795) 评论(0) 推荐(0) 编辑
摘要: (学*笔记,来源于美Brett Lantz著,李洪成译的《机器学*与R语言》) 也应当和算法学*类似,首先搞清楚算法/方法的原理,再考虑实现问题。 1、邻*分类概念 首先已经看出来这是用于分类的一类方法,不是某一个算法,原理是先把训练数据进行训练并标记,然后将未标记的案例归类为与之最相*的已标记的案 阅读全文
posted @ 2017-02-09 20:18 隔壁老任 阅读(652) 评论(0) 推荐(0) 编辑