代码改变世界

随笔档案-2013年03月

【rank】【转】Learning to Rank

2013-03-28 19:39 by Loull, 788 阅读, 收藏, 编辑
摘要: 转自:http://jiangfeng1124.diandian.com/post/2011-04-02/5532416大概去年10月份开始接触Learning to Rank,最初的Motivation是由于在实验中遇到排序的任务,然而传统的排序公式虽然简单,易调,但是能利用到的特征非常少,无法挖掘出其内在支 配排序的信息,导致排序的性能不理想。因此才想到使用Supervised learning的方法,藉以指导排序。参考的主要几篇文章如下:1: Adapting Ranking SVM to Document Retrieval. (Liu Tie Yan. et al. MSRA) 【P 阅读全文

20130326

2013-03-26 16:04 by Loull, 221 阅读, 收藏, 编辑
摘要: 今天得知一个好消息,表弟考上了清华的研究生~~昨晚所知的,不知道算好还是算坏,不过还是觉得很好,很多事情要承担去做,我相信这还没结束。当自己觉得无所追求的时候,会懒得改变自己,自以为这样也很好。但怎么可能真正无欲无求,自欺罢了。很多事情自己知道就好,何必呢?说好的一年的时间本性难移啊做该做的事情人无远虑必有近忧有些事情该开始做了多年前的某一天,坐在课堂上发呆的你,老师的声音越飘越远,那时候的你觉得2008年的奥运遥远的不可想象,也不知道自己2012年身在何方,窗外的树 上,一群麻雀叽喳着飞过,粉笔砸中你的头,老师让你站着听课,同学们在窃窃私语,窗外的树叶滑落,没有人注意到时间它那么仓促,再次想 阅读全文

【orange】【转】orange使用

2013-03-22 16:18 by Loull, 1136 阅读, 收藏, 编辑
摘要: http://blog.csdn.net/yiweis/article/category/1315006Orange数据格式 数据挖掘工具Orange除了支持C4.5等格式外,还有自己的数据格式。原生数据格式原生的数据格式不像C4.5由多个文件组成,而是由一个单独的文件组成。该文件以.tab结尾。其中第一行给出了数据属性的名字,类的名字 由TAB分割。第二行给出数据的类型。连续的数据用c表示,不连续的数据用d表示。第三行给出数据的额外信息。例如表示某列是class,或者挖掘过程中忽略某列用i表示。下面是大名鼎鼎的鸢尾花数据:sepal length sepal width petal leng 阅读全文

20130320

2013-03-20 21:09 by Loull, 188 阅读, 收藏, 编辑
摘要: 201303201、真不该,睁不开,别让我的地球变暗;被期待,被覆盖,蜕变的公式我学不来;《懦夫》2、莫名奇妙那些话语,莫名其妙那些话语。。。。。。。。我不听,我不听。。;《骑士精神》 阅读全文

【ML】贝叶斯估计

2013-03-20 16:08 by Loull, 533 阅读, 收藏, 编辑
摘要: 首先说明一下,机器学习中参数估计方法最基本的就是极大似然估计。极大似然估计结果完全依赖于给定的样本数据,它视待估参数为一个未知但固定的量,从而不考虑先验知识的影响。因此如果样本数据不能很好反映模型的情况,那么得到的参数估计结果就会有较大偏差。举个简单的例子,我们都知道抛一枚普通硬币,出现正面反面的概率各为1/2。如果现在正面出现9次,反面出现1次,那么用极大似然估计得到的概率就是P(正面)=9/10,P(反面)=1/10,显然是有偏差的。为了减小这个偏差,于是我们就采用贝叶斯估计方法。回忆一下贝叶斯公式,它是用来计算后验概率的,也就是已知结果求其导致原因的概率。该公式的结果取决于两方面:似然估 阅读全文

【转】中文分词技术(中文分词原理)

2013-03-18 15:22 by Loull, 367 阅读, 收藏, 编辑
摘要: http://www.cnblogs.com/flish/archive/2011/08/08/2131031.html 一、 为什么要进行中文分词? 词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文 阅读全文

【python】基础

2013-03-13 17:06 by Loull, 310 阅读, 收藏, 编辑
摘要: http://www.pythonclub.org/python-basic/starthttp://my.oschina.net/captaintheron/blog/6437一、Python 变量类型Python是有变量类型的,而且会强制检查变量类型。内置的变量类型有如下几种:#整型integer_number = 90 #浮点float_number = 90.4 #复数complex_number = 10 + 10j #list 序列sample_list = [1,2,3,'abc'] #dictionary 字典sample_dic = {"key&qu 阅读全文

【ML】【GM】【转】图模型(graphical model, GM)的表示

2013-03-11 15:13 by Loull, 658 阅读, 收藏, 编辑
摘要: 转自:http://blog.csdn.net/xianlingmao/article/details/5774435图模型(graphical model)是一类用图来表示概率分布的一类技术的总称。它的主要优点是把概率分布中的条件独立用图的形式表达出来,从而可以把一个概率分布(特定的,和应用相关的)表示为很多因子的乘积,从而简化在边缘化一个概率分布的计算,这里的边缘化指的是给定n个变量的概率分布,求取其中m个变量的概率分布的计算(m<n)。图模型主要有两大类,一类是贝叶斯网络(又称有向图模型);另外一类是马尔可夫网络(又称无向图模型)。谈到一个图模型,主要有三个主要的关注点:1)图模型 阅读全文

【ML】【HMM】【转】隐马尔可夫模型(HMM)简介

2013-03-11 15:07 by Loull, 538 阅读, 收藏, 编辑
摘要: 隐马尔可夫模型(HMM)简介转自:http://xiaofeng1982.blog.163.com/blog/static/315724582009824103618623/请各位读者深吸一口气……呼……开始……(一)阿黄是大家敬爱的警官,他性格开朗,身体强壮,是大家心目中健康的典范。但是,近一个月来阿黄的身体状况出现异常:情绪失控的状况时有发生。有时候忍不住放声大笑,有时候有时候愁眉不展,有时候老泪纵横,有时候勃然大怒……如 此变化无常的情绪失控是由什么引起的呢?据警队同事勇男描述,由于复习考试寝室不熄灯与多媒体作业的困扰,阿黄近日出现了失眠等症状;与此同时,阿黄近日 登陆一个叫做“xiao 阅读全文

【ML】VC dimension

2013-03-08 13:25 by Loull, 953 阅读, 收藏, 编辑
摘要: VC维(Vapnik-Chervonenkis Dimension)的概念是为了研究学习过程一致收敛的速度和推广性,由统计学习理论定义的有关函数集学习性能的一个重要指标。传统的定义是:对一个指标函数集,如果存在H 个样本能够被函数集中的函数按所有可能的2的K次方种形式分开,则称函数集能够把H个样本打散;函数集的VC维就是它能打散的最大样本数目H。若对任意数 目的样本都有函数能将它们打散,则函数集的VC维是无穷大,有界实函数的VC维可以通过用一定的阀值将它转化成指示函数来定义。VC维反映了函数集的学习能力,VC维越大则学习机器越复杂(容量越大),遗憾的是,目前尚没有通用的关于任意函数集VC维计算 阅读全文

【ML】PAC learning model

2013-03-06 16:41 by Loull, 740 阅读, 收藏, 编辑
摘要: 转/参考http://blog.sina.com.cn/s/blog_4c98b96001000bpp.htmlhttp://blog.pluskid.org/?p=821http://wenku.baidu.com/view/5ac5fd7c1711cc7931b716dc.html令X代表所有实例的集合,目标函数在其上定义。例如,X可表示所有人的集合,每个人描述为属性age(young或 old)和height (short或 long)。令C代表学习器要学习的目标概念集合。C中每个目标概念c对应于X的某个子集,或一个等效的布尔函数c:X→{0,1}。例如,C中一个目标函数c为概念:“是滑 阅读全文

【mat】matlab

2013-03-06 00:46 by Loull, 268 阅读, 收藏, 编辑
摘要: 帮助系统例:>> help eig例:>> doc eig例:>> help matfun 查看矩阵相关函数查找命令lookfor 按指定的关键词查询与之相关的命令例:>> lookfor inversewhich 显示指定函数所在的目录例:>> which eig变量的查询who 显示工作空间中的所有变量whos 查看工作空间中变量的详细属性变量的存储save 将所有变量存入文件 matlab.matsave mydata 将所有变量存入指定文件 mydata.matsave mydata.mat 将所有变量存入文件 mydata. 阅读全文

【mat】matlab矩阵运算及函数

2013-03-06 00:37 by Loull, 1051 阅读, 收藏, 编辑
摘要: 矩阵的建立一、矩阵定义例:>> A = [1 2 3; 4 5 6; 7 8 9]1、矩阵用方括号 “[ ]” 括起2、 矩阵同一行中的元素之间用 空格 或 逗号 分隔3、矩阵行与行之间用 分号 分开4、直接输入法中,分号可以用 回车 代替二、矩阵元素赋值1、矩阵元素的单独赋值例:>> x(5)=abs(x(1))2、大矩阵可以把小矩阵作为其元素例:>> A=[A ; 11 12 13]三、矩阵元素的引用1、单个元素的引用例:>> A(2,3)2、多个元素的引用:冒号的特殊用法例:>> x=1:2:53、A(i:j, m:n) 表示由 阅读全文

【ML】对线性回归,logistic回归和广义线性回归的认识

2013-03-04 15:10 by Loull, 606 阅读, 收藏, 编辑
摘要: 1、线性回归:是回归问题,损失函数用最小二乘2、logistic regression:解决分类问题,损失函数为log损失 log(h(x,theta))=======================================【转】:http://www.cnblogs.com/jerrylead1 摘要 本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识。前四节主要讲述了回归问题,回归属于有监督学习中的一种方法。该方法的核心思 想是从连续型统计数据中得到数学模型,然后将该数学模型用于预测或者分类。该方法处理的数据可以是多维的。 讲义最初介绍了一个基本问题,然后引出了 阅读全文

【mat】learn matlab

2013-03-04 00:06 by Loull, 477 阅读, 收藏, 编辑
摘要: 【转】http://blog.21ic.com/user1/3128/archives/2010/71193.htmlMATLAB是我们常用的工具。而快速学习和熟练掌握MATLAB对于高效完成工作很有意义。本文从亲身的经验出发,介绍一下怎样学习和使用MATLAB,这些办法都是已经被若干人证明很不错的。学习MATLAB的基础语法略过了。如果你不太确定,可以在command下边用一些简单的数字试一试。如果你习惯用C,那么注意要将运算矩阵化,什么叫运算矩阵化呢?就是尽量将循环,尤其是带if的循环用矩阵代替。举个例子:比如把数组中所有大于1000的数据置为1000,而其它的数据不变,可以写作x(x&g 阅读全文
点击右上角即可分享
微信分享提示