摘要: 简单来说,随机森林就是Bagging+决策树的组合(此处一般使用CART树)。即由很多独立的决策树组成的一个森林,因为每棵树之间相互独立,故而在最终模型组合时,每棵树的权重相等,即通过投票的方式决定最终的分类结果。随机森林算法主要过程:1、样本集的选择。 假设原始样本集总共有N个样例,则每轮从原始... 阅读全文
posted @ 2015-07-03 21:41 liuwu265 阅读(13761) 评论(0) 推荐(0) 编辑
摘要: Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本)。1、Bagging (... 阅读全文
posted @ 2015-06-30 20:22 liuwu265 阅读(70114) 评论(4) 推荐(14) 编辑
摘要: CART:Classification and regression tree,分类与回归树。(是二叉树)CART是决策树的一种,主要由特征选择,树的生成和剪枝三部分组成。它主要用来处理分类和回归问题,下面对分别对其进行介绍。1、回归树:使用平方误差最小准则训练集为:D={(x1,y1), (x2,... 阅读全文
posted @ 2015-06-18 19:18 liuwu265 阅读(14802) 评论(0) 推荐(1) 编辑
摘要: 1、熵及信息增益本节介绍:熵,条件熵,信息增益,信息增益比的概念。1)熵:表示随机变量不确定性的程度。假设随机变量X的概率P(X=xi)=pi,(i=1,2,…,n),则该随机变量的熵为:若pi=0,则0log0=0。熵只依赖X的分布,而与X的取值无关。故而X的熵H(X),写成H(p)更准确。熵越大... 阅读全文
posted @ 2015-06-07 19:18 liuwu265 阅读(1134) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯算法主要用来解决分类问题,比如通常的二分类,多分类。1、数学知识:贝叶斯定理:特征条件独立:1、朴素贝叶斯输入空间:输出空间:y={C1,C2,…,CK}。训练集:T={(x1,y1),(x2,y2),…,(xN,yN)}。对于每个实例,其P(X,Y)独立同分布。在进行分类之前,需要先将计... 阅读全文
posted @ 2015-06-02 11:03 liuwu265 阅读(9778) 评论(0) 推荐(1) 编辑
摘要: TF-IDF:Term Frequency-Inverse Document Frequency(词频-逆文档频度):主要用来估计一个词在一个文档中的重要程度。符号说明:文档集:D={d1,d2,d3,..,dn}nw,d:词w在文档d中出现的次数{wd}:文档d中的所有词的集合nw:包含词w的文档... 阅读全文
posted @ 2015-05-28 21:38 liuwu265 阅读(838) 评论(0) 推荐(0) 编辑
摘要: 1、zmpls的安装1.1安装环境ubuntu 12.04 kernel 2.6.35 (对原来的内核进行了替换)1.2 下载链接文件zMPLS-0.95-alpha.tar.gz的下载地址为:http://sourceforge.net/projects/zmpls/files/latest/do... 阅读全文
posted @ 2015-01-16 20:12 liuwu265 阅读(718) 评论(1) 推荐(0) 编辑
摘要: 在上文中将mpls编译进了linux内核,现在需要安装iprouter,安装过程如下:1) 下载两个文件iproute2-2.6.39.tar.gz和iproute2-v2.6.39-mpls.patch。iproute2-2.6.39.tar.gz下载地址:http://pkgs.fedorapr... 阅读全文
posted @ 2015-01-12 22:01 liuwu265 阅读(4342) 评论(0) 推荐(0) 编辑
摘要: 系统环境:linux kernel 2.6.35。(此环境是上一篇文章中将ubuntu内核替换后的环境)编译过程如下:1)首先需要下载patch文件:linux-kernel-v2.6.35-mpls1.980.patch。下载链接:http://ftp.jaist.ac.jp/pub/source... 阅读全文
posted @ 2014-12-20 21:49 liuwu265 阅读(698) 评论(0) 推荐(0) 编辑
摘要: 此处将内核由高版本替换成低版本。替换前的系统为ubuntu 12.04 kernel 3.8.0. 替换后的内核版本为2.6.35.首先下载需要替换的内核文件,下载链接:https://www.kernel.org/pub/linux/kernel/v2.6/linux-2.6.35.tar.gz下... 阅读全文
posted @ 2014-12-16 10:59 liuwu265 阅读(6836) 评论(0) 推荐(0) 编辑
摘要: 本文主要对shell中基本的语法进行简要记录,以备查用!1、shell变量在定义变量名时不加美元符号$,只在使用变量时需要在变量名前添加美元符号。如1 name=”lw”2 echo ${name} #或者$name,但建议加上大括号注:在对变量进行赋值时,等号“=”的两边不能有空格变量的命... 阅读全文
posted @ 2014-11-19 15:55 liuwu265 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 使用python爬取medsci上的期刊信息,通过设定条件,然后获取相应的期刊的的影响因子排名,期刊名称,英文全称和影响因子。主要过程如下:首先,通过分析网站http://www.medsci.cn/sci的交互过程。可以使用谷歌或火狐浏览器的“审查元素-->Network”,然后就可以看到操作页面... 阅读全文
posted @ 2014-11-18 22:45 liuwu265 阅读(2092) 评论(0) 推荐(0) 编辑
摘要: java的控制台输入输出有很多方法,此文分别对其进行介绍。1、控制台的输入关于控制台的输入主要介绍三种方法,第一种方法使用BufferedReader获得控制台输入的数据,此方法是传统的输入方法,使用起来比较繁琐,输入效率也不高,其次是使用System.in作为输入,感觉此方法不是很灵活。最后,使用... 阅读全文
posted @ 2014-11-15 21:38 liuwu265 阅读(51460) 评论(0) 推荐(0) 编辑
摘要: 在使用java对文件进行读写操作时,有多种方法可以使用,但不同的方法有不同的性能。此文对常用的读写方法进行了整理,以备不时之需。1、文件的读取主要介绍两种常用的读取方法。按行读取和按字符块读取。1.1 一次读取一行作为输入//按行读取文件内容 public static String Read1(S... 阅读全文
posted @ 2014-11-15 16:00 liuwu265 阅读(1563) 评论(0) 推荐(0) 编辑
摘要: apt-cache search package 搜索包 apt-cache show package 获取包的相关信息,如说明、大小、版本等 sudo apt-get install package 安装包 sudo apt-get install package - - reinst... 阅读全文
posted @ 2014-11-12 15:48 liuwu265 阅读(440) 评论(0) 推荐(0) 编辑