ID3和C4.5分类决策树算法 - 数据挖掘算法(7)

(2017-05-18 银河统计)

决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。

决策树是对数据进行分类,以此达到预测的目的。决策树方法先根据训练集数据形成决策树,如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到训练集数据中,重复该过程一直到形成正确的决策集。决策树代表着决策集的树形结构。

决策树由决策结点、分支和叶子组成。决策树中最上面的结点为根结点,每个分支是一个新的决策结点,或者是树的叶子。每个决策结点代表一个问题或决策,通常对应于待分类对象的属性。每一个叶子结点代表一种可能的分类结果。沿决策树从上到下遍历的过程中,在每个结点都会遇到一个测试,对每个结点上问题的不同的测试输出导致不同的分支,最后会到达一个叶子结点,这个过程就是利用决策树进行分类的过程,利用若干个变量来判断所属的类别。

一、决策树构造及其运用##

1、树的定义

树是由节点和边两种元素组成的结构。理解树,就需要理解几个关键词:根节点、父节点、子节点和叶子节点。

父节点和子节点是相对的,说白了子节点由父节点根据某一规则分裂而来,然后子节点作为新的父亲节点继续分裂,直至不能分裂为止。而根节点是没有父节点的节点,即初始分裂节点,叶子节点是没有子节点的节点,如下图所示:

决策树利用如上图所示的树结构进行决策,每一个非叶子节点是一个判断条件,每一个叶子节点是结论。从跟节点开始,经过多次判断得出结论。

2、如何利用树进行决策

从一个用户贷款分类例子说起:

银行希望能够通过一个人的信息(包括职业、年龄、收入、学历)去判断他是否有贷款的意向,从而更有针对性地完成工作。下表是银行现在能够掌握的信息,我们的目标是通过对下面的数据进行分析建立一个预测用户贷款一下的模型。

职业 年龄 收入 学历 是否贷款
自由职业 28 5000 高中
工人 36 5500 高中
工人 42 2800 初中
白领 45 3300 小学
白领 25 10000 本科
白领 32 8000 硕士
白领 28 13000 博士
自由职业 21 4000 本科
自由职业 22 3200 小学
工人 33 3000 高中
工人 48 4200 小学

上边中有4个客户的属性,如何综合利用这些属性去判断用户的贷款意向?

决策树的做法是每次选择一个属性进行判断,如果不能得出结论,继续选择其他属性进行判断,直到能够“肯定地”判断出用户的类型或者是上述属性都已经使用完毕。比如说我们要判断一个客户的贷款意向,我们可以先根据客户的职业进行判断,如果不能得出结论,再根据年龄作判断,这样以此类推,直到可以得出结论为止。

决策树用树结构实现上述的判断流程,如下图所示:

上图所示的是通过输入用户的信息,输出用户的贷款意向。如果要判断某一客户是否有贷款的意向,直接根据用户的职业、收入、年龄以及学历就可以分析得出用户的类型。如某客户的信息为:{职业、年龄,收入,学历}={工人、39, 1800,小学},将信息输入上述决策树,可以得到下列的分析步骤和结论。

第一步:根据该客户的职业进行判断,选择“工人”分支;

第二步:根据客户的年龄进行选择,选择年龄”<=40”这一分支;

第三步:根据客户的学历进行选择,选择”小学”这一分支,得出该客户无贷款意向的结论。

3、决策树的构建

从上述步骤可以看出,决策生成过程中有几个个重要的问题:

数据如何分割
如何选择分裂的属性
什么时候停止分裂

假如我们已经选择了一个分裂的属性,那怎样对数据进行分裂呢?

I、数据分割

分裂属性的数据类型分为离散型和连续性两种情况,对于离散型的数据,按照属性值进行分裂,每个属性值对应一个分裂节点;对于连续性属性,一般性的做法是对数据按照该属性进行排序,再将数据分成若干区间,如[0,10]、[10,20]、[20,30]、…,一个区间对应一个节点,若数据的属性值落入某一区间则该数据就属于其对应的节点。

设有数据表如下:

职业 年龄 是否贷款
白领 30
工人 40
工人 20
学生 15
学生 18
白领 42

属性“职业”是离散型变量,有三个取值,分别为白领、工人和学生,根据三个取值对原始的数据进行分割,如下表所示:

取值 贷款人数 不贷款人数
白领 1 1
工人 0 2
学生 1 1

上表可以表示成如下的决策树结构:

属性“年龄”是连续性变量,这里将数据分成三个区间,分别是[0,20]、(20,40]、(40,*],则每一个区间的分裂结果如下:

年龄分组 贷款人数 不贷款人数
[0 ,20] 1 2
(20,40] 0 2
(40,* ] 1 0

上表可以表示成如下的决策树结构:

II、分裂属性的选择

前面介绍了分裂属性是如何对数据进行分割的,那么怎样选择分裂的属性呢?

决策树采用贪婪思想进行分裂,即选择可以得到最优分裂结果的属性进行分裂。那么怎样才算是最优的分裂结果?最理想的情况当然是能找到一个属性刚好能够将不同类别分开,但是大多数情况下分裂很难一步到位,我们希望每一次分裂之后孩子节点的数据尽量”纯”,以下图为例:

从图例1和图例2可以明显看出,属性2分裂后的子节点比属性1分裂后的子节点更纯:属性1分裂后每个节点的两类的数量还是相同,跟根节点的分类结果相比完全没有提高;按照属性2分裂后每个节点各类的数量相差比较大,可以很大概率认为第一个子节点的输出结果为类1,第2个子节点的输出结果为2。

选择分裂属性是要找出能够使所有子节点数据最纯的属性,决策树使用信息增益、信息增益率或者基尼值作为选择属性的依据(相关概念及算法在ID3和C4.5中解释)。

III、停止分裂的条件

决策树不可能无限制地生长,总有停止分裂的时候,最极端的情况是当节点分裂到只剩下一个数据点时自动结束分裂,但这种情况下树过于复杂,而且预测的精度不高。一般情况下为了降低决策树复杂度和提高预测的经度,会适当提前终止节点的分裂

以下是决策树节点停止分裂的一般性条件:

a. 最小节点数:当节点的数据量小于一个指定的数量时,不继续分裂。两个原因:一是数据量较少时,再做分裂容易强化噪声数据的作用;二是降低树生长的复杂性。提前结束分裂一定程度上有利于降低过拟合的影响

b. 熵或者基尼值小于阀值:熵和基尼值的大小表示数据的复杂程度,当熵或者基尼值过小时,表示数据的纯度比较大,如果熵或者基尼值小于一定程度数,节点停止分裂

c. 决策树的深度达到指定的条件:节点的深度可以理解为节点与决策树跟节点的距离,如根节点的子节点的深度为1,因为这些节点与跟节点的距离为1,子节点的深度要比父节点的深度大1。决策树的深度是所有叶子节点的最大深度,当深度到达指定的上限大小时,停止分裂

d. 所有特征已经使用完毕,不能继续进行分裂:被动式停止分裂的条件,当已经没有可分的属性时,直接将当前节点设置为叶子节点

IV、决策树的构建方法

根据决策树的输出结果,决策树可以分为分类树和回归树,分类树输出的结果为具体的类别,而回归树输出的结果为一个确定的数值。

决策树的构建算法主要有ID3、C4.5、CART三种,其中ID3和C4.5是分类树,CART是分类回归树。本文介绍ID3和C4.5技术,其中ID3是决策树最基本的构建算法,而C4.5和CART是在ID3的基础上进行优化的算法。

二、ID3算法##

ID3算法最早是由罗斯昆(J.Ross Quinlan)于1975年在悉尼大学提出的一种分类预测算法,算法的核心是“信息熵(Information entropy)”。ID3算法通过计算每个属性的信息增益,认为信息增益高的是好属性,每次划分选取信息增益最高的属性为划分标准,重复这个过程,直至生成一个能完美分类训练样例的决策树。

1、信息熵

信息论之父 C. E. Shannon 在1948年发表的论文“通信的数学理论(A Mathematical Theory of Communication)”中,Shannon指出,任何信息都存在冗余,冗余大小与信息中每个符号(数字、字母或单词)的出现概率或者说不确定性有关。Shannon借鉴了热力学的概念,把信息中排除了冗余后的平均信息量称为“信息熵”,并给出了计算信息熵的数学表达式。

事件\(a_{_i}\)的信息量\(I(a_{_i})\)可如下度量:

\[I(a_{_i})=p(a_{_i})\times\frac{1}{log_{_2}p(a_{_i})} \]

其中\(p(a_{_i})\)表示事件\(a_{_i}\)发生的概率。

假设有n个互不相容的事件\(a_{_1},a_{_2},a_{_3},\dots.,a_{_n}\),它们中有且仅有一个发生,则其平均的信息量可如下度量:

\[I(a_{_1},a_{_2},a_{_3},\dots,a_{_n})=\sum\limits_{i=1}^nI(a_{_i})=\sum\limits_{i=1}^np(a_{_i})\times\frac{1}{log_{_2}p(a_{_i})}=-\sum\limits_{i=1}^np(a_{_i})\times{log_{_2}p(a_{_i})} \]

信息熵是消除不确定性所需信息量的度量,也即未知事件可能含有的信息量。

例如,投掷一枚分币,正面和反面朝上的概率相对,为\(\frac{1}{2}\),这一随机试验所有可能结果的发生概率所包含的信息量的大小,即信息熵值为,

\[I(a_{_1},a_{_2})=-\sum\limits_{i=1}^2p(a_{_i})\times{log_{_2}p(a_{_i})}=-(\frac{1}{2}\times log_{_2}\frac{1}{2}+\frac{1}{2}\times log_{_2}\frac{1}{2})=log_{_2}2=1 \]

假设这枚分币正反面不均匀,一面朝上的概率为0.3,另一面为0.7,信息熵值为,

\[I(a_{_1},a_{_2})=-\sum\limits_{i=1}^2p(a_{_i})\times{log_{_2}p(a_{_i})}=-(0.3\times log_{_2}0.3+0.7\times log_{_2}0.7)=0.8813 \]

对于极端情况,一面朝上的概率为0,另一面为1,信息熵值为,

\[I(a_{_1},a_{_2})=-\sum\limits_{i=1}^2p(a_{_i})\times{log_{_2}p(a_{_i})}=-(0\times log_{_2}0+1\times log_{_2}1)=0 \]

式中,对数底数可以为任何数,不同的取值对应了熵的不同单位。通常对数的底数取2,并规定当\(p(a_{_i})=0\)时,

\[I(a_{_i})=p(a_{_i})\times\frac{1}{log_{_2}p(a_{_i})}=0 \]

当正反面朝上概率相等时,结果最难猜,信息熵最大;正面朝上概率为0.7、反面朝上概率为0.3时,应该猜正面朝上,会有70%胜算,但信息熵减小;正面朝上概率为1、反面朝上概率为0时,正面一定朝上,这时信息熵为0。

2、ID3算法中信息量大小的度量

在运用ID3算法进行决策树分类过程中,假设D是训练样本集合,则D的熵(entropy)表示为:

\[info(D)=-\sum\limits_{i=1}^mp_{_i}\times{log_{_2}(p_{_i})} \]

其中\(p_{_i}\)表示第i个类别在整个训练元组中出现的概率,可以用属于此类别元素的数量除以训练元组元素总数量作为估计。熵的实际意义表示是D中元组的类标号所需要的平均信息量。

现对训练样本集合D按属性A进行划分,则A对D划分的期望信息为:

\[info_{_A}(D)=-\sum\limits_{j=1}^m\frac{|D_{_j}|}{|D|}\times{info(D_{_j})} \]

式中|D|为练样本量,\(D_{_j}\)为属性A的不同水平样本数,\(info(D_{_j})\)为属性A的不同水平的熵。

而信息增益为,

\[gain(A)=info(D)-info_{_A}(D) \]

3、ID3算法案例

学习数据挖掘技术的最好方法是找到详细案例和看懂计算过程。有时算法虽然不难,但公式表达很难理解。

案例:SNS社区中不真实账号检测,使用ID3算法构造决策树。

日志密度/L好友密度/F真实头像/H真实账户/R
S S NO NO
S L YES YES
L M YES YES
M M YES YES
L M YES YES
M L NO YES
M S NO NO
L M NO YES
M S NO YES
S S YES NO

表中S、M和L分别表示小、中和大。

设L、F、H和R表示日志密度、好友密度、是否使用真实头像和账号是否真实,试用ID3算法构造决策树。

解:设D为10个样本集,其中决策属性(真实账户/R)有7个YES、3个NO。决策属性信息熵为:

\[info(D)=-\sum\limits_{i=1}^mp_{_i}\times{log_{_2}(p_{_i})}=-(\frac{7}{10}log_{_2}\frac{7}{10}+\frac{3}{10}log_{_2}\frac{3}{10})=0.8813 \]

日志密度属性期望信息熵为:

\[\small{info_{_L}(D)=-\sum\limits_{j=1}^m\frac{|D_{_j}|}{|D|}\times{info(D_{_j})}=-[\frac{3}{10}\times{(0\times log_{_2}0+1\times log_{_2}1)}+\frac{4}{10}\times{(\frac{1}{4}\times log_{_2}\frac{1}{4}+\frac{3}{4}\times log_{_2}\frac{3}{4})}+\frac{3}{10}\times{(\frac{2}{3}\times log_{_2}\frac{2}{3}+\frac{1}{3}\times log_{_2}\frac{1}{3})}]=0.6} \]

好友密度属性期望信息熵为:

\[\small{info_{_F}(D)=-\sum\limits_{j=1}^m\frac{|D_{_j}|}{|D|}\times{info(D_{_j})}=-[\frac{2}{10}\times{(0\times log_{_2}0+1\times log_{_2}1)}+\frac{4}{10}\times{(\frac{1}{4}\times log_{_2}\frac{1}{4}+\frac{3}{4}\times log_{_2}\frac{3}{4})}+\frac{4}{10}\times{(0\times log_{_2}0+1\times log_{_2}1)}]=0.3245} \]

真实头像属性期望信息熵为:

\[\small{info_{_H}(D)=-\sum\limits_{j=1}^m\frac{|D_{_j}|}{|D|}\times{info(D_{_j})}=-[\frac{5}{10}\times{(\frac{2}{5}\times log_{_2}\frac{2}{5}+\frac{3}{5}\times log_{_2}\frac{3}{5})}+\frac{5}{10}\times{(\frac{1}{5}\times log_{_2}\frac{1}{5}+\frac{4}{5}\times log_{_2}\frac{4}{5})}]=0.8464} \]

日志密度信息增益: \(gain(L)=info(D) - info_{_L}(D) = 0.8813 – 0.6 = 0.2813\)
好友密度信息增益: \(gain(F)=info(D) - info_{_F}(D) = 0.8813 – 0.3245 = 0.5568\)
真实头像信息增益: \(gain(H)=info(D) - info_{_H}(D) = 0.8813 – 0.8464 = 0.0349\)

因为好友密度(F)具有最大的信息增益(好友密度信息熵最小,最易分割),所以第一次分裂选择好友密度F为分裂属性,分裂后的结果如下:

图中按好友密度(F)分割树,水平M和L为单一水平决策属性分支(树叶),没有必要继续分割。水平S包含决策属性的不同水平,应该继续分割。待分割决策信息表为,

日志密度/L真实头像/H真实账户/R
S NO NO
M NO NO
M NO YES
S YES NO

此时,设D为4个样本集,其中决策属性(真实账户/R)有1个YES、3个NO。决策属性信息熵为:

\[info(D)=-\sum\limits_{i=1}^mp_{_i}\times{log_{_2}(p_{_i})}=-(\frac{1}{4}log_{_2}\frac{1}{4}+\frac{3}{4}log_{_2}\frac{3}{4})=0.8113 \]

日志密度属性期望信息熵为:

\[\small{info_{_L}(D)=-\sum\limits_{j=1}^m\frac{|D_{_j}|}{|D|}\times{info(D_{_j})}=-[\frac{2}{4}\times{(\frac{1}{2}\times log_{_2}\frac{1}{2}+\frac{1}{2}\times log_{_2}\frac{1}{2})}+\frac{2}{4}\times{(0\times log_{_2}0+1\times log_{_2}1)}]=0.5} \]

真实头像属性期望信息熵为:

\[\small{info_{_H}(D)=-\sum\limits_{j=1}^m\frac{|D_{_j}|}{|D|}\times{info(D_{_j})}=-[\frac{3}{4}\times{(\frac{2}{3}\times log_{_2}\frac{2}{3}+\frac{1}{3}\times log_{_2}\frac{1}{3})}+\frac{1}{4}\times{(0\times log_{_2}0+1\times log_{_2}1)}]=0.6887} \]

日志密度信息增益: \(gain(L)=info(D) - info_{_L}(D) = 0.8113 – 0.5 = 0.2813\)
真实头像信息增益: \(gain(H)=info(D) - info_{_H}(D) = 0.8113 – 0.8464 = 0.6887\)

因为日志密度(L)具有最大的信息增益,所以第二次分裂选择日志密度(L)为分裂属性,分裂后的结果如下图表示:

图中,日志密度为M时,无法做出判断、也无法继续进行分裂。至此,决策树构建完毕。

设某人在SNS社区中的好友密度为L或M,无论其它属性水平取值如何,均可判定为是真实账户;如果某人在SNS社区中的好友密度为S、日志密度也为S,可判定为是虚假账户;如果某人在SNS社区中的好友密度为S、日志密度为M,应根据真实头像信息做出判断,由于样本过少,无法继续进行。

三、C4.5算法##

ID3算法是决策树的一个经典的构造算法,但ID3算法也存在一些问题,比较突出的缺陷是信息增益的计算依赖于特征水平较多的特征,而属性取值最多的属性并不一定最优。例如,投掷一枚分币和一个色子这两个随机试验,所有可能的期望信息熵为,

\(entropy(掷分币)=-(\frac{1}{2}\times log_{_2}\frac{1}{2}+\frac{1}{2}\times log_{_2}\frac{1}{2})=log_{_2}2=1\)
\(\small{entropy(掷色子)=-(\frac{1}{6}\times log_{_2}\frac{1}{2}+\frac{1}{6}\times log_{_2}\frac{1}{2}+\frac{1}{6}\times log_{_2}\frac{1}{2}+\frac{1}{6}\times log_{_2}\frac{1}{2}+\frac{1}{6}\times log_{_2}\frac{1}{2}+\frac{1}{6}\times log_{_2}\frac{1}{2})=log_{_2}6\approx 2.585}\)

通过信息熵的定义可知,在给定特征水平数条件下,各水平发生概率相等(如掷筛子6个数字发生的概率都为\(\frac{1}{6}\)),期望信息熵最大。所以,当决策信息中某个变量特征水平较多时,ID3算法按信息增益指标往往会选择该变量或属性做为分割节点。

1、C4.5算法的两个基本公式

I、“分裂信息”公式

C4.5算法首先定义了“分裂信息”,其定义可以表示成:

\[split\_info_{_A}(D)=-\sum\limits_{j=1}^v\frac{|D_{_j}|}{|D|}\times{log_{_2}(\frac{|D_{_j}|}{|D|})} \]

式中,各符号意义与ID3算法相同,符号|D|为训练样本数、\(|D_{_j}|\)为属性A各水平样本数。

II、增益率

\[gain\_ratio(A)=\frac{ratio_{_A}(D)}{split\_info_{_A}(D)} \]

III、分裂信息和增益率计算实例

在ID3算法案例中(SNS社区中不真实账号检测),决策属性信息熵为:

\[info(D)=-\sum\limits_{i=1}^mp_{_i}\times{log_{_2}(p_{_i})}=-(\frac{1}{4}log_{_2}\frac{1}{4}+\frac{3}{4}log_{_2}\frac{3}{4})=0.8113 \]

把决策属性替换成其它属性,即为各属性分裂信息熵。

日志密度分裂信息:

\[\small{split\_info_{_L}(D)=-\sum\limits_{j=1}^3\frac{|D_{_j}|}{|D|}\times{log_{_2}(\frac{|D_{_j}|}{|D|})}=-[\frac{3}{10}\times log_{_2}\frac{3}{10}+\frac{4}{10}\times log_{_2}\frac{4}{10}+\frac{3}{10}\times log_{_2}\frac{3}{10}]=1.57095} \]

好友密度分裂信息:

\[\small{split\_info_{_F}(D)=-\sum\limits_{j=1}^3\frac{|D_{_j}|}{|D|}\times{log_{_2}(\frac{|D_{_j}|}{|D|})}=-[\frac{4}{10}\times log_{_2}\frac{4}{10}+\frac{4}{10}\times log_{_2}\frac{4}{10}+\frac{2}{10}\times log_{_2}\frac{2}{10}]=1.5219} \]

真实头像分裂信息:

\[\small{split\_info_{_H}(D)=-\sum\limits_{j=1}^2\frac{|D_{_j}|}{|D|}\times{log_{_2}(\frac{|D_{_j}|}{|D|})}=-[\frac{5}{10}\times log_{_2}\frac{5}{10}+\frac{5}{10}\times log_{_2}\frac{5}{10}]=1} \]

由前面ID3算法已知,

日志密度信息增益: \(gain(L)=info(D) - info_{_L}(D) = 0.8813 – 0.6 = 0.2813\)
好友密度信息增益: \(gain(F)=info(D) - info_{_F}(D) = 0.8813 – 0.3245 = 0.5568\)
真实头像信息增益: \(gain(H)=info(D) - info_{_H}(D) = 0.8813 – 0.8464 = 0.0349\)

各属性增益率为,

日志密度信息增益率:$$gain_ratio(L)=\frac{ratio_{L}(D)}{split_info(D)}=\frac{0.2813}{1.57095}=0.1791$$

好友密度信息增益率: $$gain_ratio(F)=\frac{ratio_{F}(D)}{split_info(D)}=\frac{0.5568}{1.5219}=0.3659$$

真实头像信息增益率: $$gain_ratio(H)=\frac{ratio_{H}(D)}{split_info(D)}=\frac{0.0349}{1}=0.0349$$

由上述计算结果可知“好友密度”在属性中具有最大的信息增益比,取“好友密度”为分割属性,引出一个分枝,样本按此划分。对引出的每一个分枝再用此分类法进行分类,再引出分枝。

某属性的信息增益除以分裂信息,消除了属性水平数量多少的影响,使得分裂属性的选择更加合理。

四、样例代码##

样例采用计算机购买意向信息表,

年龄 收入 学生 信誉 买计算机 计数
不买 64
不买 64
128
60
64
不买 64
64
不买 128
64
132
64
32
32
不买 63
1

该训练样本集为单项分组数据,为了便于程序代码处理,应将分组数据还原为未分组数据,并将中文信息转换为英文字符。

No.AgeIncomeStudentReputationBuy Computer
1YHNGN
2YHNGN
3YHNGN
4YHNGN
5YHNGN
6YHNGN
7YHNGN
8YHNGN
9YHNGN
10YHNGN
11YHNGN
12YHNGN
13YHNGN
14YHNGN
15YHNGN
16YHNGN
17YHNGN
18YHNGN
19YHNGN
20YHNGN
21YHNGN
22YHNGN
23YHNGN
24YHNGN
25YHNGN
26YHNGN
27YHNGN
28YHNGN
29YHNGN
30YHNGN
31YHNGN
32YHNGN
33YHNGN
34YHNGN
35YHNGN
36YHNGN
37YHNGN
38YHNGN
39YHNGN
40YHNGN
41YHNGN
42YHNGN
43YHNGN
44YHNGN
45YHNGN
46YHNGN
47YHNGN
48YHNGN
49YHNGN
50YHNGN
51YHNGN
52YHNGN
53YHNGN
54YHNGN
55YHNGN
56YHNGN
57YHNGN
58YHNGN
59YHNGN
60YHNGN
61YHNGN
62YHNGN
63YHNGN
64YHNGN
65YHNEN
66YHNEN
67YHNEN
68YHNEN
69YHNEN
70YHNEN
71YHNEN
72YHNEN
73YHNEN
74YHNEN
75YHNEN
76YHNEN
77YHNEN
78YHNEN
79YHNEN
80YHNEN
81YHNEN
82YHNEN
83YHNEN
84YHNEN
85YHNEN
86YHNEN
87YHNEN
88YHNEN
89YHNEN
90YHNEN
91YHNEN
92YHNEN
93YHNEN
94YHNEN
95YHNEN
96YHNEN
97YHNEN
98YHNEN
99YHNEN
100YHNEN
101YHNEN
102YHNEN
103YHNEN
104YHNEN
105YHNEN
106YHNEN
107YHNEN
108YHNEN
109YHNEN
110YHNEN
111YHNEN
112YHNEN
113YHNEN
114YHNEN
115YHNEN
116YHNEN
117YHNEN
118YHNEN
119YHNEN
120YHNEN
121YHNEN
122YHNEN
123YHNEN
124YHNEN
125YHNEN
126YHNEN
127YHNEN
128YHNEN
129MHNGY
130MHNGY
131MHNGY
132MHNGY
133MHNGY
134MHNGY
135MHNGY
136MHNGY
137MHNGY
138MHNGY
139MHNGY
140MHNGY
141MHNGY
142MHNGY
143MHNGY
144MHNGY
145MHNGY
146MHNGY
147MHNGY
148MHNGY
149MHNGY
150MHNGY
151MHNGY
152MHNGY
153MHNGY
154MHNGY
155MHNGY
156MHNGY
157MHNGY
158MHNGY
159MHNGY
160MHNGY
161MHNGY
162MHNGY
163MHNGY
164MHNGY
165MHNGY
166MHNGY
167MHNGY
168MHNGY
169MHNGY
170MHNGY
171MHNGY
172MHNGY
173MHNGY
174MHNGY
175MHNGY
176MHNGY
177MHNGY
178MHNGY
179MHNGY
180MHNGY
181MHNGY
182MHNGY
183MHNGY
184MHNGY
185MHNGY
186MHNGY
187MHNGY
188MHNGY
189MHNGY
190MHNGY
191MHNGY
192MHNGY
193MHNGY
194MHNGY
195MHNGY
196MHNGY
197MHNGY
198MHNGY
199MHNGY
200MHNGY
201MHNGY
202MHNGY
203MHNGY
204MHNGY
205MHNGY
206MHNGY
207MHNGY
208MHNGY
209MHNGY
210MHNGY
211MHNGY
212MHNGY
213MHNGY
214MHNGY
215MHNGY
216MHNGY
217MHNGY
218MHNGY
219MHNGY
220MHNGY
221MHNGY
222MHNGY
223MHNGY
224MHNGY
225MHNGY
226MHNGY
227MHNGY
228MHNGY
229MHNGY
230MHNGY
231MHNGY
232MHNGY
233MHNGY
234MHNGY
235MHNGY
236MHNGY
237MHNGY
238MHNGY
239MHNGY
240MHNGY
241MHNGY
242MHNGY
243MHNGY
244MHNGY
245MHNGY
246MHNGY
247MHNGY
248MHNGY
249MHNGY
250MHNGY
251MHNGY
252MHNGY
253MHNGY
254MHNGY
255MHNGY
256MHNGY
257LMNGY
258LMNGY
259LMNGY
260LMNGY
261LMNGY
262LMNGY
263LMNGY
264LMNGY
265LMNGY
266LMNGY
267LMNGY
268LMNGY
269LMNGY
270LMNGY
271LMNGY
272LMNGY
273LMNGY
274LMNGY
275LMNGY
276LMNGY
277LMNGY
278LMNGY
279LMNGY
280LMNGY
281LMNGY
282LMNGY
283LMNGY
284LMNGY
285LMNGY
286LMNGY
287LMNGY
288LMNGY
289LMNGY
290LMNGY
291LMNGY
292LMNGY
293LMNGY
294LMNGY
295LMNGY
296LMNGY
297LMNGY
298LMNGY
299LMNGY
300LMNGY
301LMNGY
302LMNGY
303LMNGY
304LMNGY
305LMNGY
306LMNGY
307LMNGY
308LMNGY
309LMNGY
310LMNGY
311LMNGY
312LMNGY
313LMNGY
314LMNGY
315LMNGY
316LMNGY
317LLYGY
318LLYGY
319LLYGY
320LLYGY
321LLYGY
322LLYGY
323LLYGY
324LLYGY
325LLYGY
326LLYGY
327LLYGY
328LLYGY
329LLYGY
330LLYGY
331LLYGY
332LLYGY
333LLYGY
334LLYGY
335LLYGY
336LLYGY
337LLYGY
338LLYGY
339LLYGY
340LLYGY
341LLYGY
342LLYGY
343LLYGY
344LLYGY
345LLYGY
346LLYGY
347LLYGY
348LLYGY
349LLYGY
350LLYGY
351LLYGY
352LLYGY
353LLYGY
354LLYGY
355LLYGY
356LLYGY
357LLYGY
358LLYGY
359LLYGY
360LLYGY
361LLYGY
362LLYGY
363LLYGY
364LLYGY
365LLYGY
366LLYGY
367LLYGY
368LLYGY
369LLYGY
370LLYGY
371LLYGY
372LLYGY
373LLYGY
374LLYGY
375LLYGY
376LLYGY
377LLYGY
378LLYGY
379LLYGY
380LLYGY
381LLYEN
382LLYEN
383LLYEN
384LLYEN
385LLYEN
386LLYEN
387LLYEN
388LLYEN
389LLYEN
390LLYEN
391LLYEN
392LLYEN
393LLYEN
394LLYEN
395LLYEN
396LLYEN
397LLYEN
398LLYEN
399LLYEN
400LLYEN
401LLYEN
402LLYEN
403LLYEN
404LLYEN
405LLYEN
406LLYEN
407LLYEN
408LLYEN
409LLYEN
410LLYEN
411LLYEN
412LLYEN
413LLYEN
414LLYEN
415LLYEN
416LLYEN
417LLYEN
418LLYEN
419LLYEN
420LLYEN
421LLYEN
422LLYEN
423LLYEN
424LLYEN
425LLYEN
426LLYEN
427LLYEN
428LLYEN
429LLYEN
430LLYEN
431LLYEN
432LLYEN
433LLYEN
434LLYEN
435LLYEN
436LLYEN
437LLYEN
438LLYEN
439LLYEN
440LLYEN
441LLYEN
442LLYEN
443LLYEN
444LLYEN
445MLYEY
446MLYEY
447MLYEY
448MLYEY
449MLYEY
450MLYEY
451MLYEY
452MLYEY
453MLYEY
454MLYEY
455MLYEY
456MLYEY
457MLYEY
458MLYEY
459MLYEY
460MLYEY
461MLYEY
462MLYEY
463MLYEY
464MLYEY
465MLYEY
466MLYEY
467MLYEY
468MLYEY
469MLYEY
470MLYEY
471MLYEY
472MLYEY
473MLYEY
474MLYEY
475MLYEY
476MLYEY
477MLYEY
478MLYEY
479MLYEY
480MLYEY
481MLYEY
482MLYEY
483MLYEY
484MLYEY
485MLYEY
486MLYEY
487MLYEY
488MLYEY
489MLYEY
490MLYEY
491MLYEY
492MLYEY
493MLYEY
494MLYEY
495MLYEY
496MLYEY
497MLYEY
498MLYEY
499MLYEY
500MLYEY
501MLYEY
502MLYEY
503MLYEY
504MLYEY
505MLYEY
506MLYEY
507MLYEY
508MLYEY
509YMNGN
510YMNGN
511YMNGN
512YMNGN
513YMNGN
514YMNGN
515YMNGN
516YMNGN
517YMNGN
518YMNGN
519YMNGN
520YMNGN
521YMNGN
522YMNGN
523YMNGN
524YMNGN
525YMNGN
526YMNGN
527YMNGN
528YMNGN
529YMNGN
530YMNGN
531YMNGN
532YMNGN
533YMNGN
534YMNGN
535YMNGN
536YMNGN
537YMNGN
538YMNGN
539YMNGN
540YMNGN
541YMNGN
542YMNGN
543YMNGN
544YMNGN
545YMNGN
546YMNGN
547YMNGN
548YMNGN
549YMNGN
550YMNGN
551YMNGN
552YMNGN
553YMNGN
554YMNGN
555YMNGN
556YMNGN
557YMNGN
558YMNGN
559YMNGN
560YMNGN
561YMNGN
562YMNGN
563YMNGN
564YMNGN
565YMNGN
566YMNGN
567YMNGN
568YMNGN
569YMNGN
570YMNGN
571YMNGN
572YMNGN
573YMNGN
574YMNGN
575YMNGN
576YMNGN
577YMNGN
578YMNGN
579YMNGN
580YMNGN
581YMNGN
582YMNGN
583YMNGN
584YMNGN
585YMNGN
586YMNGN
587YMNGN
588YMNGN
589YMNGN
590YMNGN
591YMNGN
592YMNGN
593YMNGN
594YMNGN
595YMNGN
596YMNGN
597YMNGN
598YMNGN
599YMNGN
600YMNGN
601YMNGN
602YMNGN
603YMNGN
604YMNGN
605YMNGN
606YMNGN
607YMNGN
608YMNGN
609YMNGN
610YMNGN
611YMNGN
612YMNGN
613YMNGN
614YMNGN
615YMNGN
616YMNGN
617YMNGN
618YMNGN
619YMNGN
620YMNGN
621YMNGN
622YMNGN
623YMNGN
624YMNGN
625YMNGN
626YMNGN
627YMNGN
628YMNGN
629YMNGN
630YMNGN
631YMNGN
632YMNGN
633YMNGN
634YMNGN
635YMNGN
636YMNGN
637YLYGY
638YLYGY
639YLYGY
640YLYGY
641YLYGY
642YLYGY
643YLYGY
644YLYGY
645YLYGY
646YLYGY
647YLYGY
648YLYGY
649YLYGY
650YLYGY
651YLYGY
652YLYGY
653YLYGY
654YLYGY
655YLYGY
656YLYGY
657YLYGY
658YLYGY
659YLYGY
660YLYGY
661YLYGY
662YLYGY
663YLYGY
664YLYGY
665YLYGY
666YLYGY
667YLYGY
668YLYGY
669YLYGY
670YLYGY
671YLYGY
672YLYGY
673YLYGY
674YLYGY
675YLYGY
676YLYGY
677YLYGY
678YLYGY
679YLYGY
680YLYGY
681YLYGY
682YLYGY
683YLYGY
684YLYGY
685YLYGY
686YLYGY
687YLYGY
688YLYGY
689YLYGY
690YLYGY
691YLYGY
692YLYGY
693YLYGY
694YLYGY
695YLYGY
696YLYGY
697YLYGY
698YLYGY
699YLYGY
700YLYGY
701LMYGY
702LMYGY
703LMYGY
704LMYGY
705LMYGY
706LMYGY
707LMYGY
708LMYGY
709LMYGY
710LMYGY
711LMYGY
712LMYGY
713LMYGY
714LMYGY
715LMYGY
716LMYGY
717LMYGY
718LMYGY
719LMYGY
720LMYGY
721LMYGY
722LMYGY
723LMYGY
724LMYGY
725LMYGY
726LMYGY
727LMYGY
728LMYGY
729LMYGY
730LMYGY
731LMYGY
732LMYGY
733LMYGY
734LMYGY
735LMYGY
736LMYGY
737LMYGY
738LMYGY
739LMYGY
740LMYGY
741LMYGY
742LMYGY
743LMYGY
744LMYGY
745LMYGY
746LMYGY
747LMYGY
748LMYGY
749LMYGY
750LMYGY
751LMYGY
752LMYGY
753LMYGY
754LMYGY
755LMYGY
756LMYGY
757LMYGY
758LMYGY
759LMYGY
760LMYGY
761LMYGY
762LMYGY
763LMYGY
764LMYGY
765LMYGY
766LMYGY
767LMYGY
768LMYGY
769LMYGY
770LMYGY
771LMYGY
772LMYGY
773LMYGY
774LMYGY
775LMYGY
776LMYGY
777LMYGY
778LMYGY
779LMYGY
780LMYGY
781LMYGY
782LMYGY
783LMYGY
784LMYGY
785LMYGY
786LMYGY
787LMYGY
788LMYGY
789LMYGY
790LMYGY
791LMYGY
792LMYGY
793LMYGY
794LMYGY
795LMYGY
796LMYGY
797LMYGY
798LMYGY
799LMYGY
800LMYGY
801LMYGY
802LMYGY
803LMYGY
804LMYGY
805LMYGY
806LMYGY
807LMYGY
808LMYGY
809LMYGY
810LMYGY
811LMYGY
812LMYGY
813LMYGY
814LMYGY
815LMYGY
816LMYGY
817LMYGY
818LMYGY
819LMYGY
820LMYGY
821LMYGY
822LMYGY
823LMYGY
824LMYGY
825LMYGY
826LMYGY
827LMYGY
828LMYGY
829LMYGY
830LMYGY
831LMYGY
832LMYGY
833YMYEY
834YMYEY
835YMYEY
836YMYEY
837YMYEY
838YMYEY
839YMYEY
840YMYEY
841YMYEY
842YMYEY
843YMYEY
844YMYEY
845YMYEY
846YMYEY
847YMYEY
848YMYEY
849YMYEY
850YMYEY
851YMYEY
852YMYEY
853YMYEY
854YMYEY
855YMYEY
856YMYEY
857YMYEY
858YMYEY
859YMYEY
860YMYEY
861YMYEY
862YMYEY
863YMYEY
864YMYEY
865YMYEY
866YMYEY
867YMYEY
868YMYEY
869YMYEY
870YMYEY
871YMYEY
872YMYEY
873YMYEY
874YMYEY
875YMYEY
876YMYEY
877YMYEY
878YMYEY
879YMYEY
880YMYEY
881YMYEY
882YMYEY
883YMYEY
884YMYEY
885YMYEY
886YMYEY
887YMYEY
888YMYEY
889YMYEY
890YMYEY
891YMYEY
892YMYEY
893YMYEY
894YMYEY
895YMYEY
896YMYEY
897MMNEY
898MMNEY
899MMNEY
900MMNEY
901MMNEY
902MMNEY
903MMNEY
904MMNEY
905MMNEY
906MMNEY
907MMNEY
908MMNEY
909MMNEY
910MMNEY
911MMNEY
912MMNEY
913MMNEY
914MMNEY
915MMNEY
916MMNEY
917MMNEY
918MMNEY
919MMNEY
920MMNEY
921MMNEY
922MMNEY
923MMNEY
924MMNEY
925MMNEY
926MMNEY
927MMNEY
928MMNEY
929MHYGY
930MHYGY
931MHYGY
932MHYGY
933MHYGY
934MHYGY
935MHYGY
936MHYGY
937MHYGY
938MHYGY
939MHYGY
940MHYGY
941MHYGY
942MHYGY
943MHYGY
944MHYGY
945MHYGY
946MHYGY
947MHYGY
948MHYGY
949MHYGY
950MHYGY
951MHYGY
952MHYGY
953MHYGY
954MHYGY
955MHYGY
956MHYGY
957MHYGY
958MHYGY
959MHYGY
960MHYGY
961LMNEN
962LMNEN
963LMNEN
964LMNEN
965LMNEN
966LMNEN
967LMNEN
968LMNEN
969LMNEN
970LMNEN
971LMNEN
972LMNEN
973LMNEN
974LMNEN
975LMNEN
976LMNEN
977LMNEN
978LMNEN
979LMNEN
980LMNEN
981LMNEN
982LMNEN
983LMNEN
984LMNEN
985LMNEN
986LMNEN
987LMNEN
988LMNEN
989LMNEN
990LMNEN
991LMNEN
992LMNEN
993LMNEN
994LMNEN
995LMNEN
996LMNEN
997LMNEN
998LMNEN
999LMNEN
1000LMNEN
1001LMNEN
1002LMNEN
1003LMNEN
1004LMNEN
1005LMNEN
1006LMNEN
1007LMNEN
1008LMNEN
1009LMNEN
1010LMNEN
1011LMNEN
1012LMNEN
1013LMNEN
1014LMNEN
1015LMNEN
1016LMNEN
1017LMNEN
1018LMNEN
1019LMNEN
1020LMNEN
1021LMNEN
1022LMNEN
1023LMNEN
1024LMNEY
## 函数 - C4.5分类决策树算法
    webTJ.Datamining.setCTree(arrs,srrs);
##参数
    【arrs,srrs】
    【训练样本和决策数组,学习样本数组】

代码样例

var oTxt="Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,G,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|Y,H,N,E,N|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|M,H,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,M,N,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,G,Y|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|L,L,Y,E,N|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|M,L,Y,E,Y|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,M,N,G,N|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|Y,L,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|L,M,Y,G,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|Y,M,Y,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,M,N,E,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|M,H,Y,G,Y|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,N|L,M,N,E,Y";
var oArrs=webTJ.getArrs(oTxt,"|",",");
var oSrrs=[['M','H','Y','G','Y'],['L','M','N','E','N'],['M','H','N','G','Y']];
webTJ.Datamining.setCTree(oArrs,oSrrs);

在函数webTJ.Datamining.setC45中,训练样本、决策特征变量样本和学习样本都以数组形式表达,决策特征变量样本为最后一列。如果学习样本只有一组,应按一维数组形式输入,如['M','H','N','G','Y']。

五、案例分析

posted @ 2017-05-18 17:11  银河统计  阅读(4395)  评论(0编辑  收藏  举报