2017年4月25日

朴素贝叶斯(naive bayes)

摘要: #coding=utf-8 #Naive Bayes #Calculate the Prob. of class:clsdef P(data,cls_val,cls_name="class"): cnt = 0.0 for e in data: if e[cls_name] == cls_val: 阅读全文

posted @ 2017-04-25 22:35 多一点 阅读(436) 评论(0) 推荐(0) 编辑

C4.5算法(摘抄)

摘要: 1. C4.5算法简介 C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到类别的映射关系,并且这个映射能用于对新的类别未知的实体进行 阅读全文

posted @ 2017-04-25 14:57 多一点 阅读(2937) 评论(0) 推荐(0) 编辑

ID3算法(2)

摘要: 今天,我来讲解的是决策树。对于决策树来说,主要有两种算法:ID3算法和C4.5算法。C4.5算法是 对ID3算法的改进。今天主要先讲ID3算法,之后会讲C4.5算法和随机森林等。 Contents 1. 决策树的基本认识 2. ID3算法介绍 3. 信息熵与信息增益 4. ID3算法的C++实现 1 阅读全文

posted @ 2017-04-25 14:14 多一点 阅读(357) 评论(0) 推荐(0) 编辑

ID3算法(1)

摘要: 1 简述1.1 id3是一种基于决策树的分类算法,由J.Ross Quinlan在1986年开发。id3根据信息增益,运用自顶向下的贪心策略建立决策树。信息增益用于度量某个属性对样本集合分类的好坏程度。由于采用了信息增益,id3算法建立的决策树规模比较小,查询速度快。id3算法的改进是C4.5算法, 阅读全文

posted @ 2017-04-25 14:05 多一点 阅读(2410) 评论(0) 推荐(0) 编辑

导航