查看: 144|回复: 0

C4.5 决策树

[复制链接]
新浪微博达人勋 xenron  实名认证
论坛徽章:
251
股票徽章
日期:2019-09-12 14:42:59spark徽章
日期:2019-09-19 15:44:06人工智能徽章
日期:2019-09-19 15:47:00区块链徽章
日期:2019-09-19 15:47:29python徽章
日期:2019-09-19 15:47:56
发表于 2019-5-16 23:37 | 显示全部楼层 |阅读模式

数据库 模型 算法 测试 机器学习

C4.5算法机器学习算法中的一种分类决策树算法,其核心算法是ID3 算法.
C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:
1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;
2) 在树构造过程中进行剪枝;
3) 能够完成对连续属性的离散化处理;
4) 能够对不完整数据进行处理。

C4.5算法有如下优点:
产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。

1、机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。
树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。
决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。
2、 从数据产生决策树的机器学习技术叫做决策树学习,  通俗说就是决策树。
3、决策树学习也是数据挖掘中一个普通的方法。在这里,每个决策树都表述了一种树型结构,他由他的分支来对该类型的对象依靠属性进行分类。
每个决策树可以依靠对源数据库的分割进行数据测试。
这个过程可以递归式的对树进行修剪。当不能再进行分割或一个单独的类可以被应用于某一分支时,递归过程就完成了。
另外,随机森林分类器将许多决策树结合起来以提升分类的正确率。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2019-9-20 19:55 , Processed in 0.176441 second(s), 31 queries .

关闭

扫一扫加入
本版微信群