CART(CART算法)

生活百科 2023-01-26 08:57生活百科www.aizhengw.cn

CART(CART算法)

CART是一种计算方法。

CART算法
以下是算法描述:其中T代表当前样本集,当前候选属性集用T_attributelist表示。
(1)创建根节点N
(2)为N分配类别
(3)if T都属于同一类别or T中只剩下 一个样本则返回N为叶节点,否则为其分配属性
(4)for each T_attributelist中属性执行该属性上的一个划分,计算此划分的GINI係数
(5)N的测试属性test_attribute=T_attributelist中最小GINI係数的属性
(6)划分T得到T1 T2子集
(7)对于T1重複(1)-(6)
(8)对于T2重複(1)-(6)
CART算法考虑到每个节点都有成为叶子节点的可能,对每个节点都分配类别。分配类别的方法可以用当前节点中出现最多的类别,也可以参考当前节点的分类错误或者其他更複杂的方法。
CART算法仍然使用后剪枝。在树的生成过程中,多展开一层就会有多一些的信息被发现,CART算法运行到不能再长出分支为止,从而得到一棵最大的决策树。然后对这棵大树进行剪枝。
上一篇:C3日本动玩博览 下一篇:试用期

Copyright@2015-2025 www.aizhengw.cn 癌症网版板所有