决策树 原创

1138-魏同学

发表文章数:75

首页 » 算法 » 正文

决策树
                    原创
决策树
                    原创
决策树的优缺点:
优点:简单的理解和解释,树木可视化
需要很少的数据准备,其他技术通常需要数据归一化。
缺点:决策树学习者可以创建不能很好地推广数据的过于复杂的树,称为过拟合。

改进:剪枝或随机森林

集成学习方法:随机森林
集成学习通过建立几个模型组合来解决单一预测问题。他的原理是生成多个分类器/模型,各自独立的学习和作出预测。这些预测最后结合成单预测,因此优于任何一个单分类的做出预测。

随机森林:在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。
1、随机在N个样本当中选择一个样本,重复N次 (样本可能重复)
2、随即在M个特征当中选出m个特征
(bootstrap抽样)
为什么进行随机抽样:如果不进行随机抽样,每棵树的训练集都相同,最终训练出的树分类结果也是完全相同的。
为什么要有放回的抽样:
如果不是有放回的抽样,那么每棵树的训练样本都是不同的,都是没有交集的,这样每棵树都是“有偏的”,都是绝对“片面的”也就是说每棵树训练出来都是有很大的差异的,而随机森林最后分类取决于多棵树(弱分类器)的投票表决。
决策树
                    原创

未经允许不得转载:作者:1138-魏同学, 转载或复制请以 超链接形式 并注明出处 拜师资源博客
原文地址:《决策树 原创》 发布于2020-11-25

分享到:
赞(0) 打赏

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu3.3主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录