首页文章正文

决策树能处理连续数据么,决策树可以处理字母吗

支持向量机是一种非参数模型 2023-09-26 14:06 525 墨鱼
支持向量机是一种非参数模型

决策树能处理连续数据么,决策树可以处理字母吗

(ˉ▽ˉ;) |连续值处理因为连续属性的可取值数目不再有限,因此不能像前面处理离散属性枚举离散属性取值来对结点进行划分。因此需要连续属性离散化,常用的离散化策略是二分法,这个技术也是C4连续值处理:决策树处理的是离散数据,当离散数据中混杂着连续数据时,我们希望将连续数据离散化。我们可以将连续取值的值域划分为多个区间,每个区间视为一个属

在sklearn所实现的决策树算法中,对于连续型特征变量的离散化具体做法是先对原始特征进行排序处理,然后取所有连续两个值的均值来离散化整个连续型特征变量[3字体字号代码语言

回归树也可以处理连续值,它将数据集切分成若干个区域,并在每个区域内使用一个常数来表示目标变量的值。在回归树中,每个区域都是连续的,因此可以处理连续值。总之,在决策树中在实际学习任务中,决策树不仅基于离散属性,而且使用连续属性。因为连续属性的值的数目不再受到限制,所以节点不能直接根据连续属性的值进行分割。在

(-__-)b 大多数关于决策树的文章给出实例都是基于数据比较优质,可以直接拿来分析处理。然而一般情况下我们采集到的数据都或多或少存在一些问题,比如数据缺失,这种情况下我们需要先对数据进决策树处理连续值和缺失值的方法1.连续值采用二分法进行离散化,在C4.5中采用此方法进行处理数据,将连续数据按从小到大排序,以步长n从左到右移动,分割线左边

后台-插件-广告管理-内容页尾部广告(手机)

标签: 决策树可以处理字母吗

发表评论

评论列表

灯蓝加速器 Copyright @ 2011-2022 All Rights Reserved. 版权所有 备案号:京ICP1234567-2号