搜索结果
查询Tags标签: 决策树,共有 165条记录-
决策树
决策树思维导图[3] 1 信息论基础 1.1 熵 熵是度量样本集合纯度最常用的一种指标。假定当前样本集合\(D\)中第\(k\)类样本所占的比例为\(p_{k}(k=1,2,...,|K|)\),则样本集合\(D\)的熵定义为: \[Ent(D)=-\sum_{k=1}^{K}p_{k}log_{2}p_{k} \]\(Ent(D)\)的值越小,则\(D\)的…
2021/10/30 23:41:11 人评论 次浏览 -
决策树
决策树思维导图[3] 1 信息论基础 1.1 熵 熵是度量样本集合纯度最常用的一种指标。假定当前样本集合\(D\)中第\(k\)类样本所占的比例为\(p_{k}(k=1,2,...,|K|)\),则样本集合\(D\)的熵定义为: \[Ent(D)=-\sum_{k=1}^{K}p_{k}log_{2}p_{k} \]\(Ent(D)\)的值越小,则\(D\)的…
2021/10/30 23:41:11 人评论 次浏览 -
机器学习——决策树
定义 分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型:内部结点和叶节点。内部结点表示一个特征或属性,叶节点表示一个类。算法结构 决策树在逻辑上以树的形式存在,包含根节点、内部结点和叶节点。 根节…
2021/10/28 23:15:50 人评论 次浏览 -
机器学习——决策树
定义 分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型:内部结点和叶节点。内部结点表示一个特征或属性,叶节点表示一个类。算法结构 决策树在逻辑上以树的形式存在,包含根节点、内部结点和叶节点。 根节…
2021/10/28 23:15:50 人评论 次浏览 -
决策树- 随机森林/GBDT/XGBoost
随机森林单颗决策树缺点:易过拟合的缺点 传统机器学习处理过拟合通常采用集成学习 (多颗树投票)随机森林的生成方法【在bagging的基础上+CART树】: 1.从总数为N样本集中通过重采样的方式产生n个样本 (Bootstrap) 2.假设样本特征数目为a,对n个样本选择其中k个特征, 用建…
2021/10/22 23:09:56 人评论 次浏览 -
决策树- 随机森林/GBDT/XGBoost
随机森林单颗决策树缺点:易过拟合的缺点 传统机器学习处理过拟合通常采用集成学习 (多颗树投票)随机森林的生成方法【在bagging的基础上+CART树】: 1.从总数为N样本集中通过重采样的方式产生n个样本 (Bootstrap) 2.假设样本特征数目为a,对n个样本选择其中k个特征, 用建…
2021/10/22 23:09:56 人评论 次浏览 -
python利用sklearn对企业数据分析并预测
题目大概就是利用企业发票的信息分析出企业是否为异常企业,其中企业一共有3万多家,发票数大约有400多万条信息,发票明细信息有1000多万条信息 因为之前已经采用一些分析的方法找到了321家异常企业,所以对发票表进行分析,利用sklearn建立决策树模型,并利用训练集对其…
2021/10/21 22:39:27 人评论 次浏览 -
python利用sklearn对企业数据分析并预测
题目大概就是利用企业发票的信息分析出企业是否为异常企业,其中企业一共有3万多家,发票数大约有400多万条信息,发票明细信息有1000多万条信息 因为之前已经采用一些分析的方法找到了321家异常企业,所以对发票表进行分析,利用sklearn建立决策树模型,并利用训练集对其…
2021/10/21 22:39:27 人评论 次浏览 -
python机器学习-鸢尾花决策树
决策树APIclass sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None)决策树分类器 criterion:默认是’gini’系数,也可以选择信息增益的熵’entropy’ max_depth:树的深度大小 random_state:随机数种子其中会有些超参数:max_de…
2021/10/21 11:39:40 人评论 次浏览 -
python机器学习-鸢尾花决策树
决策树APIclass sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None)决策树分类器 criterion:默认是’gini’系数,也可以选择信息增益的熵’entropy’ max_depth:树的深度大小 random_state:随机数种子其中会有些超参数:max_de…
2021/10/21 11:39:40 人评论 次浏览 -
python:决策树 分类模型
决策树 分类模型 iris_dtree.py import numpy as np from sklearn import datasets from sklearn.metrics import confusion_matrix,accuracy_score from sklearn.model_selection import train_test_split from sklearn import preprocessing# 加载鸢尾花数据集 iris_X,i…
2021/10/16 17:39:31 人评论 次浏览 -
python:决策树 分类模型
决策树 分类模型 iris_dtree.py import numpy as np from sklearn import datasets from sklearn.metrics import confusion_matrix,accuracy_score from sklearn.model_selection import train_test_split from sklearn import preprocessing# 加载鸢尾花数据集 iris_X,i…
2021/10/16 17:39:31 人评论 次浏览 -
机器学习算法之决策树与随机森林的原理和常用参数
综述:随机森林和决策树一样都可用于分类和回归,然而随机森林的模型结果往往优于决策树。 本篇文章主要讲解以上两种ML算法的原理和常用参数。 一、 原理 1.1 决策树 1.1.1决策树释义 决策树是一种非参数的有监督学习方法。本质上是从训练数据集中归纳出一组决策规则,用…
2021/10/2 20:44:54 人评论 次浏览 -
机器学习算法之决策树与随机森林的原理和常用参数
综述:随机森林和决策树一样都可用于分类和回归,然而随机森林的模型结果往往优于决策树。 本篇文章主要讲解以上两种ML算法的原理和常用参数。 一、 原理 1.1 决策树 1.1.1决策树释义 决策树是一种非参数的有监督学习方法。本质上是从训练数据集中归纳出一组决策规则,用…
2021/10/2 20:44:54 人评论 次浏览 -
决策树算法6-案例:泰坦尼克号乘客生存预测
1 案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。 造成海难失事的原因之一是乘客和…
2021/9/23 22:11:28 人评论 次浏览