搜索结果
查询Tags标签: 决策树,共有 165条记录-
决策树算法6-案例:泰坦尼克号乘客生存预测
1 案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。 造成海难失事的原因之一是乘客和…
2021/9/23 22:11:28 人评论 次浏览 -
决策树算法2-决策树分类原理2.3-信息增益率
决策树的划分依据-信息增益率C4.5 1 背景信息增益准则ID3对可取值数目较多的属性有所偏好,为减少这种偏好可能带来的不利影响,著名的 C4.5 决策树算法[Quinlan, 1993J 不直接使用信息增益,而是使用"增益率" (gain ratio) 来选择最优划分属性.2 定义增益率:…
2021/9/22 17:11:28 人评论 次浏览 -
决策树算法2-决策树分类原理2.3-信息增益率
决策树的划分依据-信息增益率C4.5 1 背景信息增益准则ID3对可取值数目较多的属性有所偏好,为减少这种偏好可能带来的不利影响,著名的 C4.5 决策树算法[Quinlan, 1993J 不直接使用信息增益,而是使用"增益率" (gain ratio) 来选择最优划分属性.2 定义增益率:…
2021/9/22 17:11:28 人评论 次浏览 -
决策树算法2-决策树分类原理2.4-基尼值和基尼指数
1 概念CART决策树使用"基尼指数" (Gini index)来选择划分属性,分类和回归任务都可用。 基尼值Gini(D):从数据集D中随机抽取两个样本,其类别标记不一致的概率Gini(D)值越小,数据集D的纯度越高。2 计算数据集 D 的纯度可用基尼值来度量:\(p_k=\frac{c^k}{…
2021/9/22 17:10:08 人评论 次浏览 -
决策树算法2-决策树分类原理2.4-基尼值和基尼指数
1 概念CART决策树使用"基尼指数" (Gini index)来选择划分属性,分类和回归任务都可用。 基尼值Gini(D):从数据集D中随机抽取两个样本,其类别标记不一致的概率Gini(D)值越小,数据集D的纯度越高。2 计算数据集 D 的纯度可用基尼值来度量:\(p_k=\frac{c^k}{…
2021/9/22 17:10:08 人评论 次浏览 -
python10——选择大学的决策树
题目: 代码: # -*- coding: utf-8 -*-judge_a = input(你在意宿舍有空调么?(是or否)\n) judge_c = input(你在意女生的数量么?(是or否)\n) if judge_a == 是:if judge_c == 是:print(\n复旦大学)else:print(\n清华大学) else:if judge_c == 是:print(\n北京大学)else…
2021/9/15 22:05:24 人评论 次浏览 -
python10——选择大学的决策树
题目: 代码: # -*- coding: utf-8 -*-judge_a = input(你在意宿舍有空调么?(是or否)\n) judge_c = input(你在意女生的数量么?(是or否)\n) if judge_a == 是:if judge_c == 是:print(\n复旦大学)else:print(\n清华大学) else:if judge_c == 是:print(\n北京大学)else…
2021/9/15 22:05:24 人评论 次浏览 -
从0开始学习机器学习5:决策树算法&特征工程
决策树&特征工程 目标1 简介1.1 认识决策树 2 分类原理2.1 熵2.2 决策树的划分依据一-信息增益2.3 决策树的划分依据二-信息增益率2.4 决策树的划分依据三-基尼值和基尼指数2.5 常见决策树类型比较 3 cart剪枝3.1 为什么需要剪枝3.2 常用剪枝方法 4 特征工程-特征提取…
2021/9/5 9:05:58 人评论 次浏览 -
从0开始学习机器学习5:决策树算法&特征工程
决策树&特征工程 目标1 简介1.1 认识决策树 2 分类原理2.1 熵2.2 决策树的划分依据一-信息增益2.3 决策树的划分依据二-信息增益率2.4 决策树的划分依据三-基尼值和基尼指数2.5 常见决策树类型比较 3 cart剪枝3.1 为什么需要剪枝3.2 常用剪枝方法 4 特征工程-特征提取…
2021/9/5 9:05:58 人评论 次浏览 -
DW吃瓜课程——机器学习理论知识笔记(三)
本篇是针对经典教材《机器学习》及DataWhale小组出版的配套工具书《机器学习公式详解》的学习笔记,主要以查缺补漏为主,因此对于一些自己已经熟悉的概念和内容不再进行整理。由于水平实在有限,不免产生谬误,欢迎读者多多批评指正。 第四章 决策树基本概念 决策树一般包…
2021/8/31 6:06:27 人评论 次浏览 -
DW吃瓜课程——机器学习理论知识笔记(三)
本篇是针对经典教材《机器学习》及DataWhale小组出版的配套工具书《机器学习公式详解》的学习笔记,主要以查缺补漏为主,因此对于一些自己已经熟悉的概念和内容不再进行整理。由于水平实在有限,不免产生谬误,欢迎读者多多批评指正。 第四章 决策树基本概念 决策树一般包…
2021/8/31 6:06:27 人评论 次浏览 -
拓端tecdat|R语言逻辑回归(Logistic Regression)、回归决策树、随机森林信用卡违约分析信贷数据集
原文链接:http://tecdat.cn/?p=23344 原文出处:拓端数据部落公众号 在许多网站上都可以找到一个流行的德国信贷数据集german_credit,其中包含了银行贷款申请人的信息。该文件包含1000名申请人的20条信息。 下面的代码可以用来确定申请人是否有信用,以及他(或她)是…
2021/8/14 23:06:22 人评论 次浏览 -
拓端tecdat|R语言逻辑回归(Logistic Regression)、回归决策树、随机森林信用卡违约分析信贷数据集
原文链接:http://tecdat.cn/?p=23344 原文出处:拓端数据部落公众号 在许多网站上都可以找到一个流行的德国信贷数据集german_credit,其中包含了银行贷款申请人的信息。该文件包含1000名申请人的20条信息。 下面的代码可以用来确定申请人是否有信用,以及他(或她)是…
2021/8/14 23:06:22 人评论 次浏览 -
【算法】回溯
回溯 1.概念 回溯是很经典的一个算法,什么是回溯,回溯其实是一种暴力枚举的方式,为啥都暴力了还是很经典的一种方法呢,其实是因为有些问题我们能暴力出来就不错了,就别要其他自行车了。常见的回溯类问题:组合;排列;切割;子集;棋牌; 其实回溯算法就是常说的DFS,…
2021/8/14 1:05:46 人评论 次浏览 -
【算法】回溯
回溯 1.概念 回溯是很经典的一个算法,什么是回溯,回溯其实是一种暴力枚举的方式,为啥都暴力了还是很经典的一种方法呢,其实是因为有些问题我们能暴力出来就不错了,就别要其他自行车了。常见的回溯类问题:组合;排列;切割;子集;棋牌; 其实回溯算法就是常说的DFS,…
2021/8/14 1:05:46 人评论 次浏览