【学习笔记】机器学习(西瓜书)- 周志华
2021/7/13 23:38:52
本文主要是介绍【学习笔记】机器学习(西瓜书)- 周志华,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
第一章 绪论
1.1 什么是机器学习
-
通过计算的手段,从“数据”产生“模型”的“算法”
-
我们将新“数据”提供给“算法”,能产生关于这些“数据”的“模型”,“模型”能给我们提供相应的判断
-
tips:本书模型指机器学习的结果
1.2 基本术语
-
数据集(data set):一组样本(sample)的集合
-
样本(sample):样本是针对实际个体的数据描述
-
属性(attribute):反映样本某方面的特点的事项分类
-
属性值(attribute value):属性的值
-
样本空间(sample space)/属性空间(attribute space):属性张成的空间
例如把
色泽
,根蒂
,敲声
三个属性作为三个坐标轴,可以张成一个用于描述西瓜的三维空间,每个西瓜对应空间里的一个点,点就是坐标向量,所以我们也可以把样本称为“特征向量”(feature vector) -
数据集的公式含义
令\(D=\{x_1,x_2...,x_m\}\)表示包含m个样本的数据集,每个样本有\(d\)个属性,则每个样本\(x_i=\{x_{i1},x-{i2},...,x_{id}\}\)是d维样本空间\(\chi\)的一个向量,\(x_i\in\chi\),\(X_{ij}\)是\(x_i\)在第j个属性上的取值,d是样本\(x_i\)的维数 -
训练与假设(hypothesis)
通过学习(leaning)
或训练(training)
数据得到模型
,过程中使用的数据称为训练数据
,每个样本为训练样本
,训练样本组成训练集学得的模型对应关于数据的某种规律,被称为假设
-
预测与样例
通过已有的信息,判断一个瓜的好坏就是预测
,这里瓜的好或坏就是标记(label)
,样本
和标记
组合在一起就是样例
用\((x_{ij},y_i)\)表示第i个样例
,其中\(y_i\in \mathcal{Y}\)是样本\(x_i\)的标记,\(\mathcal{Y}\)是所有标记
的集合,称为标记空间
、输出空间
-
分类与预测
这篇关于【学习笔记】机器学习(西瓜书)- 周志华的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-12-17机器学习资料入门指南
- 2024-12-06如何用OpenShift流水线打造高效的机器学习运营体系(MLOps)
- 2024-12-06基于无监督机器学习算法的预测性维护讲解
- 2024-12-03【机器学习(六)】分类和回归任务-LightGBM算法-Sentosa_DSML社区版
- 2024-12-0210个必须使用的机器学习API,为高级分析助力
- 2024-12-01【机器学习(五)】分类和回归任务-AdaBoost算法-Sentosa_DSML社区版
- 2024-11-28【机器学习(四)】分类和回归任务-梯度提升决策树(GBDT)算法-Sentosa_DSML社区版
- 2024-11-26【机器学习(三)】分类和回归任务-随机森林(Random Forest,RF)算法-Sentosa_DSML社区版
- 2024-11-18机器学习与数据分析的区别
- 2024-10-28机器学习资料入门指南