吴恩达机器学习笔记-1(概览)

2021/6/9 10:23:56

本文主要是介绍吴恩达机器学习笔记-1(概览),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

目录
  • 机器学习
    • 机器学习的定义
    • 监督学习
    • 无监督学习

机器学习

21世纪,机器学习可以说是已经嵌入到我们生活中的方方面面。我们可能一天用到机器学习数十次而没有丝毫察觉。
当我们用到百度、Google等搜索引擎时,我们会觉得搜索效果很好,这其实是因为他们的机器学习算法已经知道如何对搜索结果进行排序。
当我们使用邮箱时,邮箱会自动过滤掉垃圾邮件,这也是机器学习算法实现的功能。
机器学习发源于人工智能领域,人们希望创造出具有智慧的机器。我们能够容易编程让计算机实现某些功能,比如找到从A到B的最短路径,但是难以编出一个程序让计算机去过滤垃圾邮件。容易发现,让计算机自己去学习如何去做会更加简单。
机器学习如此普遍的原因之一,是网络和自动化技术的快速发展。这使我们拥有了前所未有的大量数据集,而数据集的多少,是实现机器学习最为重要的部分

机器学习的定义

Arthur Samuel(1959)给出的定义是,使计算机不必显式编程就能学习的研究领域(Field of study that gives computers the ability to learn without being explicitly programmed.)Samuel的定义可以追溯到上世纪50年代,他自己编写了一个西洋棋程序,让计算机和自己下棋,通过观察哪些布局会赢,哪些布局会输。一段时间后程序学会了下棋,并且水平超过了编程者。
Tom Mitchell(1998)给出的定义是,一个程序能从经验E中学习,解决任务T达到性能度量P,当且仅当有了经验E后,经过P评判,程序在处理任务T时的性能有所提升。那么在西洋棋例子中,任务T就是下棋,经验E则是下了数万场棋,性能度量P则是下棋胜利的几率。

监督学习

监督学习(Supervised Learning)指,给出一个算法,需要数据集已经有正确答案。比如给定房价数据集,对于里面的每个数据,算法都应当知道对应的正确的价格,即这房子实际卖出的价格。算出更多的正确价格。
监督学习中有常见的两个问题,回归问题,分类问题。
回归问题输出的是一个连续的值,如房价。而分类问题输出的是离散的值,如明天是否下雨,是或者不是。

无监督学习

无监督学习允许计算机在不知道正确结果应该是什么样的情况下处理数据。
我们可以从不一定要了解变量影响的数据中得出结构,可以通过基于数据中变量之间的关系对数据进行聚类来得出此结构。在无监督学习的情况下,不会基于预测结果获得反馈 。
在无监督学习中,使用的数据集没有属性或者标签这一说法,意即我们不会给出所谓的“正确答案”。由计算机自行从数据中找出结构,


例子:
聚类问题:收集100万个不同的基因,然后找到一种方法,将这些基因自动归类为由于不同变量(例如寿命,位置,扮演的角色等)在某种程度上相似或相关的组。
非聚类问题: "鸡尾酒会算法", 允许你在复杂的环境中找出结构. (例如在鸡尾酒会上从一大堆声音中分辨出人声和音乐).



这篇关于吴恩达机器学习笔记-1(概览)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程