啥是大模型1

2024/12/20 21:04:17

本文主要是介绍啥是大模型1,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

生成式AI与AIGC

https://img1.sycdn.imooc.com/67637a1f00010d0f16020614.jpg

当aigc这个词在国内火爆的同时,海外更流行的另外一个词--Generative AI,从字面上理解,生成式AI和AIGC之间的关系很好理解,生成式AI所生成的内容就是AIGC。

所以ChatGPT、Github Copilot、MidJourney等都属于生成式AI,但因为AIGC这个词在国内比生成式AI更加流行,很多语境下AIGC也被用于指代生成式AI。


生成式AI、AI、机器学习、监督学习、无监督学习、强化学习、深度学习、大语言模型等等词汇之间又是什么关系呢?

https://img1.sycdn.imooc.com/67637b090001492316280788.jpg

https://img1.sycdn.imooc.com/67637b4e0001dc2f16320964.jpg


AI也叫人工智能,是计算机科学下的一个学科,旨在让计算机系统去模拟人类的智能从而解决问题和完成任务,早在1956年,AI就被确立为了一个学科领域,在此后数十年间经历过多轮低估和繁荣。

https://img1.sycdn.imooc.com/6764c3ef0001121009740918.jpg

机器学习是AI的一个子集,它的核心在于不需要人类做显示编程,而是让计算机通过算法自行学习和改进去识别模式、做出预测和决策。

https://img1.sycdn.imooc.com/6764c415000138bd12840576.jpg

https://img1.sycdn.imooc.com/6764c4530001187a15640768.jpg

比如如果我们通过代码告诉电脑,图片里有红色说明是玫瑰,图片里有橙色说明是向日葵,那程序对花种类的判断就是通过人类直接明确编写逻辑达成的,不属于机器学习,机器嘛也没学。

https://img1.sycdn.imooc.com/6764c4a90001835d15340836.jpg

但如果我们给电脑大量玫瑰和向日葵的图片,让电脑自行识别模式总结规律,从而能对没见过的图片进行预测和判断,这种就是机器学习。

https://img1.sycdn.imooc.com/6764c4e00001cbc114760966.jpg

机器学习领域下有多个分支,包括监督学习、无监督学习、强化学习。

https://img1.sycdn.imooc.com/6764c50800014cc614460762.jpg

在监督学习里,机器学习算法会接受有标签的训练数据,标签就是期望的输出值,所以每个训练数据点都既包括输入特征,也包括期望的输出值。算法的目标是学习输入和输出之间的映射关系,从而在给定新的输入特征后能够准确预测出相应的输出值。

https://img1.sycdn.imooc.com/6764c5640001d9f815680922.jpg

经典的监督学习任务包括分类,也就是把数据划分为不同的类别以及回归,也就是对数值进行预测,比如拿一堆猫猫狗狗的照片和照片对应的猫狗标签进行训练,然后让模型根据没见过的照片预测是猫还是狗,这就属于分类。

https://img1.sycdn.imooc.com/6764c5a40001510416400774.jpg

拿一些房子特征的数据,比如面积卧室树是否带阳台等,和相应的房价作为标签进行训练,然后让模型根据没见过的房子的特征预测房价,这就属于回归。

https://img1.sycdn.imooc.com/6764c6e20001355716960734.jpg

无监督学习和监督学习不同的是,他学习的数据是没有标签的,所以算法的任务是自主发现数据里的模式或规律,经典的无监督学习任务包括聚类,也就是把数据进行分组。

https://img1.sycdn.imooc.com/6764c72800015c3c17120954.jpg

比如拿一堆新闻文章让模型根据主题或内容的特征自动把相似文章进行组织。

https://img1.sycdn.imooc.com/6764c76000019dfc13740786.jpg

而强化学习则是让模型在环境里采取行动获得结果反馈,从反馈里学习,从而能在给定情况下采取最佳行动

来最大化奖励或是最小化损失。

https://img1.sycdn.imooc.com/6764c7900001526c14680770.jpg

所以就跟训小狗似的,刚开始的时候小狗会随心所欲做出很多动作,但随着和训犬师的互动,小狗会发现某些动作能够获得零食,某些动作没有零食,某些动作甚至会遭受惩罚,通过观察动作和奖惩之间的联系,小狗的行为会逐渐接近训犬师的期望。

https://img1.sycdn.imooc.com/6764c7d70001462b14360922.jpg

强化学习可以应用在很多任务上,比如说让模型下围棋获得不同行动导致的奖励或损失反馈,从而在一局局游戏里优化策略,学习如何采取行动达到高分。

https://img1.sycdn.imooc.com/6764c8200001863215200956.jpg

那问题来了,深度学习属于这三类里的哪一类呢?它不属于里面的任何一类。

https://img1.sycdn.imooc.com/6764c85d0001749513980914.jpg


深度学习是机器学习的一个方法,核心在于使用人工神经网络模仿人脑处理信息的方式,通过层次化的方法

提取和表示数据的特征,神经网络是由许多基本的计算和储存单元组成,这些单元被称为神经元,这些神经元通过层层连接来处理数据,并且深度学习模型通常有很多层,因此称为“深度”。

https://img1.sycdn.imooc.com/6764c8d40001a39216680904.jpg

比如要让计算机识别小猫的照片,在深度学习中,数据首先被传递到一个输入层,就像人类的眼睛看到图片一样,然后数据通过多个隐藏层,每一层都会对数据进行一些复杂的数学运算来帮助计算机理解图片中的特征,例如小猫的耳朵眼睛等等,最后计算机会输出一个答案,表明这是否是一张小猫的图片。

神经网络可以用于监督学习、无监督学习、强化学习,所以深度学习不属于他们的子集。

https://img1.sycdn.imooc.com/6764c9200001b57210000898.jpg

生成式AI是深度学习的一种应用,它利用神经网络来识别现有内容的模式和结构,学习生成新的内容,内容形式可以是文本、图片、音频等等。

https://img1.sycdn.imooc.com/6764c98a000133a416660922.jpg

而大语言模型也叫LLM(arge language model),也是深度学习的一种应用。

https://img1.sycdn.imooc.com/6764c9ac0001712411460922.jpg

专门用于进行自然语言处理任务,大语言模型里面的“大”字说明模型的参数量非常大,可能有数十亿甚至到万亿个。

https://img1.sycdn.imooc.com/6764cab60001ae5d17100926.jpg

而且训练过程中也需要海量文本数据集,所以能更好地理解自然语言以及生成高质量的文本。

https://img1.sycdn.imooc.com/6764cae10001fdc615380946.jpg

大语言模型的例子有非常多,比如国外的GPT、LLaMa,国内的ERNIE、ChatGLM等可以进行文本的理解和生成

,以GBT-3这个模型为例子,它会根据输入提示以及前面生成过的词,通过概率计算逐步生成下一个词或头token输出文本序列。

















这篇关于啥是大模型1的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程