重磅:谷歌发布最强大AI模型【Google Gemini】

2023/12/15 21:02:58

本文主要是介绍重磅:谷歌发布最强大AI模型【Google Gemini】,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

图片

一、前言

北京时间 2023年12 月 13 日Google 发布了最新的 Gemini Pro模型,并且提供了 API 访问。

一个更好的消息是:Gemini Pro 可免费使用。赶紧体验起来吧~

二、关于

Google Gemini是一款由Google AI开发的大型语言模型聊天机器人。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的产品,成为迄今为止最强大的AI系统之一。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。Gemini对标的是GPT-4,并在试图证明优于OpenAI的GPT-4。

Google Gemini 有三种版本,分别适用于不同场景:Ultra、Pro 和 Nano

  • Gemini Ultra 是最大的版本,具有最强大的性能。可用于大型数据中心等,属于处理高复杂度任务的模型。

  • Gemini Pro 是面向开发者的版本,用于各种扩展任务的最佳模型。且已搭载于谷歌的对话机器人Bard中。它可以通过 Google AI Studio 或 Google Cloud Vertex AI 获取。

  • Gemini Nano 是应用于智能手机等移动设备终端上最高效的模型。

三、特点

  • 多模态能力:Gemini可以处理文本、图像、代码、音频和视频等多种类型的信息。

  • 强大的对话能力:Gemini能够进行复杂的对话,并理解用户的上下文。

  • 自然流畅的语言生成:Gemini生成的语言非常流畅和自然。

四、Gemini总结

  • 它具备丰富的功能,包括函数调用、数据嵌入、语义检索、自定义知识嵌入以及聊天功能

  • 在专业的基准测试中,Gemini Pro 的表现超越了其他同类模型

  • 当前版本配备了 32K 文本上下文窗口,未来将推出拥有更广阔上下文窗口的版本

  • Gemini Pro 可处理文本输入并生成文本输出。还推出了一个专门的 Gemini Pro 视觉多模态终端,能够处理图像和文本输入,输出文本

  • 它支持 全球超过 180 个国家和地区 的 38 种语言

  • Gemini Pro 提供了多种 SDK,以便开发者在不同平台上构建应用,包括 Python、Android (Kotlin)、Node.js、Swift 和 JavaScript,助力开发者在任何平台上快速构建应用

  • 当前Gemini Pro 可免费使用(存在一定使用限制),并且其定价将十分 有竞争力

  • Google 还提供了一个免费的在线开发工具 Google AI Studio,你可以用它快速构建 Gemini 应用,Google AI Studio

  • 关于计费方式:跟OpenAI 计算单位不一样, Google 是按字符,OpenAI 是按 Token,如果是中文会便宜不少

五、注册

1. 注册Google Cloud Platform帐户

有了Google Cloud Platform帐户,就可以通过 Google Cloud Vertex AI 或 Google AI Studio访问 Gemini Pro。

Gemini API 地址:ai.google.dev

2.Google Cloud Vertex AI

Google Cloud Vertex AI 使用 Gemini Pro,操作步骤:

  1. 登录 Google Cloud Platform

  2. 单击左侧导航栏中的 人工智能

  3. 单击 Vertex AI

  4. 单击 模型库,选择 Gemini Pro模型

  5. 打开 Language Studio

    Vertex AI:

    图片

模型库:

图片

3.Google AI Studio

Google AI Studio 使用 Gemini Pro,操作步骤:

  1. 登录 Google Cloud Platform

  2. 单击左侧导航栏中的 AI Platform

  3. 单击 AI Hub,选择 Gemini Pro

六、Gemini体验

Bard 网页

Gemini API 使用入门

Gemini API 参考

七、Gemini与GPT-4对比

  1. 按谷歌的说法Gemini在所有多模态任务中的表现都优于 GPT-4。GPT-4 只能处理图像和文本。(除了HellaSwag)

  2. Gemini 可以处理视频、音频、图像和文本。随着谷歌继续训练其工具包,它的性能可能会大大超过其他各种模型。

  3. 详情请参阅 Gemini 技术报告

  4. 进一步了解Gemini 的能力和运作方式

图片

八、进一步了解

blog.google



这篇关于重磅:谷歌发布最强大AI模型【Google Gemini】的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程