Hugging News #0407: Google AI 的 Pix2Struct 来啦、开发者资源页面发布
2023/4/8 1:22:11
本文主要是介绍Hugging News #0407: Google AI 的 Pix2Struct 来啦、开发者资源页面发布,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!
社区活动
ControlNet 微调冲刺活动
为了帮助更好地使用 ControlNet 探索 AI 绘画,我们在全球社区联合 Google Cloud 一起举办了这次 🚀 JAX / Diffusers 社区冲刺活动。请在这里 查看本次活动的详细信息。活动很快就截止报名了,再次诚挚邀请参加!
产品更新
新的 Space 应用模版: ZenML
ZenML 是一个可扩展的开源 MLOps 框架,为数据科学家、ML 工程师和 MLOps 开发者创建可移植、生产就绪的 MLOps 管道。你可以选择使用 Docker 作为 Space 应用的 SDK,并选择 ZenML 作为模版即可。
Not-For-All-Eyes 标签
我们新添加了“Not-For-All-Eyes”标签,该标签将用于标记包含可能不适合所有受众的内容的数据集等内容。你可以在个人设置里选择忽略这个标签提醒。
开源更新
🤗 💗 🧑💻
我们上线了一个专题页面,列举了作为软件开发者可以使用的 Hugging Face 平台的资源。
https://hf.co/spaces/huggingface/devs
Google AI 的 Pix2Struct 现已在 🤗 Transformers 中提供
Google AI 的 Pix2Struct 现已在 🤗 Transformers 中提供,Pix2Struct 是一种预先训练的图像到文本模型,用于纯视觉语言理解。该模型通过学习将网页的屏幕截图解析成简化的 HTML 来进行预训练。Pix2Struct 还引入了可变分辨率输入表示和更灵活的语言和视觉输入集成,其中语言提示(如问题)直接呈现在输入图像的顶部。该模型在四个领域的九项任务中取得了最先进的结果,包括文档、插图、用户界面和自然图像。
手把手教你使用 ControlNet
ControlNet 这个神经网络模型使得用户可以通过施加额外条件,细粒度地控制扩散模型的生成过程。这一技术最初由 Adding Conditional Control to Text-to-Image Diffusion Models 这篇论文提出,并很快地风靡了扩散模型的开源社区。来回顾我们本周的文章,学习如何使用 ControlNet!
以上就是本周大事件,祝大家有一个愉快的周末!
这篇关于Hugging News #0407: Google AI 的 Pix2Struct 来啦、开发者资源页面发布的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-15SendGrid 的 Go 客户端库怎么实现同时向多个邮箱发送邮件?-icode9专业技术文章分享
- 2024-11-15SendGrid 的 Go 客户端库怎么设置header 和 标签tag 呢?-icode9专业技术文章分享
- 2024-11-12Cargo deny安装指路
- 2024-11-02MongoDB项目实战:从入门到初级应用
- 2024-11-01随时随地一键转录,Google Cloud 新模型 Chirp 2 让语音识别更上一层楼
- 2024-10-25Google Cloud动手实验详解:如何在Cloud Run上开发无服务器应用
- 2024-10-24AI ?先驱齐聚 BAAI 2024,发布大规模语言、多模态、具身、生物计算以及 FlagOpen 2.0 等 AI 模型创新成果。
- 2024-10-20goland工具下,如修改一个项目的标准库SDK的版本-icode9专业技术文章分享
- 2024-10-17Go学习:初学者的简单教程
- 2024-10-17Go学习:新手入门完全指南