概要

已完成

注释

有关更多详细信息,请参阅 “文本和图像 ”选项卡!

在本模块中,我们在 Microsoft Foundry 中探索了支持视觉的模型,以及如何使用这些模型分析图像以及生成原始图像和视频。

该模块涵盖了支持图像分析的多模式模型。 我们还介绍了图像生成模型,例如 GPT-Image 系列中的模型,用于使用 Foundry 工具和 API 从提示创建和编辑图像。 最后,我们引入了 Sora 模型的视频生成功能,它通过交互式平台和编程异步 REST 工作流实现文本转视频和图像转视频的创建。

总的来说,Microsoft Foundry 中的视觉 AI 模型有助于弥合视觉数据和基于语言的 AI 之间的差距。 它们使得实现文档和图像分析、视觉助手、辅助功能工具以及多模式 AI 代理等场景成为可能,使图像理解成为现代 AI 应用程序的自然延伸。

若要了解详细信息,请查看以下链接: