概要

注释

有关更多详细信息，请参阅 “文本和图像 ”选项卡！

在本模块中，我们在 Microsoft Foundry 中探索了支持视觉的模型，以及如何使用这些模型分析图像以及生成原始图像和视频。

该模块涵盖了支持图像分析的多模式模型。我们还介绍了图像生成模型，例如 GPT-Image 系列中的模型，用于使用 Foundry 工具和 API 从提示创建和编辑图像。最后，我们引入了 Sora 模型的视频生成功能，它通过交互式平台和编程异步 REST 工作流实现文本转视频和图像转视频的创建。

总的来说，Microsoft Foundry 中的视觉 AI 模型有助于弥合视觉数据和基于语言的 AI 之间的差距。它们使得实现文档和图像分析、视觉助手、辅助功能工具以及多模式 AI 代理等场景成为可能，使图像理解成为现代 AI 应用程序的自然延伸。

若要了解详细信息，请查看以下链接：

反馈

此页面是否有帮助？