重要
Lakebase Autoscaling 是 Lakebase 的最新版本更新,具有自动缩放计算、缩放到零、分支和即时还原功能。 有关支持的区域,请参阅 区域可用性。 如果你是 Lakebase 预配的用户,请参阅 Lakebase 预配。
AI 代理需要持久存储才能跨轮次和会话维护上下文。 Lakebase 自动缩放提供了一个完全托管的 Postgres 后端,用于存储代理状态和内存,以本机方式与 Databricks 身份验证集成,并自动与工作负荷进行缩放。
短期与长期记忆
| 短期内存 | 长期记忆 |
|---|---|
| 使用线程 ID 和检查点在单个会话中捕捉上下文。 让客服人员通过了解之前的对话能够回答后续问题。 |
跨多个对话提取和存储关键见解。 启用基于过去交互的个性化响应。 构建一个随时间推移而改进的用户知识库。 |
可以在同一代理中实现任一或两种内存类型。
部署选项
两个 Databricks 部署目标支持 Lakebase 支持的代理内存:
Databricks 应用:使用 LangGraph 检查点或 OpenAI 代理 SDK 将代理部署为具有短期或长期内存的交互式应用程序。 Databricks 自动处理应用和 Lakebase 之间的身份验证。 请参阅 AI 代理内存。
马赛克 AI 模型服务:使用 Lakebase 支持的检查点将代理部署到模型服务终结点。 支持 LangGraph 时间旅行,从任何检查点恢复或分支对话。 请参阅 AI 代理内存(模型服务)。
Implementation
有关完整的设置说明、应用模板和笔记本示例,请参阅: