Memory Architecture

AI Agent Memory Architecture:从抽取到检索的完整设计视图

当团队开始认真做长期记忆时,问题不再是能不能存,而是存什么、何时存、如何合并、如何找回,以及放回上下文的哪个位置最合适。

  • 解释 memory generation 与 consolidation
  • 对比 vector database 与 knowledge graph
  • 说明 memory provenance 为什么决定可信度
Signal Layer Harness Engineer Index
关键阶段 4
主要存储形态 2+
核心难点 Consolidation

Memory Architecture 的四个阶段

Ingestion

原始数据可能来自用户输入、历史会话、表单、文档或系统初始化数据。

Extraction & Filtering

模型或规则层根据主题定义,只提取真正有长期价值的信息,避免记忆层膨胀。

Consolidation

系统需要处理重复、冲突、细化与过期问题,这是最体现 Harness Engineer 设计能力的部分。

常见存储架构

Vector Database

适合自然语言语义检索,能快速找到与当前查询相似的记忆片段。

Knowledge Graph

适合表达实体关系、层级结构和可追踪连接,适用于更强结构性的查询。

Hybrid Memory

很多生产系统会混合向量检索、结构化索引与缓存层,以平衡召回、精度和成本。

为什么 Memory Provenance 很关键

决定可信权重

不同来源的记忆可信度不同,用户明确表达的信息通常比工具抓取的间接结果更可靠。

帮助冲突处理

当新旧 memory 互相冲突时,来源、时间与置信度会直接影响 consolidation 决策。

支持可审计性

在生产环境里,你往往需要知道一个记忆从哪里来、何时更新、为什么被保留。

常见问题

这些问题覆盖 Harness Engineer、Context Engineering、Sessions 与 Memory 的高频搜索意图。

RAG 和 memory manager 一样吗?

不一样。RAG 更偏静态知识检索,memory manager 更偏用户相关、动态演化、可更新和可遗忘的信息管理。

Memory should be placed in system prompt or chat history?

两种都可以,但要看记忆的重要性和框架能力。放在 system instructions 权重更高,放在 history 更灵活,但噪音风险也更高。

下一步

要为 AI Agent 设计可落地的 Memory Layer 吗?

我们可以协助你完成 extraction 规则、consolidation 流程、retrieval placement 和评估指标设计。