Memory Architecture

AI Agent Memory Architecture：从抽取到检索的完整设计视图

当团队开始认真做长期记忆时，问题不再是能不能存，而是存什么、何时存、如何合并、如何找回，以及放回上下文的哪个位置最合适。

Signal Layer Harness Engineer Index

关键阶段 4

主要存储形态 2+

核心难点 Consolidation

Memory Architecture 的四个阶段

原始数据可能来自用户输入、历史会话、表单、文档或系统初始化数据。

模型或规则层根据主题定义，只提取真正有长期价值的信息，避免记忆层膨胀。

系统需要处理重复、冲突、细化与过期问题，这是最体现 Harness Engineer 设计能力的部分。

适合自然语言语义检索，能快速找到与当前查询相似的记忆片段。

适合表达实体关系、层级结构和可追踪连接，适用于更强结构性的查询。

很多生产系统会混合向量检索、结构化索引与缓存层，以平衡召回、精度和成本。

不同来源的记忆可信度不同，用户明确表达的信息通常比工具抓取的间接结果更可靠。

当新旧 memory 互相冲突时，来源、时间与置信度会直接影响 consolidation 决策。

在生产环境里，你往往需要知道一个记忆从哪里来、何时更新、为什么被保留。

这些问题覆盖 Harness Engineer、Context Engineering、Sessions 与 Memory 的高频搜索意图。

RAG 和 memory manager 一样吗？

不一样。RAG 更偏静态知识检索，memory manager 更偏用户相关、动态演化、可更新和可遗忘的信息管理。

Memory should be placed in system prompt or chat history?

两种都可以，但要看记忆的重要性和框架能力。放在 system instructions 权重更高，放在 history 更灵活，但噪音风险也更高。

下一步

我们可以协助你完成 extraction 规则、consolidation 流程、retrieval placement 和评估指标设计。