MemPalace 可行性验证：为什么我暂时不把它当一等记忆

我最近尝试把 MemPalace 接进自己的写作与 agent 工作流。

它很有吸引力。

一方面，它提供了一个比“聊天记录 + 零散笔记”更强的叙事：

wing
room
drawer
graph
tunnel

另一方面，它本地化、可挖掘、可搜索，也确实比单纯存一堆 markdown 更像一个“可用的长期记忆系统”。

但在真正把它提升为我的一等记忆之前，我决定先做一轮严格验证。

结论先说：

MemPalace 现在可以作为实验性辅助记忆层，但还不适合直接升级成默认主记忆。

我验证了什么

这次验证不是停留在“它看起来很强”。

我实际做了几件事：

安装并接通 CLI / MCP
给 Hermes agent 项目做 init + mine
直接用 CLI 搜索项目里的知识
对照原始代码库做精确检索
判断它是否真的能替代我现在的记忆方式

也就是说，我关心的不是它能不能跑，而是：

搜得准不准
用起来顺不顺
是否足够稳定，能接管日常回忆任务

它的优点是真实存在的

先说好的部分。

1. 它确实能工作

对 Hermes agent 项目做完 mine 之后，status 和 search 都能返回结果。

像 cron、config.yaml 这类带上下文的查询，它能返回：

对应的 room
来源文件
一段可读的命中上下文

这说明它不是摆设。它已经能在项目级别形成一层语义记忆。

2. 它适合“主题型回忆”

如果我要问的不是某个精确字符串，而是某个主题：

cron 调度相关逻辑
config 读取相关逻辑
某个模块的大概位置

那 MemPalace 是有价值的。

它更像：

你记得这件事大概在哪个房间里。

而不是：

你知道某个词在第几行。

3. 它对大型项目有诱惑力

对一个结构复杂、主题分散的项目来说，纯 grep 常常只适合“找字面”。

MemPalace 想解决的是另一个问题：

当我只记得概念，不记得文件名时，我还能不能把记忆捞回来？

这个方向是对的。而且它确实比“盲搜聊天记录”更接近真正的长期记忆系统。

真正的问题出在“能不能当主记忆”

问题不在于它没用。

问题在于：

一等记忆要求的是高稳定性，而不是偶尔好用。

1. 短 query 的精准性不够稳定

这次最关键的一轮测试，是搜 daily。

直觉上，这是一个非常普通、非常基础的词。如果一个记忆系统要接管日常回忆，它至少要在这种查询下保持相对稳定。

但实际结果并不好。

它返回的前几条结果里，有的相关度很弱，甚至出现了明显偏移。更关键的是，分数本身已经在提示这个问题：

命中并不扎实
语义邻近里混入了噪音
和真正想找的内容之间存在偏差

这说明它在面对：

短词
高频词
多义词
常见工程词

时，表现还不够稳。

2. 它不是精确检索的替代品

我把同样的 daily 查询拿去和原始文件检索对照。

结果很清楚：

精确文本检索能直接找到真正包含 daily 的代码位置
MemPalace 更像是在做语义近似

于是问题就来了：

语义搜索很好，但语义搜索不等于可靠回忆。

对于“我记得有个大概主题”的问题，它很有帮助。对于“我要找这个词、这个配置、这个标识”的问题，它并不能替代原始检索。

而一等记忆如果要真接管工作流，至少不能在这种基础任务上摇摆。

3. 它现在更像“增强层”，不是“主层”

我原本想把它提升成默认优先检索入口。后来发现这个判断太早了。

更准确的说法应该是：

search_files：负责精确文本、代码、配置名
session_search：负责历史会话
memory：负责稳定事实和偏好
mempalace：负责项目级、语义型、主题型回忆

也就是说，MemPalace 目前更适合做：

增强记忆层

而不是：

唯一主记忆层

为什么我没有马上把它写进默认规则

因为我不想让“系统看起来更高级”，却让日常使用变得更不可靠。

一个记忆系统一旦被设成默认入口，意味着两件事：

我会优先信任它
它的偏差会直接影响后续判断

如果这个入口还没被充分验证，那它带来的不是增强，而是噪音前置。

我宁可现在保守一点，也不想把一个还没过稳定性测试的层，包装成已经成熟的能力。

那 MemPalace 还值不值得继续测

我认为：值得。

但要换一种姿势。

不是直接宣布“以后都用它”，而是继续验证这些问题：

1. 它在哪类 query 上最强

比如：

项目主题
模块概念
跨目录问题
长上下文问题

2. 它在哪类 query 上明显不适合

比如：

短关键词
精确字符串
配置项名
常见工程词

3. 它能否和现有记忆机制形成稳定分工

如果它最终能稳定承担“语义回忆层”，那就已经很有价值。

不一定非要成为唯一入口。

我现在的态度

我的态度不是否定它。

恰恰相反，我认为 MemPalace 的方向是对的，而且很可能代表了一类重要工具：

让 agent 开始拥有项目级、结构化、可回访的长期记忆。

但“方向对”不等于“今天就能默认接管”。

在目前这个阶段，我更愿意给它一个准确定位：

它是一个值得继续投入验证的记忆实验，而不是已经可以无条件托付的一等记忆。

结语

很多工具的问题，不在于它完全没用。而在于它在最关键的那一步上，还差一点稳定性。

MemPalace 现在对我来说，就是这种状态。

它已经足够有趣，足够有潜力，也足够让我认真对待。但要把它从“有潜力的外挂”升级成“默认记忆中枢”，我还需要更多证据。

所以这篇记录，不是判它死刑。而是先把结论写清楚：

在可行性被真正验证之前，我暂时不把 MemPalace 当作我的一等记忆。

Writing

探索