My Book

简介

Hermes Agent 已成为 2026 年 4 月底的面试顶流。本视频从架构、记忆模块、自我进化机制等方面进行了深入剖析，帮助应对面试中的高频问题。

核心要点总结

一、大模型行业的学习特点

知识迭代极快：爆火的知识点 = 必考考点。从 Skill → Open-Cloud → Cloud Code → Hermes Agent，每一步都需要及时跟进。
无需焦虑：新知识通常建立在已有理论基础上。掌握 Agent 理论（架构、通信、记忆）后，理解新框架成本极低。
学习策略：爆火的知识一定要第一时间学习，但不需要过度恐慌，因为核心理论是相通的。

二、Hermes Agent 概述

本质：Open-Cloud 的 2.0 版本，架构、网关、记忆模块基础一致，但增加了核心能力。
核心特性：自我进化机制与自动沉淀 Skill。Agent 在执行任务的同时，会主动反思并沉淀经验。
与 Open-Cloud 的区别：Open-Cloud 也能记事，但 Hermes Agent 更强——它主动、定期地反思和沉淀，而非事到临头才压缩记忆。

三、总体架构：三层主干 + 一圈闭环

层级	功能说明
触发层	定义 Agent 何时工作：消息、心跳（定时任务）、外部/内部 Hook
网关层	消息路由、格式转换、安全管理，接入飞书 / Discord / Telegram 等
Agent 层	核心执行层，采用 ReAct 范式（循环：观察 → 推理 → 行动 → 观察...）
闭环（新增）	Agent 外挂的自我进化回路，这是 Hermes 区别于 Open-Cloud 的核心

所有 Agent 框架（Cloud Code / Open-Cloud / Hermes）均基于 ReAct 范式。

四、Hermes 记忆系统

静态组成（三大数据源）

数据源	说明
Markdown 文件	Bootstrap（永久记忆，不压缩）、Memory（记录事实）、Skill（记录方法，Hermes 独有）
Session 文件	JSONL 格式，存储每次对话原始数据，用于对话回滚和恢复
用户画像	由独立进程动态维护（基于 Hunkle 项目），是 Hermes 独有的能力

此外还有索引（Index），用于双路检索（向量 + 关键词权重 0.7:0.3），实现 RAG 式的记忆召回。

动态机制

记忆从哪里来：部分自动注入（Bootstrap / 用户画像），部分按需检索（Memory / Skill）。
如何组装上下文窗口：对话开始时自动注入固定数据，Agent 运行时按需检索相关记忆。
上下文爆了怎么办（压缩策略）：
- 保留最近 N 轮（如 10 轮）不压缩。
- 将前面轮次分块压缩成摘要，再合并为连贯摘要。
- 增强关键上下文（当前正在操作的文件、用户设定的规则等）。
如何写入/反思：每进行一定轮次（如 10 次），触发子 Agent（Spawn）进行反思，沉淀为 Memory、User 画像和 Skill。

五、Her mes 的自我进化机制（最核心考点）

分为四层：

阶段	说明
1. 定时触发	基于定时器（如每 10 次对话），用 Python 事件驱动启动反思
2. 如何反思	主 AgentSpawn（生成）子 Agent，保留当前上下文进行独立分析
3. 反思什么	由提示词决定：识别可沉淀的 Skill、需要更新的 Memory、需要调整的用户画像
4. 持久化	将反思结果写入 Memory、User 画像、Skill

六、与 Open-Cloud 的对比

维度	Open-Cloud	Hermes Agent
核心能力	可在压缩时写 Memory	主动定期反思，不断沉淀
记忆机制	事到临头才压缩与存储	持续自我进化，不断更新 Skill
独有能力	无	自动沉淀 Skill + 动态用户画像
设计思想	静态响应	主动学习

面试题与参考答案

以下是根据视频内容整理的面试高频问题及参考答案：

Q 1: Hermes Agent 是什么？与传统 Agent 框架有何不同？

参考答案：Hermes Agent 是 Open-Cloud 的升级版（2.0），在相同的三层架构（触发层→网关层→Agent 层）基础上，增加了一个自我进化的闭环。核心区别在于它能够主动反思并沉淀，不仅记住事实（Memory），还能记住方法（Skill）和用户偏好（User 画像），而 Open-Cloud 只在上下文压缩时才被动写入记忆。

Q 2: Hermes 的自我进化机制是如何实现的？

参考答案：通过四步流程实现：①定时触发（每 N 次对话由事件驱动启动）；②Spawn 子 Agent进行独立反思，保留当前上下文；③根据提示词分析哪些信息可沉淀为 Skill/Memory/User 画像；④持久化写入对应的 MD 文件。整个过程主动且定期，不像 Open-Cloud 那样被动等待压缩。

Q 3: Hermes 的记忆系统由哪些部分构成？

参考答案：静态上分为三类数据源：①MD 文件（Bootstrap 永久记忆、Memory 事实、Skill 方法）；②Session 文件（JSONL 格式，保存原始对话，用于回滚和恢复）；③用户画像（由独立进程 Hunkle 动态维护）。运行时还使用索引进行双路检索（向量+关键词权重 0.7:0.3）实现 RAG 式召回。上下文窗口则自动注入 Bootstrap 和用户画像，按需检索 Memory 和 Skill。

Q 4: Hermes 如何处理上下文窗口溢出？

参考答案：采用分层压缩策略：①保留最近 N 轮（如 10 轮）不压缩；②将前面轮次分块压缩成多个摘要，再合并成连贯摘要；③增强关键上下文（当前操作的文件、用户设定的规则等）；④保证 Bootstrap 等永久记忆不受压缩影响。

Q 5: Hermes 与 Open-Cloud 的核心区别是什么？

参考答案：核心差异在于记忆机制的主动性。Open-Cloud 在上下文需要压缩时才会主动写 Memory（事到临头才行动）；Hermes 则每进行一定轮次就主动反思，不仅写 Memory，还更新 Skill 和用户画像，实现了 Agent 的持续自我进化。

Q 6: Hermes 的 Skill 和 Open-Cloud 的 Skill 有何不同？

参考答案：Open-Cloud 的 Skill 是用户手动添加的，可有可无；Hermes 将 Skill 作为核心组成部分，即使不添加任何外部 Skill，Agent 也会在每次运行后自动生成、更新和合并 Skill。这是 Hermes 区别于其他框架的关键特性。

Q 7: 如何看待大模型行业“知识迭代太快”的现象？

参考答案：这是大模型行业的常态，从 Skill→MCP→Cloud Code→Open-Cloud→Hermes，几乎每月都有新热点。核心策略是：①紧跟脚印，保持持续学习；②抓住不变的理论（Agent 架构、通信范式、记忆机制），新框架往往只是这些理论的工程化实践；③爆火的知识点一定是必考考点，必须第一时间学习，但不必过度焦虑——因为它们通常是已有知识的迭代。