简介

Hermes Agent 已成为 2026 年 4 月底的面试顶流。本视频从架构、记忆模块、自我进化机制等方面进行了深入剖析,帮助应对面试中的高频问题。


核心要点总结

一、大模型行业的学习特点

  • 知识迭代极快:爆火的知识点 = 必考考点。从 Skill → Open-Cloud → Cloud Code → Hermes Agent,每一步都需要及时跟进。
  • 无需焦虑:新知识通常建立在已有理论基础上。掌握 Agent 理论(架构、通信、记忆)后,理解新框架成本极低。
  • 学习策略:爆火的知识一定要第一时间学习,但不需要过度恐慌,因为核心理论是相通的。

二、Hermes Agent 概述

  • 本质:Open-Cloud 的 2.0 版本,架构、网关、记忆模块基础一致,但增加了核心能力。
  • 核心特性自我进化机制自动沉淀 Skill。Agent 在执行任务的同时,会主动反思并沉淀经验。
  • 与 Open-Cloud 的区别:Open-Cloud 也能记事,但 Hermes Agent 更强——它主动、定期地反思和沉淀,而非事到临头才压缩记忆。

三、总体架构:三层主干 + 一圈闭环

层级 功能说明
触发层 定义 Agent 何时工作:消息、心跳(定时任务)、外部/内部 Hook
网关层 消息路由、格式转换、安全管理,接入飞书 / Discord / Telegram 等
Agent 层 核心执行层,采用 ReAct 范式(循环:观察 → 推理 → 行动 → 观察...)
闭环(新增) Agent 外挂的自我进化回路,这是 Hermes 区别于 Open-Cloud 的核心

所有 Agent 框架(Cloud Code / Open-Cloud / Hermes)均基于 ReAct 范式。

四、Hermes 记忆系统

静态组成(三大数据源)

数据源 说明
Markdown 文件 Bootstrap(永久记忆,不压缩)、Memory(记录事实)、Skill(记录方法,Hermes 独有)
Session 文件 JSONL 格式,存储每次对话原始数据,用于对话回滚和恢复
用户画像 由独立进程动态维护(基于 Hunkle 项目),是 Hermes 独有的能力

此外还有索引(Index),用于双路检索(向量 + 关键词权重 0.7:0.3),实现 RAG 式的记忆召回。

动态机制

  1. 记忆从哪里来:部分自动注入(Bootstrap / 用户画像),部分按需检索(Memory / Skill)。
  2. 如何组装上下文窗口:对话开始时自动注入固定数据,Agent 运行时按需检索相关记忆。
  3. 上下文爆了怎么办(压缩策略)
    • 保留最近 N 轮(如 10 轮)不压缩。
    • 将前面轮次分块压缩成摘要,再合并为连贯摘要。
    • 增强关键上下文(当前正在操作的文件、用户设定的规则等)。
  4. 如何写入/反思:每进行一定轮次(如 10 次),触发子 Agent(Spawn)进行反思,沉淀为 Memory、User 画像和 Skill。

五、Her mes 的自我进化机制(最核心考点)

分为四层:

阶段 说明
1. 定时触发 基于定时器(如每 10 次对话),用 Python 事件驱动启动反思
2. 如何反思 主 AgentSpawn(生成)子 Agent,保留当前上下文进行独立分析
3. 反思什么 由提示词决定:识别可沉淀的 Skill、需要更新的 Memory、需要调整的用户画像
4. 持久化 将反思结果写入 Memory、User 画像、Skill

六、与 Open-Cloud 的对比

维度 Open-Cloud Hermes Agent
核心能力 可在压缩时写 Memory 主动定期反思,不断沉淀
记忆机制 事到临头才压缩与存储 持续自我进化,不断更新 Skill
独有能力 自动沉淀 Skill + 动态用户画像
设计思想 静态响应 主动学习

面试题与参考答案

以下是根据视频内容整理的面试高频问题及参考答案:

Q 1: Hermes Agent 是什么?与传统 Agent 框架有何不同?

参考答案:Hermes Agent 是 Open-Cloud 的升级版(2.0),在相同的三层架构(触发层→网关层→Agent 层)基础上,增加了一个自我进化的闭环。核心区别在于它能够主动反思并沉淀,不仅记住事实(Memory),还能记住方法(Skill)和用户偏好(User 画像),而 Open-Cloud 只在上下文压缩时才被动写入记忆。

Q 2: Hermes 的自我进化机制是如何实现的?

参考答案:通过四步流程实现:①定时触发(每 N 次对话由事件驱动启动);②Spawn 子 Agent进行独立反思,保留当前上下文;③根据提示词分析哪些信息可沉淀为 Skill/Memory/User 画像;④持久化写入对应的 MD 文件。整个过程主动且定期,不像 Open-Cloud 那样被动等待压缩。

Q 3: Hermes 的记忆系统由哪些部分构成?

参考答案:静态上分为三类数据源:①MD 文件(Bootstrap 永久记忆、Memory 事实、Skill 方法);②Session 文件(JSONL 格式,保存原始对话,用于回滚和恢复);③用户画像(由独立进程 Hunkle 动态维护)。运行时还使用索引进行双路检索(向量+关键词权重 0.7:0.3)实现 RAG 式召回。上下文窗口则自动注入 Bootstrap 和用户画像,按需检索 Memory 和 Skill。

Q 4: Hermes 如何处理上下文窗口溢出?

参考答案:采用分层压缩策略:①保留最近 N 轮(如 10 轮)不压缩;②将前面轮次分块压缩成多个摘要,再合并成连贯摘要;③增强关键上下文(当前操作的文件、用户设定的规则等);④保证 Bootstrap 等永久记忆不受压缩影响。

Q 5: Hermes 与 Open-Cloud 的核心区别是什么?

参考答案:核心差异在于记忆机制的主动性。Open-Cloud 在上下文需要压缩时才会主动写 Memory(事到临头才行动);Hermes 则每进行一定轮次就主动反思,不仅写 Memory,还更新 Skill 和用户画像,实现了 Agent 的持续自我进化

Q 6: Hermes 的 Skill 和 Open-Cloud 的 Skill 有何不同?

参考答案:Open-Cloud 的 Skill 是用户手动添加的,可有可无;Hermes 将 Skill 作为核心组成部分,即使不添加任何外部 Skill,Agent 也会在每次运行后自动生成、更新和合并 Skill。这是 Hermes 区别于其他框架的关键特性。

Q 7: 如何看待大模型行业“知识迭代太快”的现象?

参考答案:这是大模型行业的常态,从 Skill→MCP→Cloud Code→Open-Cloud→Hermes,几乎每月都有新热点。核心策略是:①紧跟脚印,保持持续学习;②抓住不变的理论(Agent 架构、通信范式、记忆机制),新框架往往只是这些理论的工程化实践;③爆火的知识点一定是必考考点,必须第一时间学习,但不必过度焦虑——因为它们通常是已有知识的迭代。