profileName: youpingfang postId: 270 postType: post categories:
- 6
Hermes Agent概述
Hermes Agent是由Nos Research团队开发的开源AI Agent项目,在不到两个月内GitHub获得10万+ star,引发广泛关注。其核心卖点并非模型本身,而是“会成长的Agent”——通过与用户持续交互,逐渐学习并适应用户的工作方式和偏好。
核心技术:Self-Improving Loop
Hermes的核心竞争力在于其三层递进的自我进化机制:
第一层:持久记忆系统 - 基于SQLite FTS5的全文检索能力 - 通过LLM Summarization自动压缩历史对话,减少token消耗 - Honcho Dialectic机制渐进式建立用户画像,在多次交互中逐步拼凑用户特征
第二层:自动技能创建 - 完成任务后自动生成skill.md文档,记录关键步骤和工作流 - 技能文件永久存储,支持跨会话复用 - 兼容Agent Skill标准,可与他人共享或使用他人技能
第三层:持续优化 - 自动融合重复或相近的技能,避免技能库膨胀 - 每次任务完成后复盘,提取更优路径并更新技能文档 - 自动预判用户需求,实现从“被动执行”到“主动辅助”的转变
进化曲线:用户使用第一周如同新手员工,按指令行事;一个月后记住工作习惯,开始提供预判服务;三个月后可能比同事更了解用户。
与OpenCloud(龙虾)的对比
| 维度 | OpenCloud | Hermes |
|---|---|---|
| 记忆机制 | 手动编辑Markdown文件 | 全自动记忆积累与压缩 |
| 技能获取 | 手动安装配置插件市场技能 | 自动生成技能文档 |
| 部署成本 | 主要本地运行 | 支持Docker/SSH/Serverless,约5美元VPS可运行 |
| 安全模型 | DM机制验证+显示allow list | 沙盒隔离容器执行,零遥测 |
核心差异:OpenCloud采用“以人为决策中心”的设计理念,用户定义Agent才能执行;Hermes则强调“进化学习”,通过交互自主学习工作方式。
选择建议:需要长记忆、低成本自托管、信任Agent自主性选Hermes;需要企业级审计合规、精细控制选OpenCloud。
一句话概括:OpenCloud是你告诉它做什么,Hermes是它学会你想做什么。
技术架构
Hermes采用四层架构设计:
- 用户交互层:支持CLI、Telegram、Discord、Slack、WhatsApp等平台,通过消息网关统一管理
- 核心智能体引擎:记忆系统、技能系统、工具执行、规划推理四模块协同
- 执行环境层:支持本地终端、Docker、SSH、远程Model Singularity等多种部署方式
- 大模型支持层:支持OpenRouter、自定义API、本地llama.cpp等多种模型,通过一条命令即可切换
数据完全本地存储,无云端依赖,无遥测数据。安装仅需一条curl命令,支持Linux、macOS、Windows WSL2。
争议事件
2025年4月15日,中国AI团队Evomap指控Hermes的自进化核心功能系统性复刻了他们的开源项目Evolver(2025年2月开源,6200+ star,MIT协议)。技术报告显示文本相似度仅3%,但15个核心设计模块高度雷同,被评价为“翻译级对应”(换语言重写但结构相同)。
Nos Research创始人Technio回应称从未听说过该项目,指控缺乏证据。目前此事尚无定论,反映出AI时代开源生态面临的新挑战:AI使代码改写成本趋近于零,给传统开源协议带来冲击。
面试题
Q1:Hermes Agent的核心技术是什么?它与其他Agent的根本区别在哪里?
答案:Hermes的核心技术是Self-Improving Loop(三层递进自我进化机制)。第一层是持久记忆系统,包含全文检索、自动压缩、渐进式用户画像;第二层是自动技能创建,完成任务后自动生成skill.md文档;第三层是持续优化,自动融合重复技能并更新优化路径。
根本区别在于:Hermes不是工具而是“学生”,通过与用户交互持续学习用户偏好和工作方式,实现“越用越聪明”。而传统Agent每次对话后即遗忘,需重复交代。
Q2:Hermes与OpenCloud在设计理念上有什么不同?各自适合什么场景?
答案:OpenCloud采用“以人为决策中心”设计,用户定义Agent才能执行;Hermes强调“自主学习”,通过交互自主掌握工作方式。
选择建议: - 选Hermes:需要长记忆、预算敏感(5美元VPS即可运行)、信任Agent自主性、期望Agent自动学会事情 - 选OpenCloud:企业级部署、需要完整审计合规、需精细控制Agent每个动作、每条指令均需审批
Q3:Hermes的记忆系统是如何实现的?
答案:采用SQLite FTS5作为底层存储,支持全文检索。配合LLM Summarization自动压缩历史对话,用更少token表达同等信息量。另有Honcho Dialectic机制,在多次交互中渐进式建立用户画像,不是一次性记住所有信息,而是在持续使用中逐步拼凑用户特征。所有数据本地存储,完全自托管,无遥测。