Hermes
问题
大多数AI Agent 工作方式:给定任务,Agent完成后,session结束,一切归零。
下次打开:白纸一张。同样的事情又解释一遍。反反复复,永无止境。
但Hermes完全不同——它会记住所有事情。
资讯
【2026-4-15】资讯 Hermes Agent被实锤架构级抄袭中国团队 EvoMap 的开源项目 Evolver:10步主循环一一对应、12组术语系统性替换、7份材料零归属。
- EvoMap 开源 Evolver 36天后,融资过亿的硅谷团队 Nous Research“重新发明”了整套自进化架构。
- 被锤后官方回应仅一句“Delete your account”,随后删帖拉黑。
Evolver
EvoMap 十几人的中国年轻团队从零搭建了一整套AI Agent自进化引擎 Evolver,给AI智能体装上「基因系统」,让能力可以像生物基因一样遗传、变异、进化。
EvoMap 开源 Evolver 36天后,融资过亿的硅谷团队 Nous Research“重新发明”了整套自进化架构。
- GitHub Evolver
Hermes 介绍
Hermes Agent 是 Nous Research 开源的自主 AI Agent 框架。2026-02-25, Hermes 开源版发布(v0.1.0)
- GitHub 仓库:hermes-agent
- Hermes Agent 官网:Hermes Agent
- 教程:第三方教程 Hermes Agent
核心理念:
让 AI 成为长期在线的数字员工,而非一次性聊天机器人。
Hermes Agent 是业内少见的原生内置学习闭环的 AI Agent,可从执行经验中沉淀技能、自主优化能力、持久化知识、检索历史对话,并在跨会话中持续完善用户认知模型。
Hermes Agent 支持自由切换任意大模型,包括 Nous Portal、OpenRouter(200+ 模型)、OpenAI、GLM、Kimi、MiniMax 等,执行 hermes model 即可切换,无需改代码、无厂商锁定
Hermes 如何发音?
两种读法,Hermès(法国品牌,带重音)与 Hermes(希腊神名,无重音)发音完全不同,核心区别:法语 h 不发音,英语 h 发音。
| 类型 | 音标 | 近似读音 | 注意 |
|---|---|---|---|
| 国际音标 | /ɛʁˈmɛs/ | 艾尔 - 梅斯 | H不发音 |
| 赫尔墨斯希腊神名:赫尔墨斯 | /ˈhɝːmiːz/ | 赫-儿-米兹 | H清晰发音, s浊化为z |
总结
- ❌ 误读:“赫尔 - 梅斯”(混英法)
- ✅ 品牌:“爱马仕” ≈ 艾尔梅斯
- ✅ 神话:“赫尔墨斯” ≈ 赫米兹
OpenClaw vs Hermes
两者理念完全相反:
| 产品 | 解决问题 | 特点 | 使用场景 |
|---|---|---|---|
| OpenClaw | 解决”多Agent组织协同” | 多agent协作 | 多Agent跨平台协作时更强:Slack Agent、邮件Agent、研究Agent |
| Hermes | 解决”一个随时间不断进化的Agent”。 | 自进化 | “每天都在变聪明”的Agent时更强:学习你的代码库、记住你的偏好、从经验中构建Skills、自主从错误中恢复。 |
特点
| 对比维度 | OpenClaw | Hermes |
|---|---|---|
| Agent介绍 | 一个24小时在线的秘书,全天Oncall,随时飞书/钉钉/微信/QQ找它 | 学习能力特别强的助理,会自己“长本事”的AI伙伴,越用越懂你 |
| 适合用户 | 想找个AI帮手处理日常事务的人 | 想让AI主动帮你做复杂事情、还能自己进步的人 |
| 适合场景 | 日常办公、消息互动、快速上手 | 深度研究、复杂任务、自主学习 |
云端部署选型指南
- openclaw: 快速用起来,接入主流IM应用、多个AI分工干活儿,比如:有个工具帮我查查资料、多个助手分工、设置提醒,越快越好
- hermes: 研究型任务、多步骤、高效的数据收集能力,比如:每天自动监控某网站、发现新内容、行业报告
Hermes 特点
特点
- 原生终端交互 完整 TUI 界面,支持多行编辑、命令补全、历史回溯、流式输出等
- 全平台接入 一个网关接入 CLI、Telegram、Discord、Slack、WhatsApp 等多端
- 闭环学习体系 自主管理记忆、技能生成与优化、跨会话召回、用户建模
- 定时自动化 内置 Cron 调度,支持日报、备份、审计等 7×24 自动任务
- 并行任务处理 支持子 Agent 并行执行、多工作流拆分与 RPC 工具调用
- 多环境运行 支持本地、Docker、SSH、Daytona、Modal 等 6 种后端
- 科研级能力 支持轨迹生成、强化学习环境、训练数据压缩
总结
- 自进化 — 通过 skills 越用越强,不靠微调。
- 跨 session 记忆 — 不丢上下文。
- 真工具访问 — 不只是聊天,是能改文件、跑命令、管服务器。
- 平台无关 — 同一 agent 跑在终端、飞书、微信、Telegram。
- profile 隔离 — 客户 A 的记忆不会污染客户 B。
- 可扩展 — 插件、MCP、webhook、cron 全方位接入。
学习闭环
每次 Hermes 完成复杂任务,不会就此停步。
相反,会进入复盘阶段,分析做了什么,形成可复用的技能,这样下次处理同类请求时会快得多、好得多。
任务 → Agent完成 → 从经验中生成Skill → Skill不断完善 → Agent 搜索历史对话 → 建立个人模型 → 循环往复
这种进化能力源于三层记忆架构
- Hermes 不只是记住最后一条消息,它运行的是完整的三层记忆系统
自进化原理
self-improvement
每次对话结束后,Hermes 做三件事:
- 第1步:快照对话 → 把当前这场对话完整拷贝一份
- 第2步:叉一个分身 → 创建一个新的 AIAgent 实例(叫 review fork)
- 第3步:让分身自己看自己 → “刚才这场对话,有什么值得学的?”
分身是个后台线程,不耽误聊天,分身默默在后面干活。
这个分身(review fork)只带了两件工具:
- 🧠 记忆审查:用户暴露了偏好、习惯、个人信息吗?如有,就调用memory tool → 持久化记忆
- 🛠 技能审查:刚才的对话值得存为一个技能吗?有踩坑经验、工作流优化吗?如有,就进行 skill_manage → SKILL.md
🎯 触发条件:hermes 多久”进化”一次?
- 不是每个消息都触发审查,否则太费钱了(每次审查要调一次 LLM)。
- 触发规则写在
agent_init.py和conversation_loop.py里:- 每跟hermes聊 10 轮,悄悄复盘一轮。系统里有计数器,用户消息轮数 (_turns_since_memory) ,具迭代次数 (_iters_since_skill),这两个计数器是独立的,有可能只触发记忆、只触发技能,或者两者都触发。
而且有一套 “curator” 机制(agent/curator.py)——如果某个 skill 很久没用,curator 会归档。不用的技能会被淘汰,这就是”自然”的选择。
Hermes 架构
本地配置,用户主目录下的 .hermes 文件夹
| 文件 | 目录 | 功能 |
|---|---|---|
| 主配置文件 | ~/.hermes/config.yaml |
配置文件 |
| 环境变量 | ~/.hermes/.env |
用于存储 API 密钥等 |
| 会话数据 | ~/.hermes/state.db |
SQLite 数据库 |
| 技能目录 | ~/.hermes/skills/ |
技能信息 |
| 会话目录 | ~/.hermes/sessions/ |
会话存储目录 |
| 技能目录 | ~/.hermes/memories/ |
持久化记忆信息 |
记忆能力
2026 年,随着上下文窗口(128K、200K 甚至 1M)的爆炸式增长,反直觉的现象出现:更大的窗口 ≠ 更好的记忆。
原因:
- 上下文窗口是短期记忆,会话结束就清零
- 真正的长期记忆需要策略:选择性地记住什么、遗忘什么、如何组织
- 记忆的质量不在于”记住了多少”,而在于”在正确的时间想起了正确的内容”
这正是 OpenClaw 和 Hermes Agent 在记忆系统上花费巨大精力的原因。两个项目走向了截然不同的设计路径:
- OpenClaw 选择了神经科学启发的三阶段睡眠模拟(dreaming)
- Hermes Agent 选择了认知科学分层的三层记忆架构
Hermes Agent 核心架构
架构拆解:三层记忆 + 五层防线
AI Agent 的终极战场不是推理能力,而是记忆质量
Hermes 核心创新概括:像人类一样记忆,像银行一样安全。
- 三层记忆架构:越用越懂你的秘密
- 五层安全防线:比 OpenClaw 更谨慎
三层记忆
Hermes 有三层:
Prompt记忆: 每次session开始时,Hermes直接把个人笔记从 MEMORY.md 和 USER.md 加载到系统提示词中。偏好、环境、项目——在你打字之前,一切都已就绪。情景记忆: 基于 SQLite FTS5 构建的完整可搜索档案,记录每次历史对话。Agent可以跨所有历史session搜索,回忆曾经讨论过的任何内容——哪怕是几个月前的事。程序记忆: 从完成的任务中自动生成的Skills。可复用的步骤式工作流,Agent会在未来持续使用并不断完善。
hermes vs openclaw 记忆对比
【2026-5-9】记忆机制对决:OpenClaw 的dreaming 三阶段睡眠 vs Hermes 三层认知架构
核心结论:
- OpenClaw 的 dreaming 和 Hermes 的三层记忆,不是优劣之分,而是设计哲学的不同。
- dreaming 来自神经科学,模拟人类睡眠周期,简单透明、自动遗忘、天然适合审查
- 三层记忆来自认知科学,按情景/语义/程序性分层,高效扩展、可复用、天然适合积累
选择建议:
| 优先看重特性 | 对应选择框架 |
|---|---|
| 自动遗忘 | OpenClaw |
| 可解释性 | OpenClaw |
| 快速检索 | Hermes |
| Skill 复用 | Hermes |
| 精确匹配 | Hermes |
| 低维护成本 | OpenClaw |

更多详情见原文 记忆机制对决:OpenClaw 的dreaming 三阶段睡眠 vs Hermes 三层认知架构
OpenClaw dreaming:模拟人类大脑的睡眠周期
OpenClaw 的 dreaming 系统建立在核心假设上:
- 记忆巩固发生在”睡眠”中,而不是”清醒”时。
人类大脑在睡眠期间会经历三个阶段:
- 浅睡眠:过滤当天的感官信息,提取关键信号
- 深睡眠:将重要信息从短期海马体转移到长期皮层存储
- REM(快速眼动):整合新知识,建立长期关联
OpenClaw 将这个模型映射到 AI Agent 的记忆系统:
- 清醒时段(会话中) → 记录原始信号,不做深度处理
- 定时睡眠(后台 cron) → 三阶段扫描、评分、晋升
设计哲学:简单、透明、可解释。每个阶段的行为都是确定的,人工可以审查和干预。
Hermes 记忆系统基于认知科学的经典理论:
人类记忆不是单一结构,而是三个独立的系统协同工作。
| 记忆类型 | 认知科学定义 | AI 映射 |
|---|---|---|
| 情景记忆(Episodic) | 对特定事件的回忆:“昨天我做了什么” | 历史会话记录、时间线 |
| 语义记忆(Semantic) | 对事实和概念的存储:“地球是圆的” | 用户偏好、项目约定、环境事实 |
| 程序性记忆(Procedural) | 对技能和习惯的存储:“如何骑自行车” | Skill 文件、可复用工作流 |
设计哲学:高效、扩展、自动策展。每个层级有明确的存储格式和检索策略,互不干扰。
1. 三层记忆架构
越用越懂你的秘密
传统 AI 助手最大的痛点是”失忆”——每次对话从零开始。Hermes 通过三层记忆系统解决这个问题:
Agent 三层记忆架构表
| 层级 | 名称 | 存储内容 | 实际例子 |
|---|---|---|---|
| 第一层 | 持久事实层 | 用户偏好、项目习惯、长期工作上下文 | “你习惯用 4 空格缩进,讨厌驼峰命名” |
| 第二层 | 程序性记忆层 | Skill(技能)及对应的优化迭代历史 | “写周报时先读取 Git 提交记录,再自动生成内容总结” |
| 第三层 | 历史搜索层 | 全量对话上下文、完整任务执行流水记录 | “上周三你让查询的竞品数据在这里” |
- 第一层(长期静态记忆):几乎永久保存,不随单次对话过期,塑造 Agent 固定工作风格与个人习惯
- 第二层(流程技能记忆):固化标准化工作流程,持续迭代优化任务执行步骤,形成可复用自动化能力
- 第三层(时序上下文记忆):短期对话回溯,支持历史问答溯源、跨时间任务关联查询
为什么分层?
- 想象一下:如果你每次聊天都要从幼儿园回忆开始,效率有多低。Hermes 默认只加载第一层(几百字摘要),需要时才检索深层记忆,既省 Token 又防幻觉。
Skill 自生长机制:完成任务后,Hermes 会自动复盘——”这次哪里做得好?哪里可以优化?”然后将经验固化为新的 Skill(一个 Markdown 文件)。下次遇到类似任务,直接调用 Skill,无需重新推理。
实际效果:第一次写周报需要 10 分钟,第二次可能只需 30 秒。
2. 五层安全防线
比 OpenClaw 更谨慎
Hermes 在安全性上做了大量工作,特别适合企业场景
AI Agent 安全五层防护体系
| 防线 | 机制 | 示例 |
|---|---|---|
| 用户授权 | 敏感高危操作强制要求用户手动确认 | 删除文件前弹窗二次确认 |
| 危险命令审批 | rm -rf 等高风险系统指令拦截+二次校验 |
严防误删线上生产环境数据 |
| 容器隔离 | Agent 任务全程在独立沙箱容器内运行 | 异常代码崩溃、恶意行为不会影响宿主主机 |
| 上下文扫描 | 前置检测对话与指令里的注入类风险 | 自动识别拦截 SQL 注入、系统命令注入攻击 |
| 权限最小化 | 默认只读权限,所有写入/修改操作必须显式授权 | 从根源杜绝越权访问、非法篡改文件 |
Skills
skills 用法
hermes skills browse # 浏览所有官方Skills
hermes skills browse --source official # 仅浏览官方可选Skills
hermes skills search kubernetes # 搜索所有来源
hermes skills search react --source skills-sh # 搜索skills.sh目录
hermes skills search https://mintlify.com/docs --source well-known
hermes skills inspect openai/skills/k8s # 安装前预览
hermes skills install openai/skills/k8s # 安装并安全扫描
hermes skills install official/security/1password
hermes skills install skills-sh/vercel-labs/json-render/json-render-react --force
hermes skills install well-known:https://mintlify.com/docs/.well-known/skills/mintlify
hermes skills install https://sharethis.chat/SKILL.md # 直链安装
hermes skills install https://example.com/SKILL.md --name my-skill # 覆盖默认名称
hermes skills list --source hub # 列出已安装的Skills
hermes skills check # 检查上游更新
hermes skills update # 更新Skills
hermes skills audit # 安全审计
hermes skills uninstall k8s # 卸载
hermes skills reset google-workspace # 重置为"用户修改"状态
hermes skills reset google-workspace --restore # 同时恢复原始版本
hermes skills publish skills/my-skill --to github --repo owner/repo
hermes skills snapshot export setup.json # 导出配置
hermes skills tap add myorg/skills-repo # 添加自定义GitHub源
常用技能
Hermes 五大核心技能:解锁AI代理完全体潜能
- ① Gstack:记忆层优化引擎 让Hermes具备自我进化能力,越用越聪明,由YC总裁Garry Tan开发,GitHub获85.5k星
- ② Gbrain:多团队协作中枢 通过知识图谱实现效率翻倍,支持实体识别与自动关联,含17,888页面/4,383用户/723公司数据
- ③ Hermes Web UI:三面板轻量界面 左侧会话导航/中间聊天/右侧文件浏览,圆形上下文环实时显示令牌使用,无需构建步骤
- ④ Awesome Hermes:生态导航系统 汇聚2.3万星项目资源,涵盖技能中心、部署集成、多智能体应用等九大分类
- ⑤ Self Evolution:自进化增强模块 基于DSPy和GEPA技术,实现提示词与代码的遗传优化,由创始人technion亲自开发
生态
MCP
【2026-5-27】Hermes(爱马仕):MCP和自定义Tool,把任何API变成AI的第三只手
Hermes Agent 自带了二十多个工具——web搜索、浏览器、终端、文件操作、记忆——覆盖了通用场景
两种工具:MCP Server 和 自定义原生Tool
- 大部分场景用MCP就够了,省心省力。只有当需要跟Hermes内部状态深度交互(比如加一个改变对话行为的trick),才去写原生Tool。
| 维度 | MCP Server | 原生Tool |
|---|---|---|
| 上手成本 | 写脚本+一条命令 | 改框架源码3个文件 |
| 隔离性 | 独立进程,崩了不影响主进程 | 与主进程共享内存 |
| 维护方式 | 独立git仓库,Hermes随便升级 | 随Hermes分支走,合代码时注意 |
| 最佳场景 | 外部API、第三方服务、私有脚本 | 需要深度数据共享的核心功能 |
| 发布方式 | hermes mcp add 一键注册 |
必须改代码再重启 |
避坑
- MCP Server进程挂了不会自动重启——用
while true; do python3 server.py; done包一层,处理完了退出就行。 - Tool变更必须
/reset——prompt caching导致旧工具列表会缓存到新的模型调用,不reset不生效 - 返回值必须是JSON字符串——所有Handler都要求返回 str,千万别直接 return dict
- HTTP模式的MCP需要Server实现MCP传输层协议,不如stdio模式省事
- 第一次加MCP建议用
hermes mcp test name先测,别上来就问模型”能不能调”
MCP Server
Hermes MCP操作:
- 添加后,Hermes自动向LLM(大模型)注册工具列表,模型推理时发现用户需求匹配就会主动调用。完全无感集成,同内置的 web_search 是一个体验。
# 添加MCP服务器(stdio模式:跑本地脚本)
hermes mcp add weather-api \
--command "python3 ~/mcp-servers/weather.py"
# 添加MCP服务器(HTTP模式:跑远端服务)
hermes mcp add internal-api \
--url "http://localhost:8080/mcp"
# 查看已注册的工具
hermes mcp list
# 测试连通性
hermes mcp test weather-api
# 输出: Connection OK, registered 3 tools
MCP Server本身就是一个Python/Node脚本,实现里定义好 tools(工具列表)和 call_tool(执行逻辑)就行。
比如一个简单的记账查询MCP Server不到50行:
# mcp-server/ezbookkeeping.py
from mcp.server import Server, stdio_server
async def main():
server = Server("ezbookkeeping")
@server.list_tools()
async def list_tools():
return [{
"name": "query_expense",
"description": "查询今日消费",
"inputSchema": {"type": "object", "properties": {}}
}]
@server.call_tool()
async def call_tool(name: str, args: dict):
result = ezbookkeeping_api(...)
return {"content": [{"type": "text", "text": json.dumps(result)}]}
async with stdio_server() as (read, write):
await server.run(read, write)
然后
hermes mcp add ezbook --command "python3 ~/mcp-servers/ezbook.py"
自定义原生Tool
自定义原生Tool:改3个文件
如果MCP的这层网络通信对你不必要——工具就在本地,不需要隔离——那就直接写原生Tool,嵌入到Hermes进程内部。
只需要改3个文件:
- 第一步:创建
tools/my_tool.py - 第二步:在
model_tools.py的_discover_tools()里加上 import - 第三步:在
toolsets.py的_HERMES_CORE_TOOLS列表里加上 “my_tool”
然后 /reset 重启会话,工具就出现在模型的工具列表里了。
tools/my_tool.py 文件
import json
from tools.registry import registry
def my_custom_api(param: str, task_id: str = None) -> str:
# 你的业务逻辑
result = call_internal_api(param)
return json.dumps({"success": True, "data": result})
registry.register(
name="my_custom_api",
toolset="custom",
schema={
"name": "my_custom_api",
"description": "调用内部API获取数据",
"parameters": {
"type": "object",
"properties": {
"param": {"type": "string", "description": "查询参数"}
},
"required": ["param"]
}
},
handler=lambda args, **kw: my_custom_api(
param=args.get("param", ""),
task_id=kw.get("task_id")
),
)
GUI
官方 Web UI
第三方 Web UI
- 【2026-4-11】Hermes-HUDUI 开源项目,为本地AI代理 Hermes 提供了可视化控制面板,解决了”黑盒”问题,可实时查看AI记忆、当前目标与会话历史。
- hermes-webui
Hermes Web 界面方案。
选择指南
- 第一次装 → 官方 Dashboard
- 个人日常聊天 → hermes-webui
- 程序员工作台 → Hermes Workspace
- 团队接入飞书/企业微信 → EKKO Hermes Web UI
- 已有 Open WebUI → 直接接入
方案对比
| 方案 | 定位 | 特点 | 适合人群 |
|---|---|---|---|
| 官方Web Dashboard | 系统管理后台 | 改配置、管 API Key、看日志、用量统计;同源稳定 | 首次安装、日常排错、不折腾的用户 |
| hermes-webui | 日常聊天 App | 界面简洁;支持手机访问;Token 状态一目了然 | 个人日常聊天、手机端使用 |
| Hermes Workspace | 程序员工作台 | VS Code 式驾驶舱;多窗口整合;Swarm Mode;多 Agent 控制 | 程序员、技术团队、重度开发场景 |
| EKKO Hermes Web UI | 团队管理后台 | 用量统计、定时任务、平台配置页面;支持飞书/微信/企业微信接入 | 国内团队、办公沟通链路集成 |
| Open WebUI | 通用 AI 前端 | 非 Hermes 专属;通过 OpenAI-compatible 连接 Hermes;已有平台最省事 | 已有 Open WebUI 的用户 |
| Hermes Desktop | 桌面软件 | 功能丰富,有虚拟人形象(claw3d)、看板 | 个人日常聊天 |
(1) Hermes Web-UI
git clone https://github.com/nesquena/hermes-webui.git hermes-webui
cd hermes-webui
python3 bootstrap.py
# 或
./start.sh
(2) hermes-hudui
项目地址:hermes-hudui
安装方法
git clone https://github.com/joeynyc/hermes-hudui.git
cd hermes-hudui
./install.sh
hermes-hudui # 不一定管用
source venv/bin/activate && hermes-hudui
打开地址 localhost:3001
(3) Hermes Desktop
Hermes 桌面版
- GitHub hermes-desktop
功能
- Hermes Agent 的首次引导式安装
- OpenRouter、Anthropic、OpenAI 以及本地 OpenAI 兼容端点的提供商配置
- 基于 Hermes CLI 的流式聊天界面
- 带恢复和搜索能力的会话历史
- 用于隔离 Hermes 环境的档案切换
- 对人格、记忆、工具和已安装技能的图形界面访问
- Hermes 消息集成的网关控制
- 使用 Electron Builder 进行桌面打包
手机操控
【2026-4-26】Hermes+Bridge自动操控手机
用 Hermes + Android Bridge,把 Android 手机变成一个可读屏、可点击、可输入、可远程操控的 AI 自动化终端。
Hermes + Android Bridge 的核心思想是:让 Hermes Agent 负责思考和规划,让 Android Bridge 负责看屏幕、点屏幕、输文字和回传结果。
Hermes 官方已经提供 Android / Termux 的安装路径,说明可以直接在 Android 手机上通过 Termux 运行 Hermes CLI 和核心能力。
而 Hermes Android Bridge 则是一个独立桥接项目,用来让 Hermes 与 Android 设备交互,手机端通过权限能力执行读屏、点击、输入、滑动、截图等动作。
多人协作
【2026-5-5】Hermes 多 Agent 协作:让多个 AI 同时为你写代码
问题:
单个 AI Agent 已经很强了,为什么还需要多个?
因为并行。实际的软件开发项目很少是单线程的
- 前端和后端可以同时开发
- API 接口和数据库 schema 可以并行设计
- 业务逻辑和单元测试可以分头写。
但单 Agent 工作流的瓶颈:即使 Agent 速度再快,它也只能一次做一个任务。
- 包含 5 个子需求的 feature,Agent 串行完成需要 25 分钟。
- 如果拆给 3 个 Agent 并行,理论上 8 分钟就能搞定。
不同 Agent 用不同的角色和视角来看同一个项目。
Devin,Cursor等各种”AI 程序员” 使用方式还是单线程:打开一个 Agent,给它一个任务,等它做完,再给下一个。
Hermes 多 Agent 协作,不是”AI 能不能写代码”——这已经没什么争议。而是”怎么让多个 AI 同时写代码,而且不会把项目搞砸”。
Hermes Agent 的多 Agent 协作核心机制: 派生子进程(subagent)。
主 Agent接收到复杂的任务,比如”实现一个用户管理系统,包含注册、登录、权限控制三个模块”。
Hermes 不会让 Agent 从头写到尾。会把任务拆解,然后 spawn 多个子 Agent,每个负责一个独立的子任务:
主 Agent(你)
├── Agent A:实现注册模块 + 数据库 model + 单元测试
├── Agent B:实现登录模块 + JWT 认证 + API 路由
└── Agent C:实现权限中间件 + 角色管理 + 访问控制
三个子 Agent 各自有独立的上下文、独立的终端会话、独立的工作目录。它们互不干扰,并行执行。
每个子 Agent 完成后,结果返回给主 Agent。主 Agent 做整合、审查、决定是否需要调整。
整个过程只需要做两件事:给任务、review 结果。
安装
Linux、mac与wsl2
- 不支持原生 Windows 环境,请先安装 WSL2,再在 WSL2 终端中执行上述命令。
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc # 重载shell配置(若使用zsh,执行:source ~/.zshrc)
hermes # 开启智能体对话!
自动处理所有依赖项:
- uv — 快速 Python 包管理器
- Python 3.11 — 通过 uv 安装,无需 sudo
- Node.js v22 — 用于浏览器自动化和 WhatsApp 桥接
- ripgrep — 快速文件搜索
- ffmpeg — TTS 音频格式转换
使用
基础命令
hermes [flags] [command]
-r, --resume SESSION 恢复指定 session
-c, --continue [NAME] 按名恢复(或最近一次)
-w, --worktree 隔离 git worktree(多 agent 并行)
-s, --skills SKILL 预加载技能
-p, --profile NAME 切换配置档
--yolo 跳过危险命令确认
安全防护
Hermes Agent 提供两层「安全网」,解决两类完全不同的问题:
| 对比维度 | Profile 多账号 | Docker 沙箱 |
|---|---|---|
| 解决的问题 | 多人共用,数据打架 | AI 执行危险命令 |
| 隔离什么 | 配置、密钥、聊天记录、技能 | 文件系统、网络、进程 |
| 类比 | 浏览器多用户资料 | 给水电工单独的工具棚 |
| 一句话命令 | hermes profile create |
hermes config set terminal.backend docker |
什么时候用 Profile?
- 团队共用一台服务器,每人要独立配置
- 公司和个人的 API key 要分开
- 多个客户项目,各用各的模型和密钥
- 飞书/Telegram/Discord 网关需要独立运行
什么时候用 Docker 沙箱?
- 执行用户提交的代码或第三方脚本
- 审查含敏感数据的内部代码
- 让 AI 跑自动化任务,不想它碰到重要文件
- 日常开发也想多一层保护
两者可叠加使用
- 每个 Profile 独立配置沙箱策略
- 一个用严格模式跑不信任代码,另一个用开发模式日常编码。
CLI 命令
hermes # 交互式命令行界面 — 开启对话
hermes chat -q "问题" # 单次提问
hermes chat -m claude-sonnet-4 # 指定模型
hermes chat -t web,terminal # 限定工具集
# 交互式选模型
hermes model # 选择大语言模型服务商与对应模型
hermes model --provider ollama --model gemma4:27b
hermes tui
hermes tools # 配置启用的工具集
hermes gateway # 启动消息网关(支持Telegram、Discord等平台)
hermes setup # 运行全量配置向导(一站式完成所有配置)
hermes claw migrate # 从OpenClaw迁移数据(适用于原OpenClaw用户)
hermes update # 更新至最新版本
hermes auth # 凭证管理
hermes doctor [--fix] # 依赖与配置体检
hermes doctor # 诊断运行环境与配置问题
hermes config # 查看当前配置
hermes config set KEY VAL # 设置配置
hermes config edit # 编辑 config.yaml
hermes config set <key> <value> # 设置配置值
hermes config get <key> # 获取配置值
hermes config list # 列出所有配置
hermes config check # 检查配置完整性
hermes config migrate # 迁移配置到新版本
配置
关键路径
~/.hermes/config.yaml 主配置
~/.hermes/.env API key 与密钥
~/.hermes/skills/ 技能
~/.hermes/sessions/ session JSONL 转录
~/.hermes/state.db 会话存储(SQLite + FTS5)
~/.hermes/logs/ 网关/错误日志
~/.hermes/auth.json OAuth 与凭证池
~/.hermes/profiles/<name>/ 配置档(独立布局)
hermes 会话内命令
/config 查看配置
/model [name] 切换模型
/personality [name] 设置人设
/reasoning [level] 推理强度(none/minimal/low/medium/high/xhigh)
/verbose 详细度切换
/voice [on|off|tts] 语音模式
/yolo 跳过确认
/history 历史
/usage token 用量
/insights [days] 用量分析
/copy [N] 复制回复到剪贴板
/image 附加本地图片
/debug 上传 debug 报告
/quit 退出
多账户
一台机器,N 个独立账号
什么时候用 Profile?
- 团队共用一台服务器,每人要独立配置
- 公司和个人的 API key 要分开
- 多个客户项目,各用各的模型和密钥
- 飞书/Telegram/Discord 网关需要独立运行
Profile 把 Hermes「分身」成多个独立账号,每个账号有自己的配置、密钥、聊天记录、技能库,谁也看不到谁的。
可以作为管理员,随时查看、备份、删除任何一个账号。
profile 信息
hermes profile list # 查看有哪些账户
hermes profile create NAME # 创建新账户,在 ~/.hermes/profiles/ 下面生成全新的目录
# ~/.hermes/profiles/zhangsan/
# ├── config.yaml ← 空白配置,等着你填
# ├── .env ← 空白密钥文件
# ├── skills/ ← 89 个内置技能
# ├── sessions/ ← 聊天记录(空的)
# └── logs/ ← 日志(空的)
hermes profile show zhangsan
hermes profile delete wangwu
hermes profile use NAME # 设为默认
hermes profile export/import # 打包迁移
# 个性化配置
hermes -p zhangsan config set model.default "claude-sonnet-4"
hermes -p zhangsan config set ANTHROPIC_API_KEY "sk-ant-zhangsan-xxxx"
hermes profile list # 看所有账号
hermes profile create <名字> # 建账号
hermes profile show <名字> # 看详情
hermes profile export <名字> -o x.tar.gz # 备份
hermes profile import x.tar.gz # 恢复
hermes profile rename <旧> <新> # 改名
hermes profile delete <名字> # 删号
# 用户
hermes profile use <名字> # 登录
hermes -p <名字> chat # 聊天
hermes -p <名字> config # 看配置
沙箱 sandbox
Hermes 启动的 Docker 容器自动带一整套安全限制:
- 容器内即使是 root,也对宿主机没有任何管理权限
- 容器内的程序不能提权(就算有 suid 文件也没用)
- 最多同时跑 256 个进程,防止 Agent 搞出 fork 炸弹
- /tmp、/var/tmp、/run 这些临时目录禁止执行程序,防止恶意二进制落地
- /tmp 容量限制在 512MB,防止写爆磁盘
这些限制是 Hermes 自动加上的,不用手动配。你只需要决定:给容器开多大的口子
更多操作见:hermes入门指南
设置 API 密钥
通过 CLI 设置 API 密钥:
hermes config set OPENROUTER_API_KEY sk-or-v1-your-key-here
或直接编辑 ~/.hermes/.env 文件:
# LLM 提供商
OPENROUTER_API_KEY=sk-or-v1-your-key-here
# 可选工具
FIRECRAWL_API_KEY=fc-your-key
FAL_KEY=your-fal-key
选择模型
hermes model # 交互式选择
或在配置文件中指定:
# ~/.hermes/config.yaml
provider:
name: openrouter
model: anthropic/claude-sonnet-4-20250514
会话控制
/new (/reset) 新会话
/retry 重发上一条
/undo 撤回最后一条
/title [name] 命名会话
/compress 手动压缩上下文
/rollback [N] 回滚文件系统
/branch (/fork) 分支当前会话
/resume [name] 恢复
/goal [text] 设定长跑目标
工具
配置工具集
常用工具集包括:
- web、terminal、file、browser、vision、image_gen、skills、tts、todo、memory、session_search、cronjob、code_execution、delegation、homeassistant 和 rl。
# 使用特定工具集
hermes chat --toolsets "web,terminal"
# 配置每个平台的工具(交互式)
hermes tools
hermes tools # 交互式启用/禁用工具
hermes tools list # 列出所有工具
hermes tools enable NAME # 启用
hermes tools disable NAME # 禁用
会话内斜杠命令
/tools 管理工具
/skills 搜索安装
/skill <name> 加载技能
/reload-skills 重扫
/cron 定时任务
/curator [sub] 技能生命周期管理(pin/archive)
/kanban [sub] 多 agent 协作看板
MCP
hermes mcp add NAME # 添加 MCP 服务
hermes mcp list # 列出已配置
hermes mcp test NAME # 测试连接
网关
hermes gateway run # 前台运行网关
hermes gateway install # 注册为后台服务
hermes gateway start/stop # 启停
hermes gateway setup # 配置消息平台
会话内斜杠命令
/approve / /deny 通过/拒绝待确认命令
/restart 重启网关
/sethome 把当前对话设为 home
/platforms 平台状态
/topic [sub] Telegram DM 主题会话
技能 skill
技能是 程序化记忆——可复用的工作流沉淀。
创建场景:
- 复杂任务(5+ 工具调用)后、纠错后、用户偏好后。
skill 创建
hermes skills create # 交互式创建
# 或在 ~/.hermes/skills/<name>/SKILL.md 写 markdown
# 工作中发现"每天拉取 X 监控数据"是可复用流程
# 1. 在 ~/.hermes/skills/x-monitor/SKILL.md 写:
# - 触发条件
# - 步骤 + 命令
# - 验证
# 2. 后续 /skill x-monitor 加载即用
hermes skills list # 已安装技能
hermes skills search QUERY # 搜索技能市场
hermes skills install ID # 安装
hermes skills browse # 浏览全部
hermes skills update # 升级
Session/定时任务
Session
hermes sessions list # 历史会话
hermes sessions export OUT # 导出 JSONL
hermes sessions prune # 清理旧会话
定时任务 / Webhook
hermes cron list # 定时任务
hermes cron create "30m" # 创建("every 2h" / "0 9 * * *" / ISO)
hermes cron pause/resume ID
hermes webhook subscribe NAME # 创建 webhook 路由
人格设置
# ~/.hermes/config.yaml
personalities:
helpful: "You are a helpful, friendly AI assistant."
kawaii: "You are a kawaii assistant! Use cute expressions..."
pirate: "Arrr! Ye be talkin' to Captain Hermes..."
# 添加您自己的!
使用 /personality pirate 等命令激活。
记忆
跨 session 持久化,分两类:
- user — 用户画像(姓名、角色、偏好、语言、时区)
- memory — 环境事实、踩坑、约定、API 怪癖
原则:
- 一周后会过期的不要存;
- 程序化流程放技能;
- 写入前要用户同意(你已设定)。
上下文压缩
# ~/.hermes/config.yaml
compression:
enabled: true
threshold: 0.50 # 在上下文限制的 50% 时压缩
summary_model: "google/gemini-3-flash-preview"
问题
不记得上一个任务
任务迟迟不结束,强行推出后,再问 上一个任务,不记得了
迭代轮数超限
【2026-6-17】迭代轮数超限错误
⚠️ Iteration budget exhausted (90/90) — asking model to summarise ⚠️ Reached maximum iterations (90). Requesting summary…
官方 Bug: Iteration-exhaustion summary call has no output budget when agent.max_tokens is unset#35979
- 回复:在迭代上限汇总接口调用中,使用默认最大生成长度
max_tokens=16384,避免会话耗尽时输出为空。
改进
不足
【2026-5-9】Hermes Agent 被忽视的 4 个坑,DTClaw 如何填平?
4 个关键问题几乎没人提:
- 部署体验简化了,认知鸿沟还在
- 自进化是最大亮点,也藏着最大隐患
- 记忆设计精巧,但适用面有限
- 安全纵深做得扎实,但规则总有尽头
云端部署
云厂商提供的云端部署方案
| 部署方式 | 优势 | 劣势 | 上手方式 | 适合场景 |
|---|---|---|---|---|
| 本地部署 | ✅ 数据在本地 | ❌ 权限管控弱,数据易泄露 ❌ 需处理环境、端口、更新等运维工作 ❌ 性能难扩展,任务多了顶不住 ❌ 电脑休眠/断网/关机就断联 |
强动手 | 轻量体验 |
| 全托管 | ✅ 上手最省事 | ❌ 功能边界由平台定义 ❌ 自定义技能麻烦,定制化受限 ❌ 支持的IM入口有限,不灵活 ❌ 标准化产品,无法按需定制 |
基本不用动手 | 完全不想操心、对个性化要求不高 |
| 轻量应用服务器(官方镜像自托管) | ✅ 稳定在线 ✅ 专属实例可控 ✅ 可按需扩展 |
- | ✅ 镜像预装、可视化配置 | 长期在线、复杂任务、多Agent/workspace、企业通道接入 |
💡 总结:
- 本地部署:适合有技术基础、想快速尝鲜的用户,但稳定性和安全性都一般。
- 全托管:适合纯小白用户,省心但几乎没有自定义空间。
- 轻量应用服务器(自托管):是三者里的平衡之选,兼顾了稳定性、可控性和上手门槛,适合长期使用和复杂场景。
| 云厂商 | 时间 | 优点 | 不足 | 备注 |
|---|---|---|---|---|
| 阿里云 | 2026-4-28 | 轻量级云端部署 | 阿里云无影云电脑企业版部署 OpenClaw / Hermes Agent 详细教程 | |
| 腾讯云 | 2026-5-18 | 轻量级云端部署 | 1年68元-99元,购买入口 腾讯云 ×Hermes Agent企业级 AI智能体 一键部署即落地 |
|
| 火山引擎 |
腾讯云轻量应用服务器(Lighthouse)推出 Hermes Agent 专属的企业级系统镜像,在行业内率先实现了开源 AI 代理的云端一键式部署:
- 访问腾讯云管理控制台,进入轻量应用服务器服务;
- 创建新的服务器实例,在镜像选择中定位「AI 智能体→Hermes Agent 企业版」;
- 根据需求选择实例规格(建议从 2 核 4G 起步,支持弹性扩展),确认并完成购买;
- 系统将自动完成运行环境构建、安全增强配置及服务启动,整个过程无需编写代码,也无需进行复杂设置。
从购买到实际可用,整个过程仅需短短几分钟,即使是没有深厚技术背景的用户也能轻松完成,彻底摆脱了以往需要 “输入命令、查阅文档、排查故障” 的低效流程,助力企业迅速步入 AI 智能应用的新阶段。
企业级安全保障:数据自主可控,严守合规底线
- 私有化部署:核心引擎、记忆数据、技能库全部存储于企业自有的服务器中,数据无需出境,控制权完全掌握在企业手中,满足金融、政务、医疗等对合规性要求极高的场景需求;
- 安全沙箱隔离:工具调用在独立的容器环境中运行,与核心引擎隔离,内置危险指令审批、操作行为审计日志、工具白名单等机制,提供全链路防护,有效规避潜在安全风险;
- 多级权限管理:从 “仅查看” 到 “完全自主操作”,可灵活配置不同级别的操作权限,精确控制员工可访问和操作的范围,确保核心数据安全。
企业级
Hermes 很强, 但企业直接照抄,会遇到问题。
| 问题 | Hermes特点 | 企业级特点 | 解法 |
|---|---|---|---|
| 记忆规模不够 | Hermes SQLite + 本地文件记忆适合个人和小团队 | 企业跨部门知识量大、文档源杂、会话量高、权限边界复杂 | |
| Skill 适合个人积累,不等于适合组织治理 | 个人使用 skill 容易 | 企业skill要明确谁能发布、审核、升级 skill,不同部门隔离访问,错误回滚 | 企业要的不是“技能目录”,而是“技能注册中心” |
| 安全和审计还不够重 | hermes存在安全问题,如:危险命令审批、工具限制、子 Agent 工具封禁。 | 需要 RBAC 权限、操作审计、敏感数据脱敏、多租户隔离、API 网关限流、合规留痕 | - |
| 高可用不是主目标 | hermes定位:高能力的通用 Agent Runtime | 企业需要多副本、故障转移、模型路由、成本治理、服务化接入 | - |
Hermes Agent 在个人开发者手中确实能跑通很多场景,一旦放到“企业级”的标尺下衡量,四个核心短板会立刻显现出来。
- 🚫 短板一:安全合规——自进化本身是最大的不确定性
- 企业级应用的第一道红线就是安全合规。Hermes Agent虽然内置了多层安全架构(含沙箱隔离),核心框架目前仅披露过少量中低危CVE,安全记录优于竞品。但它引入了一个全新的风险维度:自进化能力本身,就是最大的不确定性。
- 当Agent可以自主从经验中“蒸馏”知识、沉淀技能、修改自身行为时,谁来判断这些“进化”是安全的?动态生成的脚本可能通过逻辑注入绕过静态扫描,跨平台API调用若隔离不足易引发越权攻击。此外,提示注入、硬编码凭据、过度授权等也是部署中的高危漏洞。对于需要满足等级保护、GDPR或行业监管要求的企业来说,这种不确定性是难以接受的。
- 📦 短板二:技能生态——73 vs 13,729,悬殊的数量级差距
- 企业级落地需要覆盖大量“长尾场景”——邮件模板生成、多平台日程同步、特定ERP系统的数据对接等。Hermes Agent截至v0.8.0仅内置70+基础Skill,而OpenClaw社区维护的Skill数量高达13,729+。这不是简单的“数量差距”,而是意味着很多企业日常需要的中频场景,在Hermes上“没有现成方案”,需要自己从头开发或等待社区贡献。
- 🔄 短板三:长时运行状态漂移——跑着跑着就“忘了自己是谁”
- 企业级系统要求7×24小时稳定运行。但实测数据显示,Hermes Agent连续运行超过72小时后,其Honcho用户画像模型的摘要准确率会下降11.3%。这意味着Agent会逐渐“遗忘”或“误解”用户的偏好和习惯,需要手动执行hermes memory compact命令强制压缩。这种“状态漂移”问题,决定了它目前难以承担需要长时间无人值守的企业核心业务。
- 🔧 短板四:网关高并发不稳定——流量一大就“崩”
- 当企业有多人同时使用Agent时,ACP网关面临真正的压力测试。实测中,当Webhook注入密度超过87次/分钟时,网关就会发生连接池耗尽,错误日志显示“too many open files”,需要手动调高ulimit限制才能恢复。这种并发处理能力的瓶颈,意味着在团队协作场景下,Hermes Agent的稳定性还达不到“开箱即用”的企业级标准。
企业如何自建一套“企业版 Hermes”?
- 1)接入层:先把入口统一,解决入口协议不统一问题
- 2)Agent 编排层:拿大脑,别拿工作流截图冒充大脑
- 要精细控制,就上 LangGraph
- 要多 Agent 通信,就看 AutoGen
- 要偏企业分布式,就看 AgentScope
- 要轻量角色协作,就用 CrewAI
- 3)记忆层:别“All in 向量库”(向量库是记忆的一部分,不是记忆本身). 企业记忆至少要分三层:
- 用户偏好和执行元数据:关系型数据库
- 会话与操作日志:日志存储 / 检索库
- 语义知识与经验召回:向量数据库
- 向量库选型:Milvus 大规模场景、Qdrant 中型团队很好用、Pgvector 已经重度用 PostgreSQL 的团队最省心
- 4)技能层:用 Git 管技能,用索引服务管发现。Skill 从“个人经验包”升级成“组织可治理资产”。把 Skill 做成:
- Git 仓库存版本
- 元数据中心存权限、标签、适用部门
- 向量 / 关键词双索引做技能发现
- 发布流程里带审校和回滚
- 5)知识库和治理层:别让 Agent 裸奔
- 知识库推荐按企业现状选:
- 想快速落地,可以接 Dify / FastGPT / RAGFlow
- 想深做文档解析和复杂文件理解,RAGFlow 会更强
- 想完全自控,就把解析、切片、重排、检索拆开自己搭
- 治理层至少别省掉这几件事:
- 认证:Keycloak / Casdoor
- 网关:Kong / APISIX
- 审计日志:ELK / Loki
- 监控告警:Prometheus + Grafana
- 知识库推荐按企业现状选:
企业不缺会回答问题的机器人,缺的是一套敢接业务、能审计、出了事能追责的 Agent 基础设施
Hermes 最值得企业学的,不是产品形态,而是架构克制
【2026-5-26】拆开 Hermes Agent:企业怎么自建一套会“越用越强”的AI Agent系统
【2026-4-18】实在Agent
【2026-4-18】Hermes Agent企业级落地可行吗?有哪些平替?
实在Agent是目前国内市场中,将“企业级安全合规”“无API系统适配”“远程跨终端操作”三大企业刚需整合得最成熟的平台。
蚂蚁 DTClaw
蚂蚁数科 DTClaw 的实践
| 坑 | DTClaw 填平方式 |
|---|---|
| 认知门槛高 | 专业虾模板 + 密态技能,开箱即专业 |
| 自进化不可控 | 模型提案 + 确定性决策 + 回滚机制 |
| 记忆场景单一 | 插件化记忆后端,场景自选策略 |
| 静态规则有尽头 | CARLI 五维模型,允许犯错但损害可控 |
DTClaw 不是另一个 Hermes,而是更成熟的“数字合伙人”
DTClaw 还具备:
- PinchBench 87.93% 综合得分,超越官方基准 7%~22%
- 上下文优化插件:智能压缩冗余,节省 50% Token
- 存算分离架构:热切换实例无中断,零数据丢失
- 支付宝 AI 付:让 Agent 从“能执行”进化为“能交易”

支付宝打赏
微信打赏