鹤啸九天 自律更自由,平凡不平庸 Less is More

Hermes 使用笔记

2026-04-03
阅读量

Notes(温馨提示):

  1. ★ 首次阅读建议浏览:导航指南, 或划到本页末尾, 或直接点击跳转, 查看全站导航图
  2. 右上角工具条搜索文章,右下角二维码关注微信公众号(鹤啸九天),底栏分享、赞赏、评论
  3. ★ 转载请注明文章来源,知识点积累起来不容易,水滴石穿,绳锯木断,谢谢理解
  4. ★ 如有疑问,邮件讨论,欢迎贡献优质资料


Hermes

问题

大多数AI Agent 工作方式:给定任务,Agent完成后,session结束,一切归零。

下次打开:白纸一张。同样的事情又解释一遍。反反复复,永无止境。

但Hermes完全不同——它会记住所有事情。

资讯

【2026-4-15】资讯 Hermes Agent被实锤架构级抄袭中国团队 EvoMap 的开源项目 Evolver:10步主循环一一对应、12组术语系统性替换、7份材料零归属。

  • EvoMap 开源 Evolver 36天后,融资过亿的硅谷团队 Nous Research“重新发明”了整套自进化架构。
  • 被锤后官方回应仅一句“Delete your account”,随后删帖拉黑。

Evolver

EvoMap 十几人的中国年轻团队从零搭建了一整套AI Agent自进化引擎 Evolver,给AI智能体装上「基因系统」,让能力可以像生物基因一样遗传、变异、进化。

EvoMap 开源 Evolver 36天后,融资过亿的硅谷团队 Nous Research“重新发明”了整套自进化架构。

Hermes 介绍

Hermes Agent 是 Nous Research 开源的自主 AI Agent 框架。2026-02-25, Hermes 开源版发布(v0.1.0)

Hermes 官网

核心理念:

让 AI 成为长期在线的数字员工,而非一次性聊天机器人。

Hermes Agent 是业内少见的原生内置学习闭环的 AI Agent,可从执行经验中沉淀技能、自主优化能力、持久化知识、检索历史对话,并在跨会话中持续完善用户认知模型。

Hermes Agent 支持自由切换任意大模型,包括 Nous Portal、OpenRouter(200+ 模型)、OpenAI、GLM、Kimi、MiniMax 等,执行 hermes model 即可切换,无需改代码、无厂商锁定

Hermes 如何发音?

两种读法,Hermès(法国品牌,带重音)与 Hermes(希腊神名,无重音)发音完全不同,核心区别:法语 h 不发音,英语 h 发音。

类型 音标 近似读音 注意
国际音标 /ɛʁˈmɛs/ 艾尔 - 梅斯 H不发音
赫尔墨斯希腊神名:赫尔墨斯 /ˈhɝːmiːz/ 赫-儿-米兹 H清晰发音, s浊化为z

总结

  • ❌ 误读:“赫尔 - 梅斯”(混英法)
  • ✅ 品牌:“爱马仕” ≈ 艾尔梅斯
  • ✅ 神话:“赫尔墨斯” ≈ 赫米兹

OpenClaw vs Hermes

两者理念完全相反:

产品 解决问题 特点 使用场景
OpenClaw 解决”多Agent组织协同” 多agent协作 多Agent跨平台协作时更强:Slack Agent、邮件Agent、研究Agent
Hermes 解决”一个随时间不断进化的Agent”。 自进化 “每天都在变聪明”的Agent时更强:学习你的代码库、记住你的偏好、从经验中构建Skills、自主从错误中恢复。

特点

对比维度 OpenClaw Hermes
Agent介绍 一个24小时在线的秘书,全天Oncall,随时飞书/钉钉/微信/QQ找它 学习能力特别强的助理,会自己“长本事”的AI伙伴,越用越懂你
适合用户 想找个AI帮手处理日常事务的人 想让AI主动帮你做复杂事情、还能自己进步的人
适合场景 日常办公、消息互动、快速上手 深度研究、复杂任务、自主学习

云端部署选型指南

  • openclaw: 快速用起来,接入主流IM应用、多个AI分工干活儿,比如:有个工具帮我查查资料、多个助手分工、设置提醒,越快越好
  • hermes: 研究型任务、多步骤、高效的数据收集能力,比如:每天自动监控某网站、发现新内容、行业报告

Hermes 特点

特点

  • 原生终端交互 完整 TUI 界面,支持多行编辑、命令补全、历史回溯、流式输出等
  • 全平台接入 一个网关接入 CLI、Telegram、Discord、Slack、WhatsApp 等多端
  • 闭环学习体系 自主管理记忆、技能生成与优化、跨会话召回、用户建模
  • 定时自动化 内置 Cron 调度,支持日报、备份、审计等 7×24 自动任务
  • 并行任务处理 支持子 Agent 并行执行、多工作流拆分与 RPC 工具调用
  • 多环境运行 支持本地、Docker、SSH、Daytona、Modal 等 6 种后端
  • 科研级能力 支持轨迹生成、强化学习环境、训练数据压缩

总结

  1. 自进化 — 通过 skills 越用越强,不靠微调。
  2. 跨 session 记忆 — 不丢上下文。
  3. 真工具访问 — 不只是聊天,是能改文件、跑命令、管服务器。
  4. 平台无关 — 同一 agent 跑在终端、飞书、微信、Telegram。
  5. profile 隔离 — 客户 A 的记忆不会污染客户 B。
  6. 可扩展 — 插件、MCP、webhook、cron 全方位接入。

学习闭环

每次 Hermes 完成复杂任务,不会就此停步。

相反,会进入复盘阶段,分析做了什么,形成可复用的技能,这样下次处理同类请求时会快得多、好得多。

任务 → Agent完成 → 从经验中生成Skill → Skill不断完善 → Agent 搜索历史对话 → 建立个人模型 → 循环往复

这种进化能力源于三层记忆架构

  • Hermes 不只是记住最后一条消息,它运行的是完整的三层记忆系统

自进化原理

self-improvement

每次对话结束后,Hermes 做三件事:

  • 第1步:快照对话 → 把当前这场对话完整拷贝一份
  • 第2步:叉一个分身 → 创建一个新的 AIAgent 实例(叫 review fork)
  • 第3步:让分身自己看自己 → “刚才这场对话,有什么值得学的?”

分身是个后台线程,不耽误聊天,分身默默在后面干活。

这个分身(review fork)只带了两件工具:

  • 🧠 记忆审查:用户暴露了偏好、习惯、个人信息吗?如有,就调用memory tool → 持久化记忆
  • 🛠 技能审查:刚才的对话值得存为一个技能吗?有踩坑经验、工作流优化吗?如有,就进行 skill_manage → SKILL.md

🎯 触发条件:hermes 多久”进化”一次?

  • 不是每个消息都触发审查,否则太费钱了(每次审查要调一次 LLM)。
  • 触发规则写在 agent_init.pyconversation_loop.py 里:
    • 每跟hermes聊 10 轮,悄悄复盘一轮。系统里有计数器,用户消息轮数 (_turns_since_memory) ,具迭代次数 (_iters_since_skill),这两个计数器是独立的,有可能只触发记忆、只触发技能,或者两者都触发。

而且有一套 “curator” 机制(agent/curator.py)——如果某个 skill 很久没用,curator 会归档。不用的技能会被淘汰,这就是”自然”的选择。

Hermes 架构

本地配置,用户主目录下的 .hermes 文件夹

文件 目录 功能
主配置文件 ~/.hermes/config.yaml 配置文件
环境变量 ~/.hermes/.env 用于存储 API 密钥等
会话数据 ~/.hermes/state.db SQLite 数据库
技能目录 ~/.hermes/skills/ 技能信息
会话目录 ~/.hermes/sessions/ 会话存储目录
技能目录 ~/.hermes/memories/ 持久化记忆信息

记忆能力

2026 年,随着上下文窗口(128K、200K 甚至 1M)的爆炸式增长,反直觉的现象出现:更大的窗口 ≠ 更好的记忆。

原因:

  • 上下文窗口是短期记忆,会话结束就清零
  • 真正的长期记忆需要策略:选择性地记住什么、遗忘什么、如何组织
  • 记忆的质量不在于”记住了多少”,而在于”在正确的时间想起了正确的内容”

这正是 OpenClaw 和 Hermes Agent 在记忆系统上花费巨大精力的原因。两个项目走向了截然不同的设计路径:

  • OpenClaw 选择了神经科学启发的三阶段睡眠模拟(dreaming)
  • Hermes Agent 选择了认知科学分层的三层记忆架构

Hermes Agent 核心架构

架构拆解:三层记忆 + 五层防线

AI Agent 的终极战场不是推理能力,而是记忆质量

Hermes 核心创新概括:像人类一样记忆,像银行一样安全。

  1. 三层记忆架构:越用越懂你的秘密
  2. 五层安全防线:比 OpenClaw 更谨慎

三层记忆

Hermes 有三层:

  • Prompt记忆: 每次session开始时,Hermes直接把个人笔记从 MEMORY.md 和 USER.md 加载到系统提示词中。偏好、环境、项目——在你打字之前,一切都已就绪。
  • 情景记忆: 基于 SQLite FTS5 构建的完整可搜索档案,记录每次历史对话。Agent可以跨所有历史session搜索,回忆曾经讨论过的任何内容——哪怕是几个月前的事。
  • 程序记忆: 从完成的任务中自动生成的Skills。可复用的步骤式工作流,Agent会在未来持续使用并不断完善。

hermes vs openclaw 记忆对比

【2026-5-9】记忆机制对决:OpenClaw 的dreaming 三阶段睡眠 vs Hermes 三层认知架构

核心结论:

  • OpenClaw 的 dreaming 和 Hermes 的三层记忆,不是优劣之分,而是设计哲学的不同。
  • dreaming 来自神经科学,模拟人类睡眠周期,简单透明、自动遗忘、天然适合审查
  • 三层记忆来自认知科学,按情景/语义/程序性分层,高效扩展、可复用、天然适合积累

选择建议:

优先看重特性 对应选择框架
自动遗忘 OpenClaw
可解释性 OpenClaw
快速检索 Hermes
Skill 复用 Hermes
精确匹配 Hermes
低维护成本 OpenClaw

更多详情见原文 记忆机制对决:OpenClaw 的dreaming 三阶段睡眠 vs Hermes 三层认知架构

OpenClaw dreaming:模拟人类大脑的睡眠周期

OpenClaw 的 dreaming 系统建立在核心假设上:

  • 记忆巩固发生在”睡眠”中,而不是”清醒”时。

人类大脑在睡眠期间会经历三个阶段:

  • 浅睡眠:过滤当天的感官信息,提取关键信号
  • 深睡眠:将重要信息从短期海马体转移到长期皮层存储
  • REM(快速眼动):整合新知识,建立长期关联

OpenClaw 将这个模型映射到 AI Agent 的记忆系统:

  • 清醒时段(会话中) → 记录原始信号,不做深度处理
  • 定时睡眠(后台 cron) → 三阶段扫描、评分、晋升

设计哲学:简单、透明、可解释。每个阶段的行为都是确定的,人工可以审查和干预。

Hermes 记忆系统基于认知科学的经典理论:

人类记忆不是单一结构,而是三个独立的系统协同工作。

记忆类型 认知科学定义 AI 映射
情景记忆(Episodic) 对特定事件的回忆:“昨天我做了什么” 历史会话记录、时间线
语义记忆(Semantic) 对事实和概念的存储:“地球是圆的” 用户偏好、项目约定、环境事实
程序性记忆(Procedural) 对技能和习惯的存储:“如何骑自行车” Skill 文件、可复用工作流

设计哲学:高效、扩展、自动策展。每个层级有明确的存储格式和检索策略,互不干扰。

1. 三层记忆架构

越用越懂你的秘密

传统 AI 助手最大的痛点是”失忆”——每次对话从零开始。Hermes 通过三层记忆系统解决这个问题:

Agent 三层记忆架构表

层级 名称 存储内容 实际例子
第一层 持久事实层 用户偏好、项目习惯、长期工作上下文 “你习惯用 4 空格缩进,讨厌驼峰命名”
第二层 程序性记忆层 Skill(技能)及对应的优化迭代历史 “写周报时先读取 Git 提交记录,再自动生成内容总结”
第三层 历史搜索层 全量对话上下文、完整任务执行流水记录 “上周三你让查询的竞品数据在这里”
  1. 第一层(长期静态记忆):几乎永久保存,不随单次对话过期,塑造 Agent 固定工作风格与个人习惯
  2. 第二层(流程技能记忆):固化标准化工作流程,持续迭代优化任务执行步骤,形成可复用自动化能力
  3. 第三层(时序上下文记忆):短期对话回溯,支持历史问答溯源、跨时间任务关联查询

为什么分层?

  • 想象一下:如果你每次聊天都要从幼儿园回忆开始,效率有多低。Hermes 默认只加载第一层(几百字摘要),需要时才检索深层记忆,既省 Token 又防幻觉。

Skill 自生长机制:完成任务后,Hermes 会自动复盘——”这次哪里做得好?哪里可以优化?”然后将经验固化为新的 Skill(一个 Markdown 文件)。下次遇到类似任务,直接调用 Skill,无需重新推理。

实际效果:第一次写周报需要 10 分钟,第二次可能只需 30 秒。

2. 五层安全防线

比 OpenClaw 更谨慎

Hermes 在安全性上做了大量工作,特别适合企业场景

AI Agent 安全五层防护体系

防线 机制 示例
用户授权 敏感高危操作强制要求用户手动确认 删除文件前弹窗二次确认
危险命令审批 rm -rf 等高风险系统指令拦截+二次校验 严防误删线上生产环境数据
容器隔离 Agent 任务全程在独立沙箱容器内运行 异常代码崩溃、恶意行为不会影响宿主主机
上下文扫描 前置检测对话与指令里的注入类风险 自动识别拦截 SQL 注入、系统命令注入攻击
权限最小化 默认只读权限,所有写入/修改操作必须显式授权 从根源杜绝越权访问、非法篡改文件

Skills

skills 用法

hermes skills browse                              # 浏览所有官方Skills
hermes skills browse --source official            # 仅浏览官方可选Skills
hermes skills search kubernetes                   # 搜索所有来源
hermes skills search react --source skills-sh     # 搜索skills.sh目录
hermes skills search https://mintlify.com/docs --source well-known
hermes skills inspect openai/skills/k8s           # 安装前预览
hermes skills install openai/skills/k8s           # 安装并安全扫描
hermes skills install official/security/1password
hermes skills install skills-sh/vercel-labs/json-render/json-render-react --force
hermes skills install well-known:https://mintlify.com/docs/.well-known/skills/mintlify
hermes skills install https://sharethis.chat/SKILL.md              # 直链安装
hermes skills install https://example.com/SKILL.md --name my-skill # 覆盖默认名称
hermes skills list --source hub                   # 列出已安装的Skills
hermes skills check                               # 检查上游更新
hermes skills update                              # 更新Skills
hermes skills audit                               # 安全审计
hermes skills uninstall k8s                        # 卸载
hermes skills reset google-workspace              # 重置为"用户修改"状态
hermes skills reset google-workspace --restore    # 同时恢复原始版本
hermes skills publish skills/my-skill --to github --repo owner/repo
hermes skills snapshot export setup.json          # 导出配置
hermes skills tap add myorg/skills-repo           # 添加自定义GitHub源

常用技能

Hermes 五大核心技能:解锁AI代理完全体潜能

  • ① Gstack:记忆层优化引擎 让Hermes具备自我进化能力,越用越聪明,由YC总裁Garry Tan开发,GitHub获85.5k星
  • ② Gbrain:多团队协作中枢 通过知识图谱实现效率翻倍,支持实体识别与自动关联,含17,888页面/4,383用户/723公司数据
  • ③ Hermes Web UI:三面板轻量界面 左侧会话导航/中间聊天/右侧文件浏览,圆形上下文环实时显示令牌使用,无需构建步骤
  • ④ Awesome Hermes:生态导航系统 汇聚2.3万星项目资源,涵盖技能中心、部署集成、多智能体应用等九大分类
  • ⑤ Self Evolution:自进化增强模块 基于DSPy和GEPA技术,实现提示词与代码的遗传优化,由创始人technion亲自开发

生态

MCP

【2026-5-27】Hermes(爱马仕):MCP和自定义Tool,把任何API变成AI的第三只手

Hermes Agent 自带了二十多个工具——web搜索、浏览器、终端、文件操作、记忆——覆盖了通用场景

两种工具:MCP Server 和 自定义原生Tool

  • 大部分场景用MCP就够了,省心省力。只有当需要跟Hermes内部状态深度交互(比如加一个改变对话行为的trick),才去写原生Tool。
维度 MCP Server 原生Tool
上手成本 写脚本+一条命令 改框架源码3个文件
隔离性 独立进程,崩了不影响主进程 与主进程共享内存
维护方式 独立git仓库,Hermes随便升级 随Hermes分支走,合代码时注意
最佳场景 外部API、第三方服务、私有脚本 需要深度数据共享的核心功能
发布方式 hermes mcp add 一键注册 必须改代码再重启

避坑

  • MCP Server进程挂了不会自动重启——用 while true; do python3 server.py; done 包一层,处理完了退出就行。
  • Tool变更必须 /reset——prompt caching 导致旧工具列表会缓存到新的模型调用,不reset不生效
  • 返回值必须是JSON字符串——所有Handler都要求返回 str,千万别直接 return dict
  • HTTP模式的MCP需要Server实现MCP传输层协议,不如stdio模式省事
  • 第一次加MCP建议用 hermes mcp test name 先测,别上来就问模型”能不能调”

MCP Server

Hermes MCP操作:

  • 添加后,Hermes自动向LLM(大模型)注册工具列表,模型推理时发现用户需求匹配就会主动调用。完全无感集成,同内置的 web_search 是一个体验。
# 添加MCP服务器(stdio模式:跑本地脚本)
hermes mcp add weather-api \
  --command "python3 ~/mcp-servers/weather.py"

# 添加MCP服务器(HTTP模式:跑远端服务)
hermes mcp add internal-api \
  --url "http://localhost:8080/mcp"

# 查看已注册的工具
hermes mcp list

# 测试连通性
hermes mcp test weather-api
# 输出: Connection OK, registered 3 tools

MCP Server本身就是一个Python/Node脚本,实现里定义好 tools(工具列表)和 call_tool(执行逻辑)就行。

比如一个简单的记账查询MCP Server不到50行:

# mcp-server/ezbookkeeping.py
from mcp.server import Server, stdio_server

async def main():
    server = Server("ezbookkeeping")
    
    @server.list_tools()
    async def list_tools():
        return [{
            "name": "query_expense",
            "description": "查询今日消费",
            "inputSchema": {"type": "object", "properties": {}}
        }]
    
    @server.call_tool()
    async def call_tool(name: str, args: dict):
        result = ezbookkeeping_api(...)
        return {"content": [{"type": "text", "text": json.dumps(result)}]}

    async with stdio_server() as (read, write):
        await server.run(read, write)

然后

hermes mcp add ezbook --command "python3 ~/mcp-servers/ezbook.py"

自定义原生Tool

自定义原生Tool:改3个文件

如果MCP的这层网络通信对你不必要——工具就在本地,不需要隔离——那就直接写原生Tool,嵌入到Hermes进程内部。

只需要改3个文件:

  • 第一步:创建 tools/my_tool.py
  • 第二步:在 model_tools.py_discover_tools() 里加上 import
  • 第三步:在 toolsets.py_HERMES_CORE_TOOLS 列表里加上 “my_tool”

然后 /reset 重启会话,工具就出现在模型的工具列表里了。

tools/my_tool.py 文件

import json
from tools.registry import registry

def my_custom_api(param: str, task_id: str = None) -> str:
    # 你的业务逻辑
    result = call_internal_api(param)
    return json.dumps({"success": True, "data": result})

registry.register(
    name="my_custom_api",
    toolset="custom",
    schema={
        "name": "my_custom_api",
        "description": "调用内部API获取数据",
        "parameters": {
            "type": "object",
            "properties": {
                "param": {"type": "string", "description": "查询参数"}
            },
            "required": ["param"]
        }
    },
    handler=lambda args, **kw: my_custom_api(
        param=args.get("param", ""),
        task_id=kw.get("task_id")
    ),
)

GUI

官方 Web UI

第三方 Web UI

  • 【2026-4-11】Hermes-HUDUI 开源项目,为本地AI代理 Hermes 提供了可视化控制面板,解决了”黑盒”问题,可实时查看AI记忆、当前目标与会话历史。
  • hermes-webui

Hermes Web 界面方案。

选择指南

  • 第一次装 → 官方 Dashboard
  • 个人日常聊天 → hermes-webui
  • 程序员工作台 → Hermes Workspace
  • 团队接入飞书/企业微信 → EKKO Hermes Web UI
  • 已有 Open WebUI → 直接接入

方案对比

方案 定位 特点 适合人群
官方Web Dashboard 系统管理后台 改配置、管 API Key、看日志、用量统计;同源稳定 首次安装、日常排错、不折腾的用户
hermes-webui 日常聊天 App 界面简洁;支持手机访问;Token 状态一目了然 个人日常聊天、手机端使用
Hermes Workspace 程序员工作台 VS Code 式驾驶舱;多窗口整合;Swarm Mode;多 Agent 控制 程序员、技术团队、重度开发场景
EKKO Hermes Web UI 团队管理后台 用量统计、定时任务、平台配置页面;支持飞书/微信/企业微信接入 国内团队、办公沟通链路集成
Open WebUI 通用 AI 前端 非 Hermes 专属;通过 OpenAI-compatible 连接 Hermes;已有平台最省事 已有 Open WebUI 的用户
Hermes Desktop 桌面软件 功能丰富,有虚拟人形象(claw3d)、看板 个人日常聊天

(1) Hermes Web-UI

git clone https://github.com/nesquena/hermes-webui.git hermes-webui
cd hermes-webui
python3 bootstrap.py
# 或
./start.sh

(2) hermes-hudui

项目地址:hermes-hudui

安装方法

git clone https://github.com/joeynyc/hermes-hudui.git
cd hermes-hudui
./install.sh
hermes-hudui # 不一定管用
source venv/bin/activate && hermes-hudui

打开地址 localhost:3001

(3) Hermes Desktop

Hermes 桌面版

功能

  • Hermes Agent 的首次引导式安装
  • OpenRouter、Anthropic、OpenAI 以及本地 OpenAI 兼容端点的提供商配置
  • 基于 Hermes CLI 的流式聊天界面
  • 带恢复和搜索能力的会话历史
  • 用于隔离 Hermes 环境的档案切换
  • 对人格、记忆、工具和已安装技能的图形界面访问
  • Hermes 消息集成的网关控制
  • 使用 Electron Builder 进行桌面打包

手机操控

【2026-4-26】Hermes+Bridge自动操控手机

用 Hermes + Android Bridge,把 Android 手机变成一个可读屏、可点击、可输入、可远程操控的 AI 自动化终端。

Hermes + Android Bridge 的核心思想是:让 Hermes Agent 负责思考和规划,让 Android Bridge 负责看屏幕、点屏幕、输文字和回传结果。

Hermes 官方已经提供 Android / Termux 的安装路径,说明可以直接在 Android 手机上通过 Termux 运行 Hermes CLI 和核心能力。

而 Hermes Android Bridge 则是一个独立桥接项目,用来让 Hermes 与 Android 设备交互,手机端通过权限能力执行读屏、点击、输入、滑动、截图等动作。

多人协作

【2026-5-5】Hermes 多 Agent 协作:让多个 AI 同时为你写代码

问题:

单个 AI Agent 已经很强了,为什么还需要多个?

因为并行。实际的软件开发项目很少是单线程的

  • 前端和后端可以同时开发
  • API 接口和数据库 schema 可以并行设计
  • 业务逻辑和单元测试可以分头写。

但单 Agent 工作流的瓶颈:即使 Agent 速度再快,它也只能一次做一个任务。

  • 包含 5 个子需求的 feature,Agent 串行完成需要 25 分钟。
  • 如果拆给 3 个 Agent 并行,理论上 8 分钟就能搞定。

不同 Agent 用不同的角色和视角来看同一个项目。

Devin,Cursor等各种”AI 程序员” 使用方式还是单线程:打开一个 Agent,给它一个任务,等它做完,再给下一个。

Hermes 多 Agent 协作,不是”AI 能不能写代码”——这已经没什么争议。而是”怎么让多个 AI 同时写代码,而且不会把项目搞砸”。

Hermes Agent 的多 Agent 协作核心机制: 派生子进程(subagent)。

  • 主 Agent 接收到复杂的任务,比如”实现一个用户管理系统,包含注册、登录、权限控制三个模块”。

Hermes 不会让 Agent 从头写到尾。会把任务拆解,然后 spawn 多个子 Agent,每个负责一个独立的子任务:

主 Agent(你)
  ├── Agent A:实现注册模块 + 数据库 model + 单元测试
  ├── Agent B:实现登录模块 + JWT 认证 + API 路由
  └── Agent C:实现权限中间件 + 角色管理 + 访问控制

三个子 Agent 各自有独立的上下文、独立的终端会话、独立的工作目录。它们互不干扰,并行执行。

每个子 Agent 完成后,结果返回给主 Agent。主 Agent 做整合、审查、决定是否需要调整。

整个过程只需要做两件事:给任务、review 结果。

安装

Linux、mac与wsl2

  • 不支持原生 Windows 环境,请先安装 WSL2,再在 WSL2 终端中执行上述命令。
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc    # 重载shell配置(若使用zsh,执行:source ~/.zshrc)
hermes              # 开启智能体对话!

自动处理所有依赖项:

  • uv — 快速 Python 包管理器
  • Python 3.11 — 通过 uv 安装,无需 sudo
  • Node.js v22 — 用于浏览器自动化和 WhatsApp 桥接
  • ripgrep — 快速文件搜索
  • ffmpeg — TTS 音频格式转换

使用

Hermes 完全教程

基础命令

hermes [flags] [command]
  -r, --resume SESSION   恢复指定 session
  -c, --continue [NAME]  按名恢复(或最近一次)
  -w, --worktree         隔离 git worktree(多 agent 并行)
  -s, --skills SKILL     预加载技能
  -p, --profile NAME     切换配置档
  --yolo                 跳过危险命令确认

安全防护

Hermes Agent 提供两层「安全网」,解决两类完全不同的问题:

对比维度 Profile 多账号 Docker 沙箱
解决的问题 多人共用,数据打架 AI 执行危险命令
隔离什么 配置、密钥、聊天记录、技能 文件系统、网络、进程
类比 浏览器多用户资料 给水电工单独的工具棚
一句话命令 hermes profile create hermes config set terminal.backend docker

什么时候用 Profile?

  • 团队共用一台服务器,每人要独立配置
  • 公司和个人的 API key 要分开
  • 多个客户项目,各用各的模型和密钥
  • 飞书/Telegram/Discord 网关需要独立运行

什么时候用 Docker 沙箱?

  • 执行用户提交的代码或第三方脚本
  • 审查含敏感数据的内部代码
  • 让 AI 跑自动化任务,不想它碰到重要文件
  • 日常开发也想多一层保护

两者可叠加使用

  • 每个 Profile 独立配置沙箱策略
  • 一个用严格模式跑不信任代码,另一个用开发模式日常编码。

hermes入门指南

CLI 命令

hermes              # 交互式命令行界面 — 开启对话

hermes chat -q "问题"          # 单次提问
hermes chat -m claude-sonnet-4 # 指定模型
hermes chat -t web,terminal    # 限定工具集

# 交互式选模型
hermes model        # 选择大语言模型服务商与对应模型
hermes model --provider ollama --model gemma4:27b

hermes tui
hermes tools        # 配置启用的工具集
hermes gateway      # 启动消息网关(支持Telegram、Discord等平台)
hermes setup        # 运行全量配置向导(一站式完成所有配置)
hermes claw migrate # 从OpenClaw迁移数据(适用于原OpenClaw用户)
hermes update       # 更新至最新版本

hermes auth                    # 凭证管理
hermes doctor [--fix]          # 依赖与配置体检
hermes doctor       # 诊断运行环境与配置问题

hermes config                  # 查看当前配置
hermes config set KEY VAL      # 设置配置
hermes config edit             # 编辑 config.yaml
hermes config set <key> <value>	# 设置配置值
hermes config get <key>	# 获取配置值
hermes config list	# 列出所有配置
hermes config check	# 检查配置完整性
hermes config migrate	# 迁移配置到新版本

配置

关键路径

~/.hermes/config.yaml       主配置
~/.hermes/.env              API key 与密钥
~/.hermes/skills/           技能
~/.hermes/sessions/         session JSONL 转录
~/.hermes/state.db          会话存储(SQLite + FTS5)
~/.hermes/logs/             网关/错误日志
~/.hermes/auth.json         OAuth 与凭证池
~/.hermes/profiles/<name>/  配置档(独立布局)

hermes 会话内命令

/config              查看配置
/model [name]        切换模型
/personality [name]  设置人设
/reasoning [level]   推理强度(none/minimal/low/medium/high/xhigh)
/verbose             详细度切换
/voice [on|off|tts]  语音模式
/yolo                跳过确认

/history             历史
/usage               token 用量
/insights [days]     用量分析
/copy [N]            复制回复到剪贴板
/image               附加本地图片
/debug               上传 debug 报告
/quit                退出

多账户

一台机器,N 个独立账号

什么时候用 Profile?

  • 团队共用一台服务器,每人要独立配置
  • 公司和个人的 API key 要分开
  • 多个客户项目,各用各的模型和密钥
  • 飞书/Telegram/Discord 网关需要独立运行

Profile 把 Hermes「分身」成多个独立账号,每个账号有自己的配置、密钥、聊天记录、技能库,谁也看不到谁的。

可以作为管理员,随时查看、备份、删除任何一个账号。

profile 信息

hermes profile list # 查看有哪些账户
hermes profile create NAME     # 创建新账户,在 ~/.hermes/profiles/ 下面生成全新的目录
# ~/.hermes/profiles/zhangsan/
# ├── config.yaml       ← 空白配置,等着你填
# ├── .env              ← 空白密钥文件
# ├── skills/           ← 89 个内置技能
# ├── sessions/         ← 聊天记录(空的)
# └── logs/             ← 日志(空的)

hermes profile show zhangsan
hermes profile delete wangwu

hermes profile use NAME        # 设为默认
hermes profile export/import   # 打包迁移
# 个性化配置
hermes -p zhangsan config set model.default "claude-sonnet-4"
hermes -p zhangsan config set ANTHROPIC_API_KEY "sk-ant-zhangsan-xxxx"

hermes profile list                     # 看所有账号
hermes profile create <名字>            # 建账号
hermes profile show <名字>              # 看详情
hermes profile export <名字> -o x.tar.gz # 备份
hermes profile import x.tar.gz          # 恢复
hermes profile rename <旧> <新>         # 改名
hermes profile delete <名字>            # 删号

# 用户
hermes profile use <名字>               # 登录
hermes -p <名字> chat                   # 聊天
hermes -p <名字> config                 # 看配置

沙箱 sandbox

Hermes 启动的 Docker 容器自动带一整套安全限制:

  • 容器内即使是 root,也对宿主机没有任何管理权限
  • 容器内的程序不能提权(就算有 suid 文件也没用)
  • 最多同时跑 256 个进程,防止 Agent 搞出 fork 炸弹
  • /tmp、/var/tmp、/run 这些临时目录禁止执行程序,防止恶意二进制落地
  • /tmp 容量限制在 512MB,防止写爆磁盘

这些限制是 Hermes 自动加上的,不用手动配。你只需要决定:给容器开多大的口子

更多操作见:hermes入门指南

设置 API 密钥

通过 CLI 设置 API 密钥:

hermes config set OPENROUTER_API_KEY sk-or-v1-your-key-here

或直接编辑 ~/.hermes/.env 文件:

# LLM 提供商
OPENROUTER_API_KEY=sk-or-v1-your-key-here

# 可选工具
FIRECRAWL_API_KEY=fc-your-key
FAL_KEY=your-fal-key

选择模型

hermes model       # 交互式选择

或在配置文件中指定:

# ~/.hermes/config.yaml
provider:
  name: openrouter
  model: anthropic/claude-sonnet-4-20250514

会话控制

/new (/reset)        新会话
/retry               重发上一条
/undo                撤回最后一条
/title [name]        命名会话
/compress            手动压缩上下文
/rollback [N]        回滚文件系统
/branch (/fork)      分支当前会话
/resume [name]       恢复
/goal [text]         设定长跑目标

工具

配置工具集

常用工具集包括:

  • web、terminal、file、browser、vision、image_gen、skills、tts、todo、memory、session_search、cronjob、code_execution、delegation、homeassistant 和 rl。
# 使用特定工具集
hermes chat --toolsets "web,terminal"

# 配置每个平台的工具(交互式)
hermes tools
hermes tools                   # 交互式启用/禁用工具
hermes tools list              # 列出所有工具
hermes tools enable NAME       # 启用
hermes tools disable NAME      # 禁用

会话内斜杠命令

/tools               管理工具
/skills              搜索安装
/skill <name>        加载技能
/reload-skills       重扫
/cron                定时任务
/curator [sub]       技能生命周期管理(pin/archive)
/kanban [sub]        多 agent 协作看板

MCP

hermes mcp add NAME            # 添加 MCP 服务
hermes mcp list                # 列出已配置
hermes mcp test NAME           # 测试连接

网关

hermes gateway run             # 前台运行网关
hermes gateway install         # 注册为后台服务
hermes gateway start/stop      # 启停
hermes gateway setup           # 配置消息平台

会话内斜杠命令

/approve / /deny     通过/拒绝待确认命令
/restart             重启网关
/sethome             把当前对话设为 home
/platforms           平台状态
/topic [sub]         Telegram DM 主题会话

技能 skill

技能是 程序化记忆——可复用的工作流沉淀。

创建场景:

  • 复杂任务(5+ 工具调用)后、纠错后、用户偏好后。

skill 创建

hermes skills create  # 交互式创建
# 或在 ~/.hermes/skills/<name>/SKILL.md 写 markdown

# 工作中发现"每天拉取 X 监控数据"是可复用流程
# 1. 在 ~/.hermes/skills/x-monitor/SKILL.md 写:
#    - 触发条件
#    - 步骤 + 命令
#    - 验证
# 2. 后续 /skill x-monitor 加载即用
hermes skills list             # 已安装技能
hermes skills search QUERY     # 搜索技能市场
hermes skills install ID       # 安装
hermes skills browse           # 浏览全部
hermes skills update           # 升级

Session/定时任务

Session

hermes sessions list           # 历史会话
hermes sessions export OUT     # 导出 JSONL
hermes sessions prune          # 清理旧会话

定时任务 / Webhook

hermes cron list               # 定时任务
hermes cron create "30m"       # 创建("every 2h" / "0 9 * * *" / ISO)
hermes cron pause/resume ID

hermes webhook subscribe NAME  # 创建 webhook 路由

人格设置

# ~/.hermes/config.yaml
personalities:
  helpful: "You are a helpful, friendly AI assistant."
  kawaii: "You are a kawaii assistant! Use cute expressions..."
  pirate: "Arrr! Ye be talkin' to Captain Hermes..."
  # 添加您自己的!

使用 /personality pirate 等命令激活。

记忆

跨 session 持久化,分两类:

  • user — 用户画像(姓名、角色、偏好、语言、时区)
  • memory — 环境事实、踩坑、约定、API 怪癖

原则:

  • 一周后会过期的不要存;
  • 程序化流程放技能;
  • 写入前要用户同意(你已设定)。

上下文压缩

# ~/.hermes/config.yaml
compression:
  enabled: true
  threshold: 0.50    # 在上下文限制的 50% 时压缩
  summary_model: "google/gemini-3-flash-preview"

问题

不记得上一个任务

任务迟迟不结束,强行推出后,再问 上一个任务,不记得了

迭代轮数超限

【2026-6-17】迭代轮数超限错误

⚠️ Iteration budget exhausted (90/90) — asking model to summarise ⚠️ Reached maximum iterations (90). Requesting summary…

官方 Bug: Iteration-exhaustion summary call has no output budget when agent.max_tokens is unset#35979

  • 回复:在迭代上限汇总接口调用中,使用默认最大生成长度 max_tokens=16384 ,避免会话耗尽时输出为空。

改进

不足

【2026-5-9】Hermes Agent 被忽视的 4 个坑,DTClaw 如何填平?

4 个关键问题几乎没人提:

  • 部署体验简化了,认知鸿沟还在
  • 自进化是最大亮点,也藏着最大隐患
  • 记忆设计精巧,但适用面有限
  • 安全纵深做得扎实,但规则总有尽头

云端部署

云厂商提供的云端部署方案

部署方式 优势 劣势 上手方式 适合场景
本地部署 ✅ 数据在本地 ❌ 权限管控弱,数据易泄露
❌ 需处理环境、端口、更新等运维工作
❌ 性能难扩展,任务多了顶不住
❌ 电脑休眠/断网/关机就断联
强动手 轻量体验
全托管 ✅ 上手最省事 ❌ 功能边界由平台定义
❌ 自定义技能麻烦,定制化受限
❌ 支持的IM入口有限,不灵活
❌ 标准化产品,无法按需定制
基本不用动手 完全不想操心、对个性化要求不高
轻量应用服务器(官方镜像自托管) ✅ 稳定在线
✅ 专属实例可控
✅ 可按需扩展
- ✅ 镜像预装、可视化配置 长期在线、复杂任务、多Agent/workspace、企业通道接入

💡 总结:

  • 本地部署:适合有技术基础、想快速尝鲜的用户,但稳定性和安全性都一般。
  • 全托管:适合纯小白用户,省心但几乎没有自定义空间。
  • 轻量应用服务器(自托管):是三者里的平衡之选,兼顾了稳定性、可控性和上手门槛,适合长期使用和复杂场景。
云厂商 时间 优点 不足 备注
阿里云 2026-4-28 轻量级云端部署   阿里云无影云电脑企业版部署 OpenClaw / Hermes Agent 详细教程
腾讯云 2026-5-18 轻量级云端部署   1年68元-99元,购买入口
腾讯云 ×Hermes Agent企业级 AI智能体 一键部署即落地
火山引擎        

腾讯云轻量应用服务器(Lighthouse)推出 Hermes Agent 专属的企业级系统镜像,在行业内率先实现了开源 AI 代理的云端一键式部署:

  1. 访问腾讯云管理控制台,进入轻量应用服务器服务;
  2. 创建新的服务器实例,在镜像选择中定位「AI 智能体→Hermes Agent 企业版」;
  3. 根据需求选择实例规格(建议从 2 核 4G 起步,支持弹性扩展),确认并完成购买;
  4. 系统将自动完成运行环境构建、安全增强配置及服务启动,整个过程无需编写代码,也无需进行复杂设置。

从购买到实际可用,整个过程仅需短短几分钟,即使是没有深厚技术背景的用户也能轻松完成,彻底摆脱了以往需要 “输入命令、查阅文档、排查故障” 的低效流程,助力企业迅速步入 AI 智能应用的新阶段。

企业级安全保障:数据自主可控,严守合规底线

  1. 私有化部署:核心引擎、记忆数据、技能库全部存储于企业自有的服务器中,数据无需出境,控制权完全掌握在企业手中,满足金融、政务、医疗等对合规性要求极高的场景需求;
  2. 安全沙箱隔离:工具调用在独立的容器环境中运行,与核心引擎隔离,内置危险指令审批、操作行为审计日志、工具白名单等机制,提供全链路防护,有效规避潜在安全风险;
  3. 多级权限管理:从 “仅查看” 到 “完全自主操作”,可灵活配置不同级别的操作权限,精确控制员工可访问和操作的范围,确保核心数据安全。

企业级

Hermes 很强, 但企业直接照抄,会遇到问题。

问题 Hermes特点 企业级特点 解法
记忆规模不够 Hermes SQLite + 本地文件记忆适合个人和小团队 企业跨部门知识量大、文档源杂、会话量高、权限边界复杂  
Skill 适合个人积累,不等于适合组织治理 个人使用 skill 容易 企业skill要明确谁能发布、审核、升级 skill,不同部门隔离访问,错误回滚 企业要的不是“技能目录”,而是“技能注册中心”
安全和审计还不够重 hermes存在安全问题,如:危险命令审批、工具限制、子 Agent 工具封禁。 需要 RBAC 权限、操作审计、敏感数据脱敏、多租户隔离、API 网关限流、合规留痕 -
高可用不是主目标 hermes定位:高能力的通用 Agent Runtime 企业需要多副本、故障转移、模型路由、成本治理、服务化接入 -

Hermes Agent 在个人开发者手中确实能跑通很多场景,一旦放到“企业级”的标尺下衡量,四个核心短板会立刻显现出来。

  • 🚫 短板一:安全合规——自进化本身是最大的不确定性
    • 企业级应用的第一道红线就是安全合规。Hermes Agent虽然内置了多层安全架构(含沙箱隔离),核心框架目前仅披露过少量中低危CVE,安全记录优于竞品。但它引入了一个全新的风险维度:自进化能力本身,就是最大的不确定性。
    • 当Agent可以自主从经验中“蒸馏”知识、沉淀技能、修改自身行为时,谁来判断这些“进化”是安全的?动态生成的脚本可能通过逻辑注入绕过静态扫描,跨平台API调用若隔离不足易引发越权攻击。此外,提示注入、硬编码凭据、过度授权等也是部署中的高危漏洞。对于需要满足等级保护、GDPR或行业监管要求的企业来说,这种不确定性是难以接受的。
  • 📦 短板二:技能生态——73 vs 13,729,悬殊的数量级差距
    • 企业级落地需要覆盖大量“长尾场景”——邮件模板生成、多平台日程同步、特定ERP系统的数据对接等。Hermes Agent截至v0.8.0仅内置70+基础Skill,而OpenClaw社区维护的Skill数量高达13,729+。这不是简单的“数量差距”,而是意味着很多企业日常需要的中频场景,在Hermes上“没有现成方案”,需要自己从头开发或等待社区贡献。
  • 🔄 短板三:长时运行状态漂移——跑着跑着就“忘了自己是谁”
    • 企业级系统要求7×24小时稳定运行。但实测数据显示,Hermes Agent连续运行超过72小时后,其Honcho用户画像模型的摘要准确率会下降11.3%。这意味着Agent会逐渐“遗忘”或“误解”用户的偏好和习惯,需要手动执行hermes memory compact命令强制压缩。这种“状态漂移”问题,决定了它目前难以承担需要长时间无人值守的企业核心业务。
  • 🔧 短板四:网关高并发不稳定——流量一大就“崩”
    • 当企业有多人同时使用Agent时,ACP网关面临真正的压力测试。实测中,当Webhook注入密度超过87次/分钟时,网关就会发生连接池耗尽,错误日志显示“too many open files”,需要手动调高ulimit限制才能恢复。这种并发处理能力的瓶颈,意味着在团队协作场景下,Hermes Agent的稳定性还达不到“开箱即用”的企业级标准。

企业如何自建一套“企业版 Hermes”?

  • 1)接入层:先把入口统一,解决入口协议不统一问题
  • 2)Agent 编排层:拿大脑,别拿工作流截图冒充大脑
    • 要精细控制,就上 LangGraph
    • 要多 Agent 通信,就看 AutoGen
    • 要偏企业分布式,就看 AgentScope
    • 要轻量角色协作,就用 CrewAI
  • 3)记忆层:别“All in 向量库”(向量库是记忆的一部分,不是记忆本身). 企业记忆至少要分三层:
    • 用户偏好和执行元数据:关系型数据库
    • 会话与操作日志:日志存储 / 检索库
    • 语义知识与经验召回:向量数据库
    • 向量库选型:Milvus 大规模场景、Qdrant 中型团队很好用、Pgvector 已经重度用 PostgreSQL 的团队最省心
  • 4)技能层:用 Git 管技能,用索引服务管发现。Skill 从“个人经验包”升级成“组织可治理资产”。把 Skill 做成:
    • Git 仓库存版本
    • 元数据中心存权限、标签、适用部门
    • 向量 / 关键词双索引做技能发现
    • 发布流程里带审校和回滚
  • 5)知识库和治理层:别让 Agent 裸奔
    • 知识库推荐按企业现状选:
      • 想快速落地,可以接 Dify / FastGPT / RAGFlow
      • 想深做文档解析和复杂文件理解,RAGFlow 会更强
      • 想完全自控,就把解析、切片、重排、检索拆开自己搭
    • 治理层至少别省掉这几件事:
      • 认证:Keycloak / Casdoor
      • 网关:Kong / APISIX
      • 审计日志:ELK / Loki
      • 监控告警:Prometheus + Grafana

企业不缺会回答问题的机器人,缺的是一套敢接业务、能审计、出了事能追责的 Agent 基础设施

Hermes 最值得企业学的,不是产品形态,而是架构克制

【2026-5-26】拆开 Hermes Agent:企业怎么自建一套会“越用越强”的AI Agent系统

【2026-4-18】实在Agent

【2026-4-18】Hermes Agent企业级落地可行吗?有哪些平替?

实在Agent是目前国内市场中,将“企业级安全合规”“无API系统适配”“远程跨终端操作”三大企业刚需整合得最成熟的平台。

蚂蚁 DTClaw

蚂蚁数科 DTClaw 的实践

DTClaw 填平方式
认知门槛高 专业虾模板 + 密态技能,开箱即专业
自进化不可控 模型提案 + 确定性决策 + 回滚机制
记忆场景单一 插件化记忆后端,场景自选策略
静态规则有尽头 CARLI 五维模型,允许犯错但损害可控

DTClaw 不是另一个 Hermes,而是更成熟的“数字合伙人”

DTClaw 还具备:

  • PinchBench 87.93% 综合得分,超越官方基准 7%~22%
  • 上下文优化插件:智能压缩冗余,节省 50% Token
  • 存算分离架构:热切换实例无中断,零数据丢失
  • 支付宝 AI 付:让 Agent 从“能执行”进化为“能交易”

结束


支付宝打赏 微信打赏

~ 海内存知已,天涯若比邻 ~

Share

Similar Posts

Related Posts

下一篇 在线蒸馏 OPD

标题:大模型知识库构建

摘要:大模型如何构建个人知识库?

标题:在线蒸馏 OPD

摘要:新兴训练技术:在线蒸馏

站内可视化导航

文章可视化导读:鼠标划过图形块时,如果出现蓝色光环, 点击即可跳转到对应主题

Comments

--disqus--

    My Moment ( 微信公众号 )
    欢迎关注鹤啸九天