鹤啸九天 自律更自由,平凡不平庸 Less is More

Hermes 使用笔记

2026-04-03
阅读量

Notes(温馨提示):

  1. ★ 首次阅读建议浏览:导航指南, 或划到本页末尾, 或直接点击跳转, 查看全站导航图
  2. 右上角工具条搜索文章,右下角二维码关注微信公众号(鹤啸九天),底栏分享、赞赏、评论
  3. ★ 转载请注明文章来源,知识点积累起来不容易,水滴石穿,绳锯木断,谢谢理解
  4. ★ 如有疑问,邮件讨论,欢迎贡献优质资料


Hermes

【2026-4-15】资讯 Hermes Agent被实锤架构级抄袭中国团队 EvoMap 的开源项目 Evolver:10步主循环一一对应、12组术语系统性替换、7份材料零归属。

  • EvoMap 开源 Evolver 36天后,融资过亿的硅谷团队 Nous Research“重新发明”了整套自进化架构。
  • 被锤后官方回应仅一句“Delete your account”,随后删帖拉黑。

【2026-5-13】Multica 你的下一批员工不是人类。

  • Multica 是一个开源平台,将编码 智能体 变成真正的队友。分配任务、跟踪进度、积累技能——在一个地方管理你的人类 + 智能体 团队。

Evolver

EvoMap 十几人的中国年轻团队从零搭建了一整套AI Agent自进化引擎 Evolver,给AI智能体装上「基因系统」,让能力可以像生物基因一样遗传、变异、进化。

EvoMap 开源 Evolver 36天后,融资过亿的硅谷团队 Nous Research“重新发明”了整套自进化架构。

Hermes 介绍

Hermes Agent 是 Nous Research 开源的自主 AI Agent 框架。2026-02-25, Hermes 开源版发布(v0.1.0)

Hermes 官网

核心理念:

让 AI 成为长期在线的数字员工,而非一次性聊天机器人。

Hermes Agent 是业内少见的原生内置学习闭环的 AI Agent,可从执行经验中沉淀技能、自主优化能力、持久化知识、检索历史对话,并在跨会话中持续完善用户认知模型。

Hermes Agent 支持自由切换任意大模型,包括 Nous Portal、OpenRouter(200+ 模型)、OpenAI、GLM、Kimi、MiniMax 等,执行 hermes model 即可切换,无需改代码、无厂商锁定

Hermes 如何发音?

两种读法,Hermès(法国品牌,带重音)与 Hermes(希腊神名,无重音)发音完全不同,核心区别:法语 h 不发音,英语 h 发音。

类型 音标 近似读音 注意
国际音标 /ɛʁˈmɛs/ 艾尔 - 梅斯 H不发音
赫尔墨斯希腊神名:赫尔墨斯 /ˈhɝːmiːz/ 赫-儿-米兹 H清晰发音, s浊化为z

总结

  • ❌ 误读:“赫尔 - 梅斯”(混英法)
  • ✅ 品牌:“爱马仕” ≈ 艾尔梅斯
  • ✅ 神话:“赫尔墨斯” ≈ 赫米兹

特点

  • 原生终端交互 完整 TUI 界面,支持多行编辑、命令补全、历史回溯、流式输出等
  • 全平台接入 一个网关接入 CLI、Telegram、Discord、Slack、WhatsApp 等多端
  • 闭环学习体系 自主管理记忆、技能生成与优化、跨会话召回、用户建模
  • 定时自动化 内置 Cron 调度,支持日报、备份、审计等 7×24 自动任务
  • 并行任务处理 支持子 Agent 并行执行、多工作流拆分与 RPC 工具调用
  • 多环境运行 支持本地、Docker、SSH、Daytona、Modal 等 6 种后端
  • 科研级能力 支持轨迹生成、强化学习环境、训练数据压缩

安装

Linux、mac与wsl2

  • 不支持原生 Windows 环境,请先安装 WSL2,再在 WSL2 终端中执行上述命令。
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc    # 重载shell配置(若使用zsh,执行:source ~/.zshrc)
hermes              # 开启智能体对话!

自动处理所有依赖项:

  • uv — 快速 Python 包管理器
  • Python 3.11 — 通过 uv 安装,无需 sudo
  • Node.js v22 — 用于浏览器自动化和 WhatsApp 桥接
  • ripgrep — 快速文件搜索
  • ffmpeg — TTS 音频格式转换

CLI 命令

hermes              # 交互式命令行界面 — 开启对话
hermes model        # 选择大语言模型服务商与对应模型
hermes tools        # 配置启用的工具集
hermes config set   # 设置单项配置项
hermes gateway      # 启动消息网关(支持Telegram、Discord等平台)
hermes setup        # 运行全量配置向导(一站式完成所有配置)
hermes claw migrate # 从OpenClaw迁移数据(适用于原OpenClaw用户)
hermes update       # 更新至最新版本
hermes doctor       # 诊断运行环境与配置问题

hermes config set <key> <value>	# 设置配置值
hermes config get <key>	# 获取配置值
hermes config list	# 列出所有配置
hermes config check	# 检查配置完整性
hermes config migrate	# 迁移配置到新版本

设置 API 密钥

通过 CLI 设置 API 密钥:

hermes config set OPENROUTER_API_KEY sk-or-v1-your-key-here

或直接编辑 ~/.hermes/.env 文件:

# LLM 提供商
OPENROUTER_API_KEY=sk-or-v1-your-key-here

# 可选工具
FIRECRAWL_API_KEY=fc-your-key
FAL_KEY=your-fal-key

选择模型

hermes model       # 交互式选择

或在配置文件中指定:

# ~/.hermes/config.yaml
provider:
  name: openrouter
  model: anthropic/claude-sonnet-4-20250514

工具配置

配置工具集

常用工具集包括:

  • web、terminal、file、browser、vision、image_gen、skills、tts、todo、memory、session_search、cronjob、code_execution、delegation、homeassistant 和 rl。
# 使用特定工具集
hermes chat --toolsets "web,terminal"

# 配置每个平台的工具(交互式)
hermes tools

人格设置

# ~/.hermes/config.yaml
personalities:
  helpful: "You are a helpful, friendly AI assistant."
  kawaii: "You are a kawaii assistant! Use cute expressions..."
  pirate: "Arrr! Ye be talkin' to Captain Hermes..."
  # 添加您自己的!

使用 /personality pirate 等命令激活。

上下文压缩

上下文压缩

# ~/.hermes/config.yaml
compression:
  enabled: true
  threshold: 0.50    # 在上下文限制的 50% 时压缩
  summary_model: "google/gemini-3-flash-preview"

GUI

官方 Web UI

第三方 Web UI

  • 【2026-4-11】Hermes-HUDUI 开源项目,为本地AI代理 Hermes 提供了可视化控制面板,解决了”黑盒”问题,可实时查看AI记忆、当前目标与会话历史。
  • hermes-webui

(1) Hermes Web-UI

git clone https://github.com/nesquena/hermes-webui.git hermes-webui
cd hermes-webui
python3 bootstrap.py
# 或
./start.sh

(2) hermes-hudui

项目地址:hermes-hudui

安装方法

git clone https://github.com/joeynyc/hermes-hudui.git
cd hermes-hudui
./install.sh
hermes-hudui # 不一定管用
source venv/bin/activate && hermes-hudui

打开地址 ocalhost:3001

结构

本地配置,用户主目录下的 .hermes 文件夹

文件 目录 功能
主配置文件 ~/.hermes/config.yaml 配置文件
环境变量 ~/.hermes/.env 用于存储 API 密钥等
会话数据 ~/.hermes/state.db SQLite 数据库
技能目录 ~/.hermes/skills/ 技能信息
会话目录 ~/.hermes/sessions/ 会话存储目录
技能目录 ~/.hermes/memories/ 持久化记忆信息

记忆能力

2026 年,随着上下文窗口(128K、200K 甚至 1M)的爆炸式增长,反直觉的现象出现:更大的窗口 ≠ 更好的记忆。

原因:

  • 上下文窗口是短期记忆,会话结束就清零
  • 真正的长期记忆需要策略:选择性地记住什么、遗忘什么、如何组织
  • 记忆的质量不在于”记住了多少”,而在于”在正确的时间想起了正确的内容”

这正是 OpenClaw 和 Hermes Agent 在记忆系统上花费巨大精力的原因。两个项目走向了截然不同的设计路径:

  • OpenClaw 选择了神经科学启发的三阶段睡眠模拟(dreaming)
  • Hermes Agent 选择了认知科学分层的三层记忆架构

Hermes Agent 核心架构

架构拆解:三层记忆 + 五层防线

AI Agent 的终极战场不是推理能力,而是记忆质量

Hermes 核心创新概括:像人类一样记忆,像银行一样安全。

  1. 三层记忆架构:越用越懂你的秘密
  2. 五层安全防线:比 OpenClaw 更谨慎

hermes vs openclaw 记忆对比

【2026-5-9】记忆机制对决:OpenClaw 的dreaming 三阶段睡眠 vs Hermes 三层认知架构

核心结论:

  • OpenClaw 的 dreaming 和 Hermes 的三层记忆,不是优劣之分,而是设计哲学的不同。
  • dreaming 来自神经科学,模拟人类睡眠周期,简单透明、自动遗忘、天然适合审查
  • 三层记忆来自认知科学,按情景/语义/程序性分层,高效扩展、可复用、天然适合积累

选择建议:

优先看重特性 对应选择框架
自动遗忘 OpenClaw
可解释性 OpenClaw
快速检索 Hermes
Skill 复用 Hermes
精确匹配 Hermes
低维护成本 OpenClaw

更多详情见原文 记忆机制对决:OpenClaw 的dreaming 三阶段睡眠 vs Hermes 三层认知架构

OpenClaw dreaming:模拟人类大脑的睡眠周期

OpenClaw 的 dreaming 系统建立在核心假设上:

  • 记忆巩固发生在”睡眠”中,而不是”清醒”时。

人类大脑在睡眠期间会经历三个阶段:

  • 浅睡眠:过滤当天的感官信息,提取关键信号
  • 深睡眠:将重要信息从短期海马体转移到长期皮层存储
  • REM(快速眼动):整合新知识,建立长期关联

OpenClaw 将这个模型映射到 AI Agent 的记忆系统:

  • 清醒时段(会话中) → 记录原始信号,不做深度处理
  • 定时睡眠(后台 cron) → 三阶段扫描、评分、晋升

设计哲学:简单、透明、可解释。每个阶段的行为都是确定的,人工可以审查和干预。

Hermes 记忆系统基于认知科学的经典理论:

人类记忆不是单一结构,而是三个独立的系统协同工作。

记忆类型 认知科学定义 AI 映射
情景记忆(Episodic) 对特定事件的回忆:“昨天我做了什么” 历史会话记录、时间线
语义记忆(Semantic) 对事实和概念的存储:“地球是圆的” 用户偏好、项目约定、环境事实
程序性记忆(Procedural) 对技能和习惯的存储:“如何骑自行车” Skill 文件、可复用工作流

设计哲学:高效、扩展、自动策展。每个层级有明确的存储格式和检索策略,互不干扰。

1. 三层记忆架构

越用越懂你的秘密

传统 AI 助手最大的痛点是”失忆”——每次对话从零开始。Hermes 通过三层记忆系统解决这个问题:

Agent 三层记忆架构表

层级 名称 存储内容 实际例子
第一层 持久事实层 用户偏好、项目习惯、长期工作上下文 “你习惯用 4 空格缩进,讨厌驼峰命名”
第二层 程序性记忆层 Skill(技能)及对应的优化迭代历史 “写周报时先读取 Git 提交记录,再自动生成内容总结”
第三层 历史搜索层 全量对话上下文、完整任务执行流水记录 “上周三你让查询的竞品数据在这里”
  1. 第一层(长期静态记忆):几乎永久保存,不随单次对话过期,塑造 Agent 固定工作风格与个人习惯
  2. 第二层(流程技能记忆):固化标准化工作流程,持续迭代优化任务执行步骤,形成可复用自动化能力
  3. 第三层(时序上下文记忆):短期对话回溯,支持历史问答溯源、跨时间任务关联查询

为什么分层?

  • 想象一下:如果你每次聊天都要从幼儿园回忆开始,效率有多低。Hermes 默认只加载第一层(几百字摘要),需要时才检索深层记忆,既省 Token 又防幻觉。

Skill 自生长机制:完成任务后,Hermes 会自动复盘——”这次哪里做得好?哪里可以优化?”然后将经验固化为新的 Skill(一个 Markdown 文件)。下次遇到类似任务,直接调用 Skill,无需重新推理。

实际效果:第一次写周报需要 10 分钟,第二次可能只需 30 秒。

2. 五层安全防线

比 OpenClaw 更谨慎

Hermes 在安全性上做了大量工作,特别适合企业场景

AI Agent 安全五层防护体系

防线 机制 示例
用户授权 敏感高危操作强制要求用户手动确认 删除文件前弹窗二次确认
危险命令审批 rm -rf 等高风险系统指令拦截+二次校验 严防误删线上生产环境数据
容器隔离 Agent 任务全程在独立沙箱容器内运行 异常代码崩溃、恶意行为不会影响宿主主机
上下文扫描 前置检测对话与指令里的注入类风险 自动识别拦截 SQL 注入、系统命令注入攻击
权限最小化 默认只读权限,所有写入/修改操作必须显式授权 从根源杜绝越权访问、非法篡改文件

问题

【2026-5-9】Hermes Agent 被忽视的 4 个坑,DTClaw 如何填平?

4 个关键问题几乎没人提:

  • 部署体验简化了,认知鸿沟还在
  • 自进化是最大亮点,也藏着最大隐患
  • 记忆设计精巧,但适用面有限
  • 安全纵深做得扎实,但规则总有尽头

蚂蚁数科 DTClaw 的实践

DTClaw 填平方式
认知门槛高 专业虾模板 + 密态技能,开箱即专业
自进化不可控 模型提案 + 确定性决策 + 回滚机制
记忆场景单一 插件化记忆后端,场景自选策略
静态规则有尽头 CARLI 五维模型,允许犯错但损害可控

DTClaw 不是另一个 Hermes,而是更成熟的“数字合伙人”

DTClaw 还具备:

  • PinchBench 87.93% 综合得分,超越官方基准 7%~22%
  • 上下文优化插件:智能压缩冗余,节省 50% Token
  • 存算分离架构:热切换实例无中断,零数据丢失
  • 支付宝 AI 付:让 Agent 从“能执行”进化为“能交易”

结束


支付宝打赏 微信打赏

~ 海内存知已,天涯若比邻 ~

Share

Similar Posts

Related Posts

标题:大模型知识库构建

摘要:大模型如何构建个人知识库?

标题:优质 Skills 汇总

摘要:总结各类实用 Skills

站内可视化导航

文章可视化导读:鼠标划过图形块时,如果出现蓝色光环, 点击即可跳转到对应主题

Comments

--disqus--

    My Moment ( 微信公众号 )
    欢迎关注鹤啸九天