鹤啸九天 自律更自由,平凡不平庸 Less is More

OpenClaw 使用笔记

2026-01-05
阅读量

Notes(温馨提示):

  1. ★ 首次阅读建议浏览:导航指南, 或划到本页末尾, 或直接点击跳转, 查看全站导航图
  2. 右上角工具条搜索文章,右下角二维码关注微信公众号(鹤啸九天),底栏分享、赞赏、评论
  3. ★ 转载请注明文章来源,知识点积累起来不容易,水滴石穿,绳锯木断,谢谢理解
  4. ★ 如有疑问,邮件讨论,欢迎贡献优质资料


OpenClaw 使用笔记

【2026-5-11】Agent 新发展趋势:Claw 化,从「对话聊天」向「工具助手」转变。

  • 更多 Skill、更多 Tool、更深度系统交互和更好的上下文管理。

两种发展方向:个人 Agent 和 公共 Agent。

  • 个人 Agent 高自由度、可成长,是个人能力的数字化延伸;
  • 公共 Agent 开箱即用、领域专用,是领域知识的模型化封装。 本地化协同实践:通过共享 workspace,让 Agent 深度参与团队协作,从「工具」变为「协作者」,并展望 AI Native Workspace 的未来。

openclaw 介绍

时间线

  • 首次发布(Clawdbot):2025-11-24(开源初版)
  • 第一次更名(Moltbot):2026-01-27(因 Anthropic 商标投诉)
  • 最终定名(OpenClaw):2026-01-30(社区投票确定)

详见飞书文档 OpenClaw笔记

原理

详见飞书文档 OpenClaw工作原理

Agent Loop

【2026-5-13】Agent Loop的实现方式(八):sub-agent/子agent的作用

为什么需要子代理?

当单次循环无法完成任务时,Agent 将工作分解。

子代理(Sub-agent)的核心价值:

  • 并行化:多个子代理同时工作,缩短总耗时
  • 上下文隔离:子代理不污染父级的上下文窗口
  • 专注性:每个子代理只处理单一任务,减少指令冲突
  • 安全性:子代理可被限制工具集和权限

📊 主流AI Agent框架子代理能力对比表

维度 Claude Code Codex CLI OpenClaw Hermes Agent
子代理类型 6种内置 + 自定义 Agent Tool + Symphony 频道路由 + 运行时 spawn delegate_task + Profile
上下文策略 Sidechain(仅摘要回传) 独立 Thread 独立 Workspace 独立会话
并发能力 ForkAgent 并行 Async 驱动 独立 Runtime ThreadPoolExecutor(3并发)
最大深度 可变(按场景) 未公开限制 1-5 可配置 默认 1,可至 3
性能优化 Sidechain 摘要减负 App Server 线程管理 独立进程 线程池复用
命名配置 代码级指定 未公开 VISION.md Agent Profiles
安全性 权限继承 + 独立审批 Thread 级隔离 独立 auth + 白名单 工具集限制 + 自动拒绝

🔍 关键差异解读

  1. 子代理模型与隔离
    • Claude Code 和 OpenClaw 偏向“强隔离”:前者用 Sidechain 只回传摘要,后者直接用独立 Workspace/Runtime;
    • Codex CLI 用 Thread 级隔离,Hermes 用独立会话+Profile,隔离粒度更轻,成本更低。
  2. 并发与深度控制
    • Claude Code 和 OpenClaw 支持高灵活度的并发/深度配置,适合复杂任务;
    • Hermes 限制了并发数(3)和默认深度(1),更适合稳定可控的场景,避免过度嵌套。
  3. 性能优化路径
    • Claude Code 靠 Sidechain 摘要减少上下文压力;
    • OpenClaw 用独立进程实现性能隔离;
    • Hermes 采用线程池复用,资源占用更低,适合本地部署。
  4. 安全与权限
    • OpenClaw 独立 auth + 白名单的安全策略最严格;
    • Claude Code 权限继承+独立审批兼顾灵活性与可控性;
    • Hermes 工具集限制+自动拒绝,适合对安全边界要求明确的场景。

Sub Agent 设计模式

【2026-5-9】subagent 的常用 4 种编排模式

主 agent 之外起 subagent 是搭复杂 AI 系统的常用做法。

按主 agent 对子 agent 生命周期的控制力从弱到强,4 种模式正在成形。

  • Pattern 1 Inline Tool 工具模式。subagent 当成普通 tool 调一次拿结果。call_agent 一个工具就够了。
    • Sync 模式 tool 阻塞返回结果,Async 模式立即返回 ID 结果稍后注入。
    • 多数 subagent 用例从这里开始也停在这里 — research 查找、code review、文件分析、test 生成都能搞定。
    • 局限:没法发 follow-up、没法查进度、没法提前 cancel。
    • 任何支持 tool use 的模型都能跑,包括小模型。
  • Pattern 2 Fan-Out。spawn_agent 立即返 ID,wait_agent 阻塞收集。模型自己决定何时 wait。好模型在 spawn 后做自己的活到节点再 wait,差模型 spawn 后立刻 wait 等于 Pattern 1 没拿到并发优势。
    • 适合多个独立任务可以并发跑,主 agent 不需要中间结果就能开下一个。仍然 fire-and-forget 没法中途纠偏。
  • Pattern 3 Agent Pool。subagent 持久存在保留对话历史。主 agent 通过 spawn / send_message / wait / list / kill 五个工具协调。多回合对话,主 agent 在专家之间路由信息。适合多步工作流,agent 之间需要协作。局限是主 agent 要追踪多个 agent 状态,前沿模型勉强能管 2 至 4 个,更多就跟丢。
  • Pattern 4 Teams。agent 之间直接对话,每个成员都有 cross-agent send_message。主 agent 搭好团队后退后只等汇报。适合大任务,协调逻辑超出单个 agent 能 step-by-step 管理。局限严重 — 每个 agent 都需要前沿级模型,还要解决循环检测、冲突解决、shutdown 协调、调试链追踪等基础设施挑战。

工程纪律:从 Pattern 1 起步。多数任务不需要复杂编排。只有真正需要并行 / 多步协作 / 复杂团队协调才往上走。模式越高,模型门槛越严,调试越痛。用便宜模型搭 Pattern 4 是最常见的失败方式。

应用

详见飞书文档 OpenClaw笔记

进化

基于 OpenClaw 改进论文

【2026-3-10】普林斯顿 OpenClaw-RL

解决什么问题?

现有 agent 强化学习系统大多依赖于预先收集的批量数据或最终结果奖励,忽视了真实交互中实时产生的、富含信息量的过程信号。

  • 评价性信号:隐式地评价前一个动作的好坏。用户再次提问可能意味着不满意,通过的测试意味着成功,错误堆栈则意味着失败。这构成了一个天然的过程奖励,无需额外的人工标注。
  • 指导性信号:指明动作应如何改进。用户说“你应该先检查文件”,不仅说明回答错了,更具体指出了改进方向。详细的软件错误追踪也常常暗示了具体的修正路径。

就像老师只根据期末考试成绩来评判学生,却完全忽略了日常作业、课堂提问和即时反馈的价值。

普林斯顿大学新研究——OpenClaw-RL,终结这种“数据浪费”,让AI智能体能够简单地通过被使用来学习与进化。无论是个人对话助手,还是执行终端、GUI、软件工程或工具调用任务的通用智能体,都能在同一套框架下,从实时交互信号中持续学习。

OpenClaw-RL 核心创新: 实时回收利用这两类被浪费的信号,构建从任何交互流中持续学习的统一系统。

2026-3-10】普林斯顿 OpenClaw-RL

OpenClaw-RL 框架: 完全解耦的异步架构。

  • 下一状态信号是通用的,同一个策略可以同时从所有类型的信号中学习。
  • 个人对话、终端执行、GUI交互、软件工程任务和工具调用轨迹,不再是各自独立的训练问题,而是可以用于在同一循环中训练同一策略的交互流。

完全解耦的异步架构

  • 策略服务、环境交互、PRM(过程奖励模型)评判和策略训练作为四个独立的循环运行,彼此之间没有阻塞依赖。
  • 模型在服务下一个用户请求的同时,PRM正在评判上一个响应,训练器则在应用梯度更新——三者互不等待。
  • 正是这种设计,使得从实时、异构的交互流中进行连续训练变得可行。

OpenClaw-RL基础设施概览。

  • 交互流来自两种智能体:部署在个人设备上的个人智能体(对话式、单用户),以及托管在云服务上的通用智能体(终端、GUI、SWE和工具调用智能体)。
  • 收集的样本流入基于异步slime框架构建的RL服务器,该服务器由四个解耦的组件构成,支持优雅的权重更新,并能与任何智能体框架协同训练。

OpenClaw-RL 标志着智能体训练范式的重要转变。不再将训练和部署视为两个割裂的阶段,而是构建了实时交互中持续学习、自我演进的闭环系统。

【2026-3-17】CMU+伯克利 MetaClaw

解决什么问题?

  • 现有agent部署后,保持静态,能力逐步过时

OpenClaw 平台上,单个智能体连接 20 多个消息渠道并处理多样化、不断变化的工作负载,现有方法

  • 要么存储原始轨迹而不提炼可迁移的行为知识
  • 要么维护与权重优化脱节的静态技能库
  • 要么在重新训练期间导致服务中断。

【2026-3-17】CMU+伯克利

MetaClaw 持续元学习框架,联合维护基础 LLM 策略和不断演变的、包含可重用行为指令的技能库,并通过两种互补的机制对两者进行改进。

  • 技能驱动的快速适应分析失败轨迹,并通过一个 LLM 进化器合成新技能,这些技能立即生效,实现零服务中断。
  • 机会性策略优化通过机会性元学习调度器(OMLS)在用户非活动窗口期间被触发,利用带过程奖励模型(PRM)的强化学习(RL)在云端执行基于梯度的 LoRA 微调权重更新。

两种机制相互促进:更好的策略能为技能合成提供更多信息丰富的失败案例,而更丰富的技能则能为策略优化提供更高回报的轨迹。

MetaClaw 基于代理架构构建,无需本地 GPU 即可扩展到生产规模的 LLM。

MetaClaw-Bench(934 个问题,44 个模拟工作日)和 AutoResearchClaw(23 阶段自主研究流水线)上的实验显示出一致的改进:仅技能驱动适应就将准确率相对提升了高达 32%;完整流水线将 Kimi-K2.5 的准确率从 21.4% 提升至 40.6%(对比 GPT-5.2 基线 41.1%),端到端任务完成率提升了 8.25 倍;并且仅技能注入就将 AutoResearchClaw 的综合鲁棒性提升了 18.3%。

同类框架

【2026-4-11】OpenClaw、Hermes、Superagent:Agent 时代的三条路线,该怎么选?

三条完全不同的路线

  • OpenClaw:怎么让 AI 真正变成常驻个人助手。
  • Hermes:怎么让 Agent 在更低成本下持续学习、越用越顺手。
  • Superagent:当 Agent 真要进生产环境时,怎么别把公司数据和合规底线一起送走。

这不是简单的“三个框架谁更强”。而是 Agent 时代分叉:有人抢生态,有人抢效率,有人抢安全入口

Agent 下半场面临的工程问题:

  • 要不要 24 小时常驻
  • 要不要跨平台接入
  • 成本会不会失控
  • 技能怎么沉淀
  • 上下文怎么管理
  • 权限怎么收口
  • 安全事故出了谁负责

大家争夺的不是“谁更像一个聪明聊天机器人”,而是:谁能成为下一代 AI 工作流里的基础设施。

产品 导向 特点 适合谁
OpenClaw 生态优先 通用助手中控层; 生态厚/产品强/扩展强;
但太重/成本高/上下文管理厚/安全问题
尽快跑起来
Hermes 学习效率优先 会进化的轻量agent 重视效率和积累
Superagent 安全治理优先 安全与治理闸门 生产环境

更多比较

Claude Code / OpenClaw / Hermes Agent 对比表

维度 Claude Code OpenClaw Hermes Agent
核心隐喻 工匠 (Craftsman) 宠物 (Pet) 管家 (Manager)
交互模式 实时结对编程 配置即行为 自主后台运行,跨平台汇报
擅长场景 写代码、重构、Debug 个人助理、轻量任务 长周期任务、巡检、日报
模型支持 仅 Claude 多模型 200+ 模型(含 Claude)
部署形态 本地终端绑定 特定生态绑定 Anywhere(VPS/Serverless)

竞品

Hermes

详见站内地址:hermes

OpenHuman

详见站内专题:OpenHuman

Multica 团队协作管理

【2026-5-13】Multica 你的下一批员工不是人类。

  • Multica 是一个开源平台,将编码 智能体 变成真正的队友。分配任务、跟踪进度、积累技能——在一个地方管理你的人类 + 智能体 团队。

【2026-5-13】Multica 开源 Managed Agents 平台让AI Agent成为真正的团队成员

image

一、Multica 是什么

Multica(全称 Multiplexed Information and Computing Agent)是2026年由中国四人团队(前TikTok工程师Jiayuan创立)推出的开源AI编程智能体协作平台,口号:Your next 10 hires won’t be human(你的下一批员工,不是人类)。 核心定位:把AI Agent变成可管理的“虚拟同事”,而非仅作为工具;提供类似Jira的看板,支持给Agent分配任务、跟踪进度、沉淀技能,实现“人类+AI混合团队”协同。

二、核心特点

  • 团队原生设计:从看板/Issue/Inbox架构出发,天然支持多人+多Agent协作,非个人工具扩展。
  • 厂商中立:不绑定特定AI,兼容Claude Code、OpenAI Codex、Gemini CLI、OpenClaw、Cursor Agent等主流编程Agent。
  • 技能复利:Agent解决的问题自动沉淀为可复用“技能”,团队共享,越用越强。
  • 自托管+开源:Apache 2.0协议,支持Docker/K8s部署,数据可控,适合企业合规场景。
  • 架构分离:云端管理(Go+Next.js+PostgreSQL)、本地执行(Daemon守护进程),任务分布式运行。

三、参考/致敬对象

  1. 名字灵感:Multics操作系统(1960s) Multica名称直接致敬Multics(多路信息与计算系统)——首个实现多用户分时共享的操作系统,让多人共用一台大型机。 类比逻辑:Multics共享计算资源→Multica共享AI执行能力;Unix是Multics的简化(单用户单任务),Multica则反其道而行,回归“多智能体并行协作”。

  2. 产品形态参考:Jira + 开源替代对标
    • Jira/看板工具:任务分配、状态流转、进度追踪的UI/UX直接参考Jira,降低团队学习成本。
    • Claude Managed Agents(Anthropic):被称为“Anthropic Managed Agents的开源替代”,在Anthropic发布后迅速开源对标。
    • OpenAI Symphony:OpenAI推出Codex任务编排器后,Multica强调“不绑定Codex,支持多Agent”,形成差异化。
    • Devin(Cognition):商业闭源SWE Agent,Multica定位为开源、自托管、更灵活的低成本替代
  3. 技术与理念参考
    • Agent框架:底层兼容LangGraph、AutoGen、CrewAI等,但不自研Agent,专注协作层。
    • 技能沉淀思路:借鉴Hermes Agent的“经验复用”,但聚焦团队共享而非个人专属。

四、关键时间线(2026年)

  • 4月初:开源发布,对标Anthropic Managed Agents。
  • 4月22日:OpenAI发布ChatGPT Workspace Agents,Multica称“开源版”。
  • 4月28日:OpenAI开源Symphony,Multica强调“多Agent中立”。
  • 5月初:GitHub Star超19k,成为AI协作赛道热门项目。

五、核心价值总结

Multica不是AI编程工具,而是AI团队协作的操作系统:把分散的Agent变成可管理、可协作、可沉淀能力的“虚拟员工”,让小团队(2-10人)通过AI放大产能,同时保持数据可控与成本灵活。

详见入门指南飞书笔记

【2026-5-21】腾讯 Marvis 多agent

2026年05月21日,腾讯旗下操作系统层级 AI 助手 马维斯 Marvis 正式上线。

很多 Agent 产品动辄让用户自己去搭工作流、安插件。Marvis 则是开箱即用,六个 Agent 零配置上手,对普通用户非常友好。刚进界面,里面已经有六个 Agent 在 7x24 小时待命了。

  • 没接到任务的时候,有的在打盹,有的在办公室里闲逛,有的在健身,有的在喝咖啡,还有的直接去上厕所,一旦你发出指令,任务就会拆解分配给对应的成员。

分工明确的团队:

  • PM 负责听懂你的需求,拆解任务往下派活;
  • File Agent 处理文件的搜索、阅读和格式转换;
  • Computer Agent 专门对付系统配置、查硬件、调夜间模式;
  • APP Agent 负责在各种软件里代为操作,比如查个机票或者电商比价;
  • Search Agent 负责快速从公开资源中定位答案并给出关键引用;
  • 最后是个 Browser Agent,定位是网页交互专家,进行网页交互与数据抓取。

这些 Agent 可以并行工作。举例而言,我先抛出一个需求:「电脑开机太慢了,帮我看看哪些自启动程序没用,帮我关掉。」

Windows 端、Mac 端和安卓端同步上线。

腾讯对马维斯的定位不是普通聊天机器人,而是能够把整台电脑变成可对话对象的 AI 助手。

功能定位

  • 马维斯更接近个人操作系统级 Agent。围绕本地文件、图片、文档、电脑设置和跨端任务进行处理,支持文件归类与解析、图片内容识别、系统设置修改、网络修复、手机远程操控电脑等能力。
  • 腾讯 Marvis 官网也显示,马维斯支持本地文档与图片内容搜索、文件智能整理、文档深度理解与生成,以及一句话完成电脑设置等功能。

相比传统 AI 助手,马维斯核心特点

  • 更深入地连接操作系统和本地文件环境。
  • 马维斯提供“效率模式”和“隐私模式”两种使用方式:效率模式强调端云协同,以提升响应速度和准确性;
  • 隐私模式则调用端侧大模型,支持文件 0 上传,适合对本地数据隐私更敏感的使用场景。

在跨端协同方面,马维斯支持通过手机连接电脑,用户可以在手机端实时查看电脑任务执行画面,并在需要时接管操作马维斯不只是桌面端 AI 助手,也在尝试成为随身携带的个人电脑控制入口。

硬件与平台方面,马维斯 Windows 版要求 6 核及以上 CPU、16GB 及以上内存、固态硬盘和 Win10 及以上 x64 系统;macOS 版要求 Apple Silicon M1 及以上芯片和 macOS 13 及以上系统;安卓端已开放下载,iOS 版本显示仍在送审,预计 6 月中旬上线。

从行业趋势来看,马维斯的正式上线说明个人 AI 助手正在从“聊天窗口”走向“系统入口”。过去很多 AI 产品主要围绕问答、写作、总结等单点能力展开,而马维斯这类产品更强调对文件、应用、系统设置和跨设备任务的持续操作能力。它代表了 AI Agent 产品从内容生成工具向操作系统级个人助理演进的方向。

【2026-5-26】阿里 AgentScope 2.0

AgentScope 是阿里于24年2月开源的多Agent开发平台,平台的架构、关键技术、容错机制、多模态应用支持,以及基于 actor 的分布式框架等

AgentScope 主要特点:

  • 良好的易用性:AgentScope以基本的易用性为设计重点。通过实施面向过程的消息交换机制、广泛的语法实用工具,结合丰富的内置资源和集成的用户交互模块,AgentScope使构建多Agent应用更加轻松愉快。
  • 强大的容错性:AgentScope集成了全面的服务级重试机制,并配备了一套基于规则的校正工具。此外,AgentScope提供了可定制的容错配置定制自己的容错机制。同时AgentScope也提出了一个具有自定义功能的日志系统作为系统保障。
  • 多模态应用的广泛兼容性:AgentScope支持多模态数据作为消息呈现,并实现传输和存储。AgentScope通过消息中的统一基于URL的属性,将多模态数据传输与存储解耦。从而最大限度地减少了消息在每个Agent内存中的内存使用量。
  • 优化的分布式操作效率:认识到分布式部署的至关重要性,AgentScope引入了基于actor的分布式机制,实现了复杂分布式工作流的集中编程和自动并行,AgentScope使开发人员能够专注于应用程序设计而不是实现细节。

AgentScope 1.0 以“透明开发”为核心,让开发者能清晰可见智能体的消息流转、工具调用和协作过程,从而降低理解与调试门槛。

阿里研发的AI Agent系统框架,支持事件流、多智能体协作、Workspace隔离与服务化Runtime,适用于企业级AI工作流与长期运行智能体系统

【2026-5-26】AgentScope 2.0 在延续透明理念的基础上,进一步聚焦真实场景下的稳定运行、安全控制与接入需求,带来一次更严肃、更完备、更整体的系统性升级。

设计理念

  • 为日益自主的大语言模型而设计。
  • 方法:充分发挥模型的推理与工具调用能力,而不是用严格的提示词和固化的编排方式来束缚它们。
  • 让模型自主决定何时调工具、规划任务、通过消息中心让agent自由协作

核心功能

  • 多智能体协作:开发者可通过Supervisor Agent调度搜索、代码与总结Agent。
  • 可恢复执行:系统支持Session日志恢复与长任务续传。当模型调用失败或服务中断后,Agent可从中断位置恢复执行,适合复杂工作流场景。
  • 事件系统:一次Agent回复不再只是文本,而是模型调用、工具结果与用户审批等流式事件。前端可实时展示智能体完整执行过程。
  • Middleware 扩展:开发者可在模型调用、工具执行与Prompt构造阶段插入自定义逻辑,例如日志追踪、安全审计与动态上下文注入。
  • 上下文管理:AgentScope 2.0支持结构化上下文压缩、工具结果自动截断与文件缓存机制,可减少Token浪费并提高长期任务稳定性。

官方介绍

  • 生产级在线 agent 骨架 —— agent 运行、后台任务、调度,以及 tool / MCP / skill / workspace 生命周期端到端纳管,会话事件流可扇出给多个订阅者,重连时还能从缓冲区中重放历史。
  • Schema 驱动的前端 —— credential 公开 JSON schema,model 暴露声明式卡片(输入 / 输出类型、上下文长度、参数 schema),前端无需绑死特定 provider 的代码即可渲染表单与能力标签。
  • 天然多租户 —— credential、agent、session、schedule、message 都归属于请求的 user_id,所有权在路由层强制;一份部署即可服务多用户,无需为每个租户单独编写代码路径。
  • 模块化、可扩展 —— 鉴权、聊天协议、workspace 隔离策略、存储后端,以及 model provider 与 credential 类型集合,全部在边界处开放,可在不动框架代码的前提下替换。

AgentScope 不是实验性框架,从设计之初就考虑了生产环境的需求:

特性 说明
多租户支持 一个服务实例可以服务多个用户/组织
多会话管理 支持用户同时进行多个对话
OpenTelemetry 集成 内置可观测性支持
多种部署方式 本地、云端 Serverless、Kubernetes 集群
权限控制 细粒度的工具调用权限管理

AgentScope 提供了丰富的内置组件:

  • 内置工具:Bash、Grep、Glob、Read、Write、Edit 等
    • 可以自定义工具(FunctionTool),工具函数的文档字符串(docstring) 非常重要,Agent 会通过阅读文档字符串来理解工具的用途和参数。
  • 模型支持:OpenAI、Anthropic、DashScope(阿里云)、Gemini、DeepSeek、Ollama 等
  • 协议支持:MCP(Model Context Protocol)、A2A(Agent-to-Agent)、Skill
  • 中间件系统:可扩展的钩子机制
    • Middleware(中间件) 扩展 Agent 行为,不修改 Agent 源代码的情况下添加自定义逻辑。

Message(消息) 是 Agent 与用户、Agent 与 Agent 之间通信的基本单位。

Event(事件) 是 AgentScope 实现流式响应的核心机制。当 Agent 执行任务时,会发出各种事件,让外部程序能够实时了解 Agent 的状态。

安装

uv pip install agentscope
# 或源码安装
git clone https://github.com/agentscope-ai/agentscope.git
# 进入目录
cd agentscope
# 安装
pip install -e .

核心要素

from agentscope.agent import Agent
from agentscope.model import OpenAIChatModel
# from agentscope.tool import Toolkit
from agentscope.tool import Toolkit, Bash, Read, Write, Edit

toolkit = Toolkit(
    tools=[
        Bash(),
        Read(),
        Write(),
        Edit(),
    ]
)

agent = Agent(
    name="Friday",                    # 名称:Agent 的标识
    system_prompt="你是一个有帮助的助手",  # 系统提示词:定义 Agent 的角色和行为
    model=OpenAIChatModel(...),       # 模型:Agent 的「大脑」
    # toolkit=toolkit,
    toolkit=Toolkit(tools=[...]),     # 工具集:Agent 可以使用的工具
    middlewares=[...],                # 中间件:扩展 Agent 行为
    state=AgentState(),               # 状态:Agent 的记忆和上下文
)
# 同步回复
result = await agent.reply(UserMsg("Tony", "你好!"))
print(result.content)
# 流式回复
async for event in agent.reply_stream(UserMsg("Tony", "你好!")):
    match event.type:
        case EventType.TEXT_BLOCK_DELTA:
            print(event.delta, end="", flush=True)
        case EventType.TOOL_CALL_START:
            print(f"\n[调用工具: {event.tool_name}]")

Agent Loop

Agent 的生命周期

  • 当调用 agent.reply()agent.reply_stream() 时,Agent 会经历 接收→准备上下文→推理循环(ReAct)→生成回复→更新状态
ReActConfig 来配置 Agent 的推理-行动循环

from agentscope.agent import Agent, ReActConfig

react_config = ReActConfig(
    max_iters=10,           # 最大迭代次数
    verbose=True,           # 是否输出详细日志
)

agent = Agent(
    name="助手",
    system_prompt="...",
    model=model,
    react_config=react_config,
)

【2026-5-28】清华 PilotDeck

OpenClaw 是极客浪漫主义的「大玩具」,PilotDeck 是真正面向纯粹生产力的「智能体协作舱」

【2026-5-28】清华THUNLP实验室、面壁智能、OpenBMB与AI9stars联合研发开源 Agent系统 PilotDeck 。项目独立建舱,记忆可视可改,Token还能省一大半。从此,一个人,就是一支AI军团

核心亮点

  • WorkSpace 级隔离与沉淀
    • 每个项目拥有独立的专属文件系统、记忆库与技能集。多任务并行互不干扰,检索空间有边界,技能随任务自动沉淀,告别全局上下文污染。
  • 可追溯的白盒记忆
    • 记忆的生成、抽取、存储与使用全链路可见。AI 记错时可直接定位并手动修改。内置 Dream 模式,利用空闲时间自动归纳整理,并支持一键回滚。
  • 智能路由与成本优化
    • 内置任务难度识别,复杂任务调用强力模型(如 Claude 3.5 Sonnet / GPT-4o),简单任务降级至轻量模型。通过端云协同与精准匹配,大幅降低 Token 消耗。
  • Always-on 常驻执行
    • 突破”你问我答”的限制。用户离开后,Agent 仍能在后台主动发现潜在任务、执行长周期监控、并最终将成果落地为本地文件与摘要汇报。

PilotDeck 给每个项目建完整的「工作舱」,舱里有三层。

  • 专属文件系统:哪些文件归这个项目、AI生成了什么,边界清楚。
  • 专属记忆:Project Memory记项目定义和进度,Collaboration Feedback记你的偏好。全都看得见、改得了、追得到来源。
  • 专属技能:Skill应用商店一键装到对应WorkSpace,给做游戏的舱装game-asset-finder,给写文档的舱装minimax-pdf。

区别

  • 大部分WorkSpace是文件夹加静态规则。
  • PilotDeck的WorkSpace是AI的完整生存环境

大部分路由方案是按request级别切,每次请求都单独判断走哪个模型。

  • 问题:模型频繁切换会打断KV-cache,相当于每次换模型都要重新「读档」,推理效率反而下降。

PilotDeck 做了一套智能路由,在子Agent层面做的。

一个复杂任务拆成多个子任务后,整个子Agent分配给一个模型跑到底,这个子Agent内部的上下文缓存是连续的。

省的不只是token的钱,还有来回切换带来的性能损耗。

调度规则。

  • 相比于写死的路由方案,比如「贵模型做难题、便宜模型做简单题」
  • PilotDeck要灵活得多。支持用规则和prompt来调节路由策略,可以自己定义什么类型的任务走什么模型,甚至用自然语言告诉它「代码相关的子任务都走Claude Opus,文本处理走便宜模型」。

安装

curl -fsSL https://raw.githubusercontent.com/OpenBMB/PilotDeck/main/install.sh | bash
pilotdeck            # starts the server at http://localhost:3001
pilotdeck status     # check runtime status

结束


支付宝打赏 微信打赏

~ 海内存知已,天涯若比邻 ~

Share

Similar Posts

Related Posts

标题:Skills 技术专题

摘要:Skills 知识点汇总

标题:驾驭工程(Harness Engineering)指南

摘要:驾驭工程、挽具工程

站内可视化导航

文章可视化导读:鼠标划过图形块时,如果出现蓝色光环, 点击即可跳转到对应主题

Comments

--disqus--

    My Moment ( 微信公众号 )
    欢迎关注鹤啸九天