CLI 命令行
CLI 时代
AI Agent时代,大模型最缺的是“操作能力”,如何让 AI 真正”使用”软件?
传统解决方案
- 要么依赖脆弱的 UI 自动化(截图、点击、OCR)
- 要么需要软件提供完善的 API 接口。
但现实是绝大多数专业软件既没有为 AI 设计的接口,其 UI 也远非为机器操作而优化。
这个鸿沟,正在成为 AI Agent 落地的最大障碍。
设计范式变化
【2026-3-21】OpenCLI vs CLI-Anything:AI Agent 时代的 CLI 革命
软件设计范式可能发生根本性转变:
- 从 GUI-first 到 CLI-first:新软件可能优先设计 CLI,GUI 只是 CLI 的可视化包装
- 从 API-only 到 CLI-native:CLI 成为主要的集成接口,API 成为 CLI 的子集
- 从人类中心到 Agent 友好:软件设计时考虑 AI 的可发现性、可组合性和可自动化性
很多人把最难、最复杂的的任务丢给 OpenClaw,而 Claw 们干活时,基本都选 Claude Code
不是 Cursor,不是 VS Code,更不是什么 GUI Agent。
核心原因:
“CC 的 CLI 做得太好了。有状态、自描述、好用还强大。Agent 不需要跟它「搏斗」—— 拿起来就能干活。”
但是绝大多数真正的专业软件,都没有这样的 CLI。
- GIMP、Blender、LibreOffice、OBS —— 每一个都是重量级工具,但 Agent 基本碰不了。
CLI vs GUI
CLI 为何成为 Agent 的”母语”?
传统 GUI(图形用户界面)为人类设计,但对 AI 极不友好:
- 信息密度低:GUI 为了美观和易用,往往在屏幕上分散大量信息,AI 需要处理大量无关像素
- 状态不可见:GUI 的内部状态隐藏在视觉元素背后,AI 难以准确感知应用当前状态
- 操作脆弱:基于坐标的点击在分辨率、主题、版本变化时极易失效
- 上下文消耗大:将界面截图传给 LLM 需要消耗大量 Token
CLI(命令行界面)正在成为 AI Agent 与软件交互的”通用语言”。相比 GUI,CLI 具有结构化、可组合、自描述、确定性等天然适合 LLM 的特性。
CLI 具有天然适合 AI 特性:
- 结构化与可组合:文本命令与 LLM 的输入输出格式天然匹配,且可通过管道组合成复杂工作流
- 轻量且通用:最小开销,跨系统工作,无需依赖图形环境
- 自描述:–help 标志提供自动文档,Agent 可自主发现能力
- 确定性与可靠:一致的结果使 Agent 行为可预测,便于调试和优化
GUI 与 CLI 核心对比表
| 对比维度 | GUI(图形界面) | CLI(命令行) |
|---|---|---|
| 设计目标 | 为「人类」设计 | 为「开发者与AI」设计 |
| 交互形式 | 窗口、图标、按钮等图形化操作 | 黑框纯文本指令输入 |
| 核心优势 | 简单直观、所见即所得、零学习门槛 | 高效直接、无冗余翻译层、AI天然擅长 |
| 自动化能力 | ❌ 自动化效率低 | ✅ 瞬时完成复杂任务 |
| AI适配性 | ❌ AI理解成本高 | ✅ 一键接管办公系统 |
| 适用人群 | 普通办公用户、非技术人员 | 开发者、AI Agent、自动化场景 |
说明
- GUI 面向人类的「友好界面」,核心是降低使用门槛,让普通人能快速上手;
- CLI 面向机器/AI的「标准化指令」,核心是提升执行效率,适配AI Agent的自动化需求,是AI从「聊天」到「干活」的关键桥梁。
CLI vs MCP
MCP(Model Context Protocol)热门话题。
但 OpenCLI 和 CLI-Anything 的开发者们似乎更倾向于一个简单的哲学:CLI 是比 MCP 更好的集成接口。
原因:
- CLI 是已有的事实标准,无需额外协议层,任何能执行命令的环境都能使用。
- 而 MCP 需要专门的支持和实现。正如 Unix 哲学所言:”做好一件事,并通过文本流协作”。
工具
示例
- GitHub CLI, 详见站内专题:Git
- CloudCLI - CloudCLI 提供以 AI 为核心的云端开发环境,配备预配置工具和持久化会话,实现无缝、跨设备的编码体验。
- Cline CLI - Cline CLI 从您的终端在客户端运行自主 AI 编码代理,以完全的隐私保护和执行透明度,自动化完成复杂的开发任务。
- bb-browser - bb-browser 将网站转化为机器可读的界面,使 AI 智能体能够以已认证用户的身份进行交互,无需 API 密钥,也无需担心反机器人机制的拦截。
- Cursor CLI - Cursor CLI 将AI编码能力直接融入您的终端,赋能开发者、DevOps和SRE,助其随时随地生成、重构、调试及自动化代码。
已有工具转型
CLI 大战爆发
| 时间节点 | 产品名称 | 核心动作 | 关键亮点/能力 | 设计定位 |
|---|---|---|---|---|
| 2026年3月27日 | 钉钉 DingTalk | 开源钉钉 CLI 项目 | 开放10项核心能力;支持AI表格、日历、待办;全面 CLI 化重构底层 | 办公 CLI 能力开放 |
| 2026年3月28日 | 飞书 Feishu | 发布 v1.0.0 正式版;开源 larksuite/cli | 覆盖11大业务域;提供200+ 命令 | 专为 AI Agent 设计 |
| 2026年3月30日 | 企业微信 WeCom | 正式开源企业微信 CLI | 7大核心能力;支持消息、日程、文档、会议;原生调用时代 | 办公系统原生 CLI 化 |
CLI 转换
总结
愿景
让任何软件都能被 AI Agent 通过命令行界面高效控制。
OpenCLI 和 CLI-Anything 虽然都致力于让软件 Agent-Native,但采用了截然不同的技术路径。
差异
- OpenCLI 更像”浏览器代理”,用 Chrome DevTools Protocol 与浏览器深度集成,通过拦截 XHR/Fetch 请求获取数据。它的优势在于能够处理那些只有 Web 界面、没有公开 API 的网站,且无需用户额外认证。
- CLI-Anything 则更像”软件编译器”,分析源代码,理解软件架构,然后生成完整的 CLI 封装。它的优势在于能够充分利用软件的原生能力,生成真正生产可用的工具。
| 维度 | OpenCLI | CLI-Anything |
|---|---|---|
| 目标对象 | 网站(Web 应用) | 本地软件(桌面应用) |
| 技术栈 | TypeScript + Chrome Extension | Python + Click + 软件后端 |
| 集成方式 | 拦截浏览器网络请求 | 生成项目文件 + 调用软件 CLI |
| 认证处理 | 复用浏览器登录会话 | 依赖软件自身的认证机制 |
| 扩展方式 | YAML 声明式 / TypeScript 编程式 | AI 自动生成完整代码 |
| 输出格式 | JSON / YAML / CSV / Markdown | JSON + 人类可读表格 + REPL |
| 适用场景 | 数据抓取、内容监控、Web 自动化 | 创意生产、文档处理、媒体渲染 |
【2026-3-14】OpenCLI
【2026-3-14】jackwener 开发的 AI 原生命令行工具 OpenCLI 巧妙地解决了这个问题:
- 通过复用本地 Chrome 的登录状态,让 AI 能够像调用 API 一样在终端直接查热搜、发动态或抓取数据
- 2026 年 3 月 14 日,首次公开亮相(GitHub 仓库公开,社区开始传播)
- 2026 年 3 月 20 日,V2EX 官宣发布 v1.0.0 正式版
- GitHub opencli
open-cli 是由 Sindresorhus 开发的跨平台命令行工具,用于打开如 URL、文件、可执行程序等
- 将任意网站转化为 CLI 工具, 让 AI 接管浏览器、桌面软件
- 已在全球平台如 Bilibili、Twitter/X、Reddit、知乎、小红书,以及桌面应用如 Cursor、ChatGPT 和 Notion 上经过实战检验。
与 Puppeteer、Playwright 等传统浏览器自动化工具不同,OpenCLI 并不试图模拟用户操作 DOM,而是直接拦截和利用网站自身的 API 调用。这种”借力打力”的架构设计,让它能够绕过大多数网站的风控机制和反爬虫策略。
OpenCLI 采用独特的 Browser Bridge 架构:
- 一个轻量级的 Chrome 扩展 + 微守护进程。
用户只需在 Chrome 中安装扩展,无需任何令牌或手动配置,守护进程会在首次运行命令时自动启动。
这种设计的关键优势在于复用用户已有的登录会话——你不需要为每个网站单独配置 API 密钥或登录凭证。
安装OpenCLI
# 全局安装
npm install -g @jackwener/opencli
# 验证安装是否成功
opencli --version
配置浏览器桥接
- 下载OpenCLI的Chrome扩展并安装
- 点此下载,安装方法不明
- Chrome 插件地址 opencli Browser Bridge, 点击安装即可
- 运行 opencli doctor检查扩展程序与本地后台服务(Daemon)的连接状态
运行opencli setup,自动从Chrome浏览器中检测并配置 Playwright MCP Bridge扩展的token,完成浏览器连接性验证。
完成以上步骤后,即可在终端中使用opencli命令操作支持的网站或Electron应用
使用
opencli xiaohongshu feed # 获取小红书内容
opencli bilibili hot --limit 5 # 查看B站热门视频
opencli zhihu hot -f json # 查看知乎热榜并以JSON格式输出
# 下载小红书媒体
opencli xiaohongshu download abc123 --output ./media
# 导出知乎文章
opencli zhihu download "https://zhuanlan.zhihu.com/p/123"
# 监控 Twitter 趋势
opencli twitter trending -f json | jq
# Bilibili 视频下载
opencli bilibili download BV1xxx --quality 1080p
配置 claude code
接入 Claude Code 或其他智能体,可将 OpenCLI 作为“技能”添加。
只需在 Agent 系统提示词(如 .cursorrules)中加入:
"You have a tool called opencli. Run opencli list to see available commands to browse the web."
OpenCLI 安装非常直观,关键在于浏览器插件的桥接。一旦打通,终端就不再只是冷冰冰的控制台,而是通往整个 Web 世界的万能钥匙。
# Install all OpenCLI skills
npx skills add jackwener/opencli
# Or install specific skills
npx skills add jackwener/opencli --skill opencli-usage # Command reference
npx skills add jackwener/opencli --skill opencli-explorer # Adapter development guide
npx skills add jackwener/opencli --skill opencli-oneshot # Quick command reference
【2026-3-16】CLI Anything
香港大学数据科学实验室(HKUDS)团队出手了,开源了 CLI-Anything
- 让所有软件都能变成 Agent 原生工具的革命性项目
- 无需手动编码,告别脆弱的 GUI 自动化。支持 Claude Code、Cursor 等主流智能体框架
用 CLI 作为 AI Agent 和真实软件之间的桥梁,把人类设计的软件,直接转变成 Agent 能用的工具,而且不损失任何功能。
核心亮点
- ① 一键生成 CLI,7 阶段自动化全包
- ② 真实软件集成,零妥协
- ③ 告别脆弱的 UI 自动化
- ④ 结构化输出,Agent 直接消费
- ⑤ 生产级测试,1436 个测试 100% 通过率
claude code 安装
前置要求
- Claude Code(带插件支持)
- Python 3.10+
- 目标软件已安装(如 GIMP、Blender、LibreOffice 等)
安装
# 添加 marketplace
/plugin marketplace add HKUDS/CLI-Anything
# 安装插件
/plugin install cli-anything
#-------------
1 添加插件市场:一条命令将 CLI-Anything 插件市场添加到 Claude Code:/plugin marketplace add HKUDS/CLI-Anything
2 安装插件:在 Claude Code 会话中安装 cli-anything 插件:/plugin install cli-anything。无需任何额外配置。
3 指向目标软件:将插件指向任意软件代码库或仓库:/cli-anything ./gimp 或 /cli-anything https://github.com/blender/blender
4 使用新生成的 CLI:pip install -e . 将 CLI 安装到 PATH。智能体和人类都可以运行 cli-anything-gimp、cli-anything-blender 等,完整支持 --help 和 --json 参数。
使用
使用方法:
- 转化
- 使用
# 为 GIMP 生成完整 CLI(全部 7 阶段)
/cli-anything ./gimp
# 为 Blender 生成 CLI
/cli-anything ./blender
# 从 GitHub 仓库生成
/cli-anything https://github.com/blender/blender
# ----------------
# 安装到 PATH
cd gimp/agent-harness && pip install -e .
# 从任何地方使用
cli-anything-gimp --help
cli-anything-gimp project new --width 1920 --height 1080 -o poster.json
cli-anything-gimp --json layer add -n "Background" --type solid --color "#1a1a2e"
# 进入交互式 REPL
cli-anything-blender
支付宝打赏
微信打赏