Claude 使用笔记
资讯
- 【2026-3-31】Claude Code源码泄露,Anthropic 发布npm安装包时,把不该公开的 source map 发了,而且里面还带着可还原的源码内容,全能助手Kairos也被一并暴露。
- 第三方整理:claude-code 人气最旺,更完整的仓库 claude-code-source-code
- Claude Code想要做一个完整的agent系统,所有命令都只需要在终端里输入,Anthropic想取代的不只是桌面,更想彻底取代整个Windows。清晰地看到Anthropic是如何把brief、channel、cron、team、remote control、GitHub webhook、assistant mode接成一个完整的agent闭环。
- 但是,复制客户端源码,不等于复制 Anthropic。Anthropic真正的护城河,并不只在这个npm包里。模型能力、推理成本、云端基础设施、风控、企业分发、品牌信任、订阅体系、组织级权限和合规,这些都不是把一份源码fork下来就能复制的。
Claude Code
Claude Code 是 Anthropic 推出的Agent编码工具,支持在终端运行,理解代码库,并通过自然语言命令帮助用户更快的编写代码,功能和Cursor类似。
绝对不止是写代码,而是一款真正意义上的通用 Agent。很多电脑上的很繁琐的工作,都是 CC 一句话的事情。
- 做问答、写作、写网页、写软件,数据分析、甚至拆分工资条。
Claude Code 可直接在终端运行:自动收集并理解项目上下文,再按需遍历整个代码库,无须手动将文件加入上下文。
更令人惊喜的是,Claude Code在处理跨文件编辑方面的能力几乎无人能敌。
资料
框架
【2026-5-7】Agent 开发工具包
CLAUDE.md+技能(Skills) +Hooks+子智能体(SubAgents) +插件(Plugins)
完整的智能体开发与协作链路
CLAUDE.md(设定规则) → 技能(提供专业能力) → Hooks(保证质量与安全) → 子智能体(委托工作) → 插件分发(团队分发使用)
| 层级 | 名称 | 别称 | 核心作用 | 关键内容/特点 |
|---|---|---|---|---|
| 第一层 | CLAUDE.md |
记忆层 (Memory Layer) | 智能体的基础与核心准则 | 定义架构规则、命名规范、测试期望、仓库地图; 支持全局( ~/.claude/CLAUDE.md)和项目级(.claude/CLAUDE.md)配置,始终加载生效 |
| 第二层 | 技能 (SKILLS) |
知识层 (Knowledge Layer) | 提供专业能力与上下文 | 通过 SKILL.md 实现描述匹配、自动调用、任务相关上下文;包含参考文档、脚本文件、模板文件; 关键特点:技能在独立子智能体中运行上下文分支,按需调用、模块化上下文 |
| 第三层 | 钩子(HOOKS) |
护栏层 (Guardrail Layer) | 提供安全护栏与确定性规则 | 包含 PreToolUse/PostToolUse/SessionStart/Stop/SubagentStop 等事件;可实现写入检查、危险命令拦截、通知推送等; 为智能体提供非AI的确定性安全规则 |
| 第四层 | 子智能体 (SUBAGENTS) |
委托层 (Delegation Layer) | 实现任务委托与上下文隔离 | 支持代码审查员、测试执行者、探索者等角色; 独立上下文窗口、自定义工具与权限; 保持上下文干净整洁,无限递归但子智能体不能再生成子智能体 |
| 第五层 | 插件 (PLUGINS) |
分发层 (Distribution Layer) | 实现智能体能力的分发 | 包含 skills/、agents/、hooks/、commands/ 等目录;支持市场/团队安装; 像npm包一样分发智能体能力 |
| 外部集成 | MCP服务器 | - | 连接外部工具与服务 | 支持GitHub、数据库、API接口、自定义集成等外部工具 |
| 协作模式 | 智能体团队 | - | 实现多智能体协作 | 支持并行执行、消息传递、负责人编排、共享权限 |
安装
步骤
【2025-8-26】用神器Claude Code!打造贴身AI秘书团
视频演示
国内安装
官方 CC 丧心病狂,封号严重, 国内对 CC 模型支持好的有三个:GLM 4.7,MiniMax M2.1,Kimi K2。
【2025-8-30】Claude Code 接入本地/第三方模型的两条路
目标:
- 纯命令行下,让 Claude Code 不再直连官方,而是走更便宜或本地化的模型(如 LM Studio / Ollama / vLLM / Kimi 等)
Claude Code 支持「LLM Gateway」模式 + 自定义 base_url。
关键环境变量(记住这三个就够)
- ANTHROPIC_BASE_URL:网关或服务的根地址(必须能接收 /v1/messages)。
- ANTHROPIC_AUTH_TOKEN:发给该地址的鉴权令牌(Bearer)。
- ANTHROPIC_MODEL:给 Claude Code 用的“外部模型名”(由网关/服务定义的名字)。
Claude Code 理论上能接到任何把自己“伪装成 Anthropic Messages”的端点(原生支持,或经网关转译支持
Claude Code 启动时:
- 把请求发到官方 Anthropic API;
- 第一时间检查是否登录 / 有 Pro / 有官方 API Key;
- 没付费就到此为止。
绕开的方法:
- 把“去向”改成自己的地址。设置上面的 3 个变量,别再找官方,而是找指定的网关/服务。
两种落地方式
- ✅ 方式 A:直连“原生兼容 Anthropic /v1/messages”的第三方/网关
- ✅ 方式 B:中转不兼容的后端 →
LiteLLM做“协议翻译”(Anthropic ⇄ OpenAI)- 用 LiteLLM 代理把“Anthropic 请求”翻译成“OpenAI 请求”,再转给后端
Mac 安装
# MacOS(Homebrew):
brew install --cask claude-code
# MacOS、Linux、WSL:
curl -fsSL https://claude.ai/install.sh | bash
# npm 安装
# 【2025-12-29】报错
# npm ERR! code UNABLE_TO_GET_ISSUER_CERT_LOCALLY
# npm ERR! unable to get local issuer certificate
# 解决:临时忽略 SSL 验证,通过关闭 SSL 验证来解决此问题,但请注意这可能会降低安全性。
npm config set strict-ssl false
# 安装完成后,建议恢复为 true:
npm config set strict-ssl true
# 设置代理
npm config set proxy http://127.0.0.1:2080
npm config set https-proxy http://127.0.0.1:2080
# 安装
npm install -g @anthropic-ai/claude-code
# 验证是否安装成功:
claude-code --version # 2.0.76 (Claude Code)
claude-code --help
设置 ANTHROPIC_API_KEY
需要设置 Anthropic API 密钥作为环境变量:
方法 A:临时设置(当前会话有效)
export ANTHROPIC_API_KEY=”your-api-key-here”
方法 B:永久设置(添加到 shell 配置文件)
打开终端并确定使用的 shell:echo $SHELL
根据 shell 类型编辑相应的配置文件:
- 对于 bash:
~/.bash_profile或~/.bashrc - 对于 zsh:
~/.zshrc
在配置文件末尾添加以下行:export ANTHROPIC_API_KEY=”your-api-key-here”
重新加载配置文件:source ~/.zshrc # 或 source ~/.bash_profile
方法 C:使用配置文件
- 创建配置文件
~/.anthropic/config.json:
{
"api_key": "your-api-key-here"
}
- 可选环境变量
- ANTHROPIC_API_BASE:自定义 API 端点(如果需要)
- CLAUDE_CODE_MODEL:指定默认使用的模型(如:claude-3-5-sonnet-20241022)
国内使用
如何在国内合法、安全地使用上 Claude Code?
npm install -g https://gaccode.com/claudecode/install --registry=https://registry.npmmirror.com
报错
npm error code UNABLE_TO_GET_ISSUER_CERT_LOCALLY
npm error errno UNABLE_TO_GET_ISSUER_CERT_LOCALLY
启动 claude,报错:
Failed to connect to api.anthropic.com: UNABLE_TO_GET_ISSUER_CERT_LOCALLY
【2025-12-29】实践有效,解法:
- 在 ~/.claude.json 中添加:
"hasCompletedOnboarding": true,
本地大模型服务
CC Switch 和 Cherry Studio
- CC Switch 下载地址
# 1. 添加 tap
brew tap farion1231/ccswitch
# 2. 安装应用
brew install --cask cc-switch
Cherry Studio
- 下载 download
使用命令
基本命令
基本使用命令
# 1. 初始化配置
claude-code init
# 2. 交互式对话
claude-code chat
# 3. 代码分析
claude-code analyze [文件或目录路径]
# 4. 文件操作
# 读取文件
claude-code read [文件路径]
# 编辑文件
claude-code edit [文件路径]
# 5. 项目分析
# 分析整个项目
claude-code project [项目目录]
# 搜索代码
claude-code search "搜索模式" [目录]
# 6. 获取帮助
# 查看所有命令
claude-code --help
# 查看特定命令帮助
claude-code [命令] --help
常用命令
【2026-4-16】小红书: Claude Code 20 个常用命令速查表
| 命令 | 功能说明 |
|---|---|
| /init | 初始化项目,生成 CLAUDE.md 记忆文件 |
| /plan | 进入计划模式,先设计方案再编码 |
| /context | 可视化展示上下文窗口使用情况 |
| /compact | 压缩对话历史,释放 Token 空间 |
| /clear | 清空对话,保留项目上下文重新开始 |
| /rewind | 回退对话,撤销最近操作(快捷键 Esc+Esc) |
| /resume | 恢复之前命名会话,继续工作 |
| /branch | 创建对话分支,并行尝试不同方案 |
| /model | 切换 AI 模型(sonnet/opus/haiku) |
| /skills | 列出并管理已安装的 Skills 技能插件 |
| /fast | 开启快速模式,返回轻量化响应 |
| /btw | 不中断当前流程补充上下文 |
| /cost | 查看当前会话 Token 用量与费用 |
| /review | 对未提交的 git diff 进行代码审查 |
| /commit | 自动生成提交信息并创建 Git commit |
| /simplify | 代码重构与优化 |
| /agents | 部署专业 Agent 处理专项任务 |
| /loop | 定时循环执行任务(如 /loop 5m check status) |
| /memory | 查看、编辑 MEMORY.md 持久化记忆 |
| /doctor | 运行诊断,检查配置与环境健康状态 |
常用快捷键
| 快捷键 | 功能 |
|---|---|
| Shift+Tab | 切换权限模式 |
| Esc+Esc | 撤销操作 |
| Ctrl+D | 退出会话 |
原理
【2026-4-14】VILA Lab 发表 Claude Code 论文, Claude Code 核心是反复调用模型、执行工具、再根据结果继续往下走。
- 论文 Dive into Claude Code
- 真正重要的是外面的系统设计: 权限控制、审批模式、上下文压缩、插件和 skill 扩展面、subagent 的委派、会话持久化。
- 分析结论:今天决定agent 产品成败的,是“怎么在真实世界里动手”,而非“会不会想”,
出发点
- 人始终保留决策权,
- 系统要守住安全和隐私,
- 执行要稳定,
- 人的能力得要真的放大,
- 还得慢慢适应不同用户的项目环境和信任关系。
框架
- 收集上下文——理解错误指向什么、代码库的哪部分受影响、哪些文件相关。
- 制定计划——决定如何解决问题,比如修改代码并运行测试验证修复。
- 执行操作——实际实施方案,通过更新文件和运行命令。
关键点: 第一步和最后一步都要求助手与外部世界交互——读取文件、获取文档、运行命令或编辑代码

Claude 系列模型(Opus、Sonnet、Haiku)在理解工具作用并高效使用工具来完成复杂任务方面尤其强。
强工具使用的好处
- 解决更难的任务——Claude 能组合不同工具处理复杂工作,并能使用它未见过的工具。
- 可扩展的平台——你可以轻松为 Claude Code 添加新工具,Claude 会随你的工作流演进而适应使用。
- 更好的安全性——Claude Code 能在无需索引的情况下导航代码库,通常意味着不必把整个代码库发送到外部服务器。
使用
【2025-12-25】Claude Code 实战
- 第一部分介绍什么是Claude Code;
- 用 Claude Code 执行软件开发任务,涵盖 AI 编码助手的底层架构、实用落地技巧,以及高级集成策略
- 第二部分主要介绍了如何上手去操作;
- 第三部分介绍了进阶操作:Hooks And SDK。
什么是 Claude Code
内容
- 理解编码助手架构:了解 AI 助手如何通过工具集成与代码库交互,以及支撑代码分析与修改的技术基础。
- 探索 Claude Code 的工具系统:学习如何组合使用多种工具,处理各类开发场景中的复杂、多步骤编程任务。
- 掌握上下文管理技巧:学习在对话中保持相关上下文,并有效引用项目资源以获得最佳 AI 协助。
- 实现可视化沟通工作流:理解如何使用视觉输入沟通界面改动,并在复杂代码库修改中利用高级规划功能。
- 创建自定义自动化:探索如何构建可复用的自定义命令与自动化,简化重复性开发任务。
- 用 MCP 服务器扩展能力:学习集成外部工具与服务,实现如浏览器自动化与专用开发工作流等增强能力。
- 集成 GitHub 工作流:理解如何搭建自动化代码审查流程,将 AI 协助融入现有版本控制工作流。
- 应用思考与规划模式:学习在不同复杂度的编程挑战中何时、如何使用不同的推理方式。
经验
【2026-5-3】小红书帖子 Claude Code 7个常见低效错误整理表
| 序号 | 错误类型 | 错误详情 | 优化修复方案 |
|---|---|---|---|
| 1 | 单长会话处理全部任务 | 实现功能、修bug、写测试、评审PR共用一个对话,上下文占用过高时模型记忆力下降、输出敷衍 | 任务间隙输入 /clear 清空上下文 |
| 2 | Prompt描述模糊笼统 | 指令简略不清晰,大幅拉长排查耗时,无效沟通浪费时间(5 分钟的任务变成 45 分钟) | 明确故障问题(什么坏了)、位置在哪里)、验收标准(怎么算修好),确保AI无需追问即可一次性完成 |
| 3 | 缺少代码反馈循环 | 仅让AI编写代码,不校验运行结果,等同于盲写代码,代码质量偏低 Claude Code 创始人 Boris Cherny 强调: 让 Claude 写代码却不给验证手段 = 蒙眼编程。加上反馈循环后质量提升 2-3 倍。 |
Prompt追加「跑测试并修复所有失败项」,规范写入 CLAUDE.md 统一管理 |
| 4 | 未使用CLAUDE.md配置文件 |
每次新建会话重复声明语言、组件规范、格式化规则,重复冗余 | 项目根目录新建CLAUDE.md, 启动时自动读取,统一记录技术栈、编码规范、测试指令,全局永久生效 |
| 5 | 直接在主分支修改代码 | 默认当前分支操作,出错后要回滚提交,风险高、流程繁琐 | 使用 claude -w branch-name,通过Worktree隔离分支开发. Worktree 让 Claude 在隔离副本上工作,满意再合并,出问题直接删。 |
| 6 | 无脑同意所有权限申请 | 操作低效且存在安全隐患,未经审核直接授权,满且危险 | 使用--permission-mode auto自动安全审核,或配置 allowedTools 精细化管控权限 |
| 7 | 未开启并行会话 | 单任务串行处理,大型项目效率极低,进度缓慢 | 使用 claude -w branch-name --background,多独立会话并行处理任务,3-4 个独立任务并行 = 轻松 3 倍加速 |
从哪开始?先修 #1(/clear)和 #3(反馈循环),光这两个就能立刻产生明显差异。
01|该 /clear 不 clear 一会话从早到晚没清,第 50 轮你打 30 token,模型读十几万。换任务立刻 /clear。
02|装一堆没用的 MCP 360 tool 的 MCP 说一句 Hi,上下文先剩 84%。MCP 按项目装,别全 global。
03|全局塞用不到的 skill 装 30 个常用就 3 个,剩下 27 个每会话收税。装 global 前问「每周用上吗」。
04|CLAUDE.md 写太长 800 字 × 一天 50 轮 = 朗读 50 遍。短规则清单一行一条,展开放 skill。
05|让它「自己找」文件 Glob+Grep+Read 搜十几次几千 token 没了。直接 @path,省两块钱。
06|大任务不用 subagent 20 文件全进主上下文,每轮跟着算钱。让 subagent 子会话读,只带总结回。
07|用 cat 读大文件 3000 行日志 cat 全进上下文。Read 加 offset/limit,先 grep 定位。
08|改错了不回退 错版本留上下文,修正叠修正思路绕 3 圈。git checkout 回干净版本重来。
09|不用 plan mode 直接干 写到一半改方向整段重组,第一遍全打水漂。先 plan 再 exit,3 分钟省 70%。
10|重复贴代码报错 改完整段又贴一遍,5KB stderr 全塞。让它 Read 当前版本,只贴关键 traceback。 ——
高级功能
【2025-12-5】Claude Code 发布的一些高级功能
- 思考模式 (Thinking Mode)
- 计划模式 (Plan Mode)
- 自定义斜杠命令
- 钩子系统 (Hooks)
- 自定义代理 (Agents)
- 插件系统 (Plugins)
- MCP 服务器
- 对话管理
- 后台命令与沙盒模式
- 权限管理
- Explore 子代理
- 最佳实践总结
思考模式
| 关键词 | 深度 | 适用场景 |
|---|---|---|
| think | 标准 | 一般复杂问题 |
| think harder | 深度 | 架构设计、复杂算法 |
| ultrathink | 极深 | 系统级设计、疑难问题 |
实践
- 复杂问题才用深度思考:简单任务用 ultrathink 是浪费
- 结合具体问题描述:think about X 比单独 think 效果更好
- 观察思考过程:通过思考输出理解 Claude 的推理逻辑
计划模式
计划模式将任务分为”计划”和”执行”两个阶段,Claude 先制定详细计划,获得你的批准后再执行。适合大型重构、新功能开发等场景。
自定义斜杠
在 .claude/commands/ 目录创建 Markdown 文件,自动成为可用的斜杠命令,方便复用常用提示词。
钩子系统 (Hooks)
钩子允许在 Claude Code 特定事件发生时自动执行 shell 命令,实现自动化工作流。
自定义代理 (Agents)
自定义代理是具有专门能力和工具限制的 Claude 实例,适合将复杂任务委托给专门的”专家”。
插件系统 (Plugins)
插件系统允许从市场安装或自己创建扩展,包括命令、代理、钩子和 MCP 服务器。
MCP 服务器
MCP (Model Context Protocol) 允许 Claude 连接外部服务,如数据库、API、文件系统等,扩展其能力边界。
对话管理
Claude Code 提供完整的对话管理功能,支持恢复、回退、导出和搜索历史对话。
后台命令与沙盒模式
- 后台命令 (Ctrl+B):将长时间运行的命令放到后台执行,Claude 可以继续其他工作。
- 沙盒模式:限制 Bash 工具的系统访问权限,防止意外的破坏性操作。
权限管理
精细控制 Claude 可以使用的工具和操作,平衡效率与安全。
Explore 子代理
Explore 是专门用于代码库探索的子代理,由 Haiku 驱动,高效且节省上下文。
插件
Ruflo
【2026-5-9】Ruflo(原Claude Flow)这一Claude Code的增强工具
架构:
- 基于Rust的AI引擎驱动,支持跨机器、团队和信任边界的分布式架构
- 从单智能体升级为多智能体并发集群系统
- 内置100+预设专家角色,形成”蜂群”协作网络
设计思路:
- 解决Claude Code单兵作战、记性差、无法跨界协作的痛点
- 将”并发”视为核心生产力,实现多任务并行处理
- 强调智能体间的自主感知、架构规划与智能统筹
核心功能:
- 多智能体智能编排与分工协同
- 实时执行状态与成本追踪
- 跨会话记忆学习,越用越聪明
- 丰富插件生态:AgentDB(向量搜索)、Aldefence(安全防护)、Autopilot(自动任务)、Browser(浏览器自动化)等
使用方法:
- 通过命令
/plugin marketplace add ruvnet/ruflo添加插件 - 使用
/reload-plugins激活变更 - 通过
/ruflo-系列命令管理不同功能模块 - 可视化工作流模板支持快速部署智能体集群
Claude Code 复现
OpenCode
【2025-11-4】终端里的 AI 编程助手:OpenCode 使用指南
OpenCode 是一个开源 AI 编码工具,专为终端环境设计。装好后在命令行里直接和 AI 对话,让它帮你写代码、找 Bug、做重构。
主要特点:
- 原生终端界面,响应快,支持自定义主题
- 支持 Claude、GPT-4、Gemini 等多个 AI 模型
- 自动扫描项目文件,理解代码结构
- MIT 开源协议,GitHub 获 3 万+ 星标
OpenCode 有几个设计亮点:
- Client/Server 分离,支持远程控制
- SQLite 管理会话,持久化对话历史
- 插件化设计,方便扩展功能
- 统一接口适配多个 AI 提供商
使用注意事项
- 需要支持 TUI 的现代终端,推荐 WezTerm、Alacritty、Kitty
- 使用第三方 AI 模型需付费,Claude Pro 订阅相对划算
- AI 生成代码建议审查后再提交,特别是安全相关部分
两种工作模式
- Plan 模式(规划):只分析不修改,适合代码审查、性能分析:
- 示例:/plan 分析项目的性能瓶颈
- Build 模式(构建):实际修改代码,适合重构、添加功能:
- 示例:/build 把 API 请求改用 axios 拦截器统一处理
安装
# 配置代理
export http_proxy=127.0.0.1:2080
export https_proxy=127.0.0.1:2080
# 安装opencode
curl -fsSL https://opencode.ai/install | bash # bash
npm install -g opencode-ai # npm 安装
brew install sst/tap/opencode # Homebrew 安装(macOS/Linux)
配置模型
运行配置命令
- 按提示选择 AI 提供商(Anthropic、OpenAI、Google 等),输入对应的 API Key。
- 推荐使用 Claude 3.5 Sonnet,代码能力较强。
opencode auth login
常用功能
- 切换模型:/models , 在不同 AI 模型间切换,比如用 Claude 写代码,用 GPT-4 做审查。
- 撤销修改:/undo,AI 改错了可以一键回滚。
- 分享会话:/share,生成公开链接,把对话记录分享给同事。
- 更换主题:/themes 或按 Ctrl+X 再按 T 切换终端主题。
初始化项目
进入项目目录:
cd your-project
opencode
在界面中输入初始化命令:
/init
OpenCode 会扫描项目,生成 AGENTS.md 文件记录项目信息,后续对话基于这个上下文进行。
使用方法
- 理解代码:这个 useAuth.ts 文件的作用是什么
- 修复问题:修复 api/users.ts 的类型错误
- 添加功能:给 Express 项目加用户注册接口,需要邮箱验证和密码加密
Gemini CLI
【2026-4-16】Gemini CLI 安装和使用教程
2025年6月,Google 面向开发者发布开源命令agent工具 Gemini CLI,默认支持每分钟最多 60 次请求、每天最多 1000 次请求,旨在加速开发者的工作流程。无论是辅助编码、进行研究、生成内容,还是自动化日常任务,Gemini CLI 都将成为开发者的多功能利器。
功能包括:
- 使用自然语言与 AI 互动
- 支持代码生成、审查与执行辅助
- 可与 Google 搜索与系统命令联动
- 拥有超大上下文窗口(最多 100 万 Token)
安装
# 临时安装
npx https://github.com/google-gemini/gemini-cli
# 全局安装
npm install -g @google/gemini-cli
# 检查是否安装成功
gemini --version
gemini

配置文件
- 全局设置:~/.gemini/settings.json
- 项目设置:(项目根目录)/.gemini/settings.json
主要配置项:
- theme:CLI 主题名称,如 “GitHub”。
- contextFileName:指定上下文文件名,默认为 GEMINI.md,可设为数组如
["GEMINI.md", "PROMPT.md"]。 - fileFiltering:
- respectGitIgnore:是否遵循 .gitignore,默认 true。
- enableRecursiveFileSearch:是否递归搜索文件以补全 @,默认 true。
- autoAccept:自动跳过安全工具的执行确认,默认 false。
- sandbox:启用沙盒(true 或 “docker”),默认 false。
- checkpointing:
- enabled:启用 /restore,默认 false。
- preferredEditor:指定差分显示编辑器,默认 “vscode”。
- coreTools / excludeTools:指定或排除内置工具。
- mcpServers:定义提供自定义工具的 MCP 服务器。
# 非交互模式
gemini --prompt "列出 1 到 10 的质数"
echo "怎么样才能躺平?" | gemini
# 交互模式
gemini
请用Node.js写一个简单的接口api
主要命令
- quit/exit
- clear
- auth 认证
- editor 差分显示编辑器
- chat save/resume/list
- memory show/refresh/add
- tools desc
- mcp
- restore $tool_id
- compress 总结对话历史,节省token
- stats token使用信息
- theme
- bug 生成bug报告
- about 显示版本信息用于bug报告
特殊前缀
! # 单独使用,模式切换(shell+cmd)
!ls # 直接执行 shell 命令并显示结果。
@<文件路径> 或 @<目录路径> # 读取指定文件或目录内容作为上下文,遵循 .gitignore 规则
原理
用户输入的内容不会直接发送给模型,Gemini CLI 会附加多种信息,构建更智能、上下文相关的最终提示,包括:
- 系统指令:定义 AI 基本行为,包含 GEMINI.md 内容。
- 全局上下文:~/.gemini/GEMINI.md
- 项目上下文:项目根目录或父目录的 GEMINI.md
- 本地上下文:当前目录子目录的 GEMINI.md
- 工具定义:包含 read_file、run_shell_command 及 Google 搜索工具的功能说明。
- 对话历史:包含用户与 AI 的历史交互。
- 用户最新提示:包含用户输入及 @ 命令展开的文件内容。
Skills
【2025-12-16】Claude Skills成为复杂工作流的最优解
详见站内专题:Skills 技术专题
工具
网页操作
【2026-3-15】阿里 Page-Agent
【2026-3-15】阿里开源 Page-Agent:一行代码让AI“住进”网页,自动帮你操作一切
- GitHub 仓库:page-agent
- 官方文档:page-agent
Page-Agent 纯前端AI智能体框架,被称为“网页自动化终极解决方案”。
平时用电脑,很多操作都是重复劳动:填表单、点按钮、查信息、导数据、刷页面……
- 传统的自动化工具:要么复杂难用,要么页面一变就失效
而 Page-Agent 直接解决了这个痛点。
- The GUI Agent Living in Your Webpage——住在你网页里的AI操作员。
核心亮点:
- 纯浏览器运行,不用后端、不用部署
- 一行JS代码就能接入,不用搭服务器,不用装复杂环境,打开浏览器就能用,个人电脑、办公电脑都能跑。
- 自然语言操控,说人话就能让AI干活。不用写脚本,不用设置规则,直接告诉它,自动理解页面结构,精准找到按钮、输入框、列表,比手动操作还快。
- ◦ “帮我填写这个报名表单,信息用我预设的”
- ◦ “找到最近30天的订单,导出成Excel”
- ◦ “点击所有未读消息,然后退出登录”
- 页面变了也能用,智能识别元素
- 传统自动化工具,网站更新一下样式、改个位置,直接报废。Page-Agent基于DOM智能理解,不看图片、不看样式,只看功能逻辑,稳定性大幅提升。
- 实测下来,覆盖90%以上的网页重复操作:
- • 职场人:自动填报销、报业绩、导报表;
- • 电商人:自动查价、核对库存、处理留言;
- • 学生党:自动查成绩、填问卷、查资料;
- • 开发者:自动化测试、页面巡检,节省大量时间。
阿里官方表示,Page-Agent支持接入国内外主流大模型,有操作黑白名单、数据脱敏等安全机制,企业级使用也完全合规。目前更新频率极高,功能还在持续增强。
支付宝打赏
微信打赏