Skill 应用
Skill 原理
Skill 介绍
目前,skill 都以 markdown 格式存在
pdf-to-markdown/
├── SKILL.md # Skill说明文档(含元数据、使用指南、核心指令)
├── scripts/ # 自动化脚本(含各类可执行脚本)
│ └── convert.py # 转换pdf为md的自动化脚本
└── evals/ # 测试工具集
└── evals.json # 3个典型的测试用例
详见站内专题:Skill 技术专题
HTML
2026年5月10日,Claude Code 工程师塔里克·希希帕尔(Thariq Shihipar)发文,标题 《在 Claude Code 工作流中,HTML 为何“不讲道理地好用”》。
理由:
HTML 可以承载 Markdown 完全做不到的 8 种内容:表格、CSS、SVG、代码高亮、JS 交互、工作流程图、空间画布数据、真实图像,而且这一切,打开浏览器立刻能用 🔥
生产场景用例:
- ✅ 规格与规划文档
- ✅ AI 代码审查
- ✅ 设计与原型验证
- ✅ 研究与报告
- ✅ 定制化的一次性编辑界面
🧐为什么偏偏是 Claude Code,而不是 Claude 聊天界面或者 Claude 设计工具?
- 因为 Claude Code 有完整的上下文堆栈:文件系统访问权限、MCP 服务器、Chrome 浏览器内的 Claude,加上 Git 历史记录。
- 这些能力凑在一起,才让“输出 HTML”这件事变得值钱——它不仅仅是好看,而是真正可运行、可交互、可继续被 AI 修改的功能块。
⚠️但关键瓶颈依然现实:Token 成本。
- HTML 比 Markdown 啰嗦得多,相同内容量可能要烧掉 2-4 倍的 Token。一旦上下文窗口紧张,这个开销会非常致命。
- 所以问题:HTML 能否真正取代 Markdown 成为 AI 编码代理的默认格式?还是说它只会是特定高价值场景的“奢侈选择”?
信息获取
去网上找点东西,就抓瞎了:
- 📺 “帮我看看这个 YouTube 教程讲了什么” → 看不了,拿不到字幕
- 🐦 “帮我搜一下推特上大家怎么评价这个产品” → 搜不了,Twitter API 要付费
- 📖 “去 Reddit 上看看有没有人遇到过同样的 bug” → 403 被封,服务器 IP 被拒
- 📕 “帮我看看小红书上这个品的口碑” → 打不开,必须登录才能看
- 📺 “B站上有个技术视频,帮我总结一下” → 连不上,海外/服务器 IP 被屏蔽
- 🔍 “帮我在网上搜一下最新的 LLM 框架对比” → 没有好用的搜索,要么付费要么质量差
- 🌐 “帮我看看这个网页写了啥” → 抓回来一堆 HTML 标签,根本没法读
- 📦 “这个 GitHub 仓库是干嘛的?Issue 里说了什么?” → 能用,但认证配置很麻烦
- 📡 “帮我订阅这几个 RSS 源,有更新告诉我” → 要自己装库写代码
每个平台都有自己的门槛——要付费的 API、要绕过的封锁、要登录的账号、要清洗的数据。你要一个一个去踩坑、装工具、调配置,光是让 Agent 能读个推特就得折腾半天。
总结
- Agent-reach 各社媒平台数据获取
- opencli 浏览器自动化
- bb-browser 浏览器 API: 坏孩子浏览器 BadBoy Browser, 不需要密钥,不需要爬虫,不需要模拟
信息抓取
MediaCrawler
MediaCrawler - 自媒体平台爬虫 🕷️
- GitHub MediaCrawler
小红书、抖音视频、快手视频、B 站视频、微博帖子、百度贴吧帖子、知乎问答文章
# 依赖 playwright
uv run playwright install
# 运行
# 项目默认未开启评论爬取,如需评论请在 config/base_config.py 中修改 ENABLE_GET_COMMENTS
# 其他功能开关也可在 config/base_config.py 查看,均有中文注释
# 从配置中读取关键词搜索并爬取帖子与评论
uv run main.py --platform xhs --lt qrcode --type search
# 从配置中读取指定帖子ID列表并爬取帖子与评论
uv run main.py --platform xhs --lt qrcode --type detail
# 使用 SQLite 数据库存储数据(推荐个人用户使用)
uv run main.py --platform xhs --lt qrcode --type search --save_data_option sqlite
# 使用 MySQL 数据库存储数据
uv run main.py --platform xhs --lt qrcode --type search --save_data_option db
# 其他平台示例
uv run main.py --help
Agent-Reach
- 所有工具开源、所有 API 免费
- Cookie 只存在你本地,不上传不外传。代码完全开源
- 底层工具(yt-dlp、twitter-cli、rdt-cli、Jina Reader 等)定期追踪更新到最新版
安装
# 安装
帮我安装 Agent Reach:https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/install.md
# 更新
帮我更新 Agent Reach:https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/update.md
【2026-5-11】AnySearch
【2026-5-11】谷歌搜不到的80%互联网,AnySearch全打通了!开发者连夜接入
5月11日,AnySearch 产品海外正式上线。
- GitHub:anysearch-ai
- 也可在ClawHub、SkillHub、Glama、skills.sh等插件商店直接获取
定位:AI时代的「搜索基础设施」,专为AI Agent打造统一的高质量搜索入口。
AnySearch 通过大模型获取 Reddit 论坛、代码仓库、股票市场等多种信息
安装
- 官网 AnySearch,点击 Install/安装,复制安装教程直接输入Agent,部署完成。
Install the AnySearch SKILL according to
https://anysearch.com/install/skill-install.md
评测
- AnySearch 与 Brave、Perplexity 做了对比,显然 AnySearch输出的结果更丰富。
- 基准测试中,AnySearch在准确性和响应延迟两个维度,均优于同类AI搜索产品Parallel和Brave。
- 与同类Brave Search测试对比,结果显示,AnySearch数据更完整、分析更深入、回答更全面
公众号文章抓取
浏览器操控
bb-browser
bb-browser 浏览器 API: 坏孩子浏览器 BadBoy Browser
- 不需要密钥,不需要爬虫,不需要模拟
已经登录了微博、知乎、B站、小红书、Twitter、GitHub、LinkedIn — bb-browser 让 AI Agent 直接用你的登录态
# 安装
npm install -g bb-browser
# 使用
bb-browser site update # 拉取社区适配器
bb-browser site recommend # 看看哪些和你的浏览习惯匹配
bb-browser site zhihu/hot # 开搞
bb-browser site twitter/search "AI agent" # 搜索推文
bb-browser site zhihu/hot # 知乎热榜
bb-browser site arxiv/search "transformer" # 搜论文
bb-browser site eastmoney/stock "茅台" # 实时股票行情
bb-browser site boss/search "AI 工程师" # 搜职位
bb-browser site wikipedia/summary "Python" # 维基百科摘要
bb-browser site youtube/transcript VIDEO_ID # YouTube 字幕全文
bb-browser site stackoverflow/search "async" # 搜 StackOverflow
OpenCLI
使用
npm install -g @jackwener/opencli
opencli bilibili hot --limit 5
opencli twitter trending
垂类知识
金融
【2026-5-10】Claude 的金融 Skills 开源
Anthropic 把华尔街分析师每天干的活,拆成了一套 Claude 可以直接装的插件包
- 替分析师起草工作底稿(模型、备忘录、研报、对账单)的,不做投资决策、不执行交易、不绑定风险、不批准开户,每一份产出都摆在那儿等人类签字
- 边界划得很干净,金融行业最敏感的就是责任,能跑活但不背锅,反而是 To B 落地最现实的姿势
Anthropic 官方仓库 claude-for-financial-services,把投行、股票研究、私募股权、财富管理这四条华尔街最贵的赛道全端了出来
- 仓库地址:financial-services
- Apache 2.0,全部 Markdown + YAML,没有 build step,fork 下来就能改
安装方法
# 1. 添加 marketplace
claude plugin marketplace add anthropics/claude-for-financial-services
# 2. 先装核心包(带所有数据连接器)
claude plugin install financial-analysis@claude-for-financial-services
# 3. 按需挑 Agent
claude plugin install pitch-agent@claude-for-financial-services
claude plugin install gl-reconciler@claude-for-financial-services
claude plugin install market-researcher@claude-for-financial-services
# 4. 按需挑垂直行业包
claude plugin install investment-banking@claude-for-financial-services
claude plugin install equity-research@claude-for-financial-services
两层:
- Agents(11 个):端到端的工作流智能体,比如 Pitch Agent、Earnings Reviewer、GL Reconciler,每个都是自包含插件,装上就能跑一整条流水线
- Vertical Plugins(7 个垂直行业包 + 2 个合作伙伴包):底层的 Skill、斜杠命令、数据连接器,按金融子行业打包,你不想要完整 Agent,只装这些底层能力也行
而且所有东西两种部署方式同源——既能在 Claude Cowork 里当插件用,也能通过 Claude Managed Agents API(/v1/agents)丢到自家工作流引擎后面跑无头模式,同一个 system prompt、同一组 skill,你选在哪儿落地
| 业务方向 | Agent | 干什么活 |
|---|---|---|
| 客户与咨询 | Pitch Agent | 可比公司 + 先例交易 + LBO → 出一份带品牌的 pitch deck |
| Meeting Prep Agent | 客户会议前自动出一份 briefing pack | |
| 研究与建模 | Market Researcher | 给一个赛道/主题 → 行业概览 + 竞争格局 + peer comps + 标的清单 |
| Earnings Reviewer | 财报电话会 + 公告 → 更新模型 → 起草研报 | |
| Model Builder | DCF、LBO、三表模型、可比公司分析,直接在Excel里跑 | |
| 基金运营 | Valuation Reviewer | 接收GP报送包 → 跑估值模板 → 准备LP报告 |
| GL Reconciler | 找总账break、追根溯源、走签字流程 | |
| Month-End Closer | 月末结账:计提、滚存、差异说明 | |
| Statement Auditor | LP报表分发前的审计 | |
| 运营与开户 | KYC Screener | 解析开户文档 + 跑规则引擎 + 标记缺口 |
每个 Agent 都是独立打包的,bundle 了它要用的全部 skill,装一个就够,不用先装一堆依赖
11 个 MCP 连接器
- MCP 访问可能需要数据商的订阅或 API Key
| 数据源 | 内容 |
|---|---|
| Daloopa | 标准化财务数据 |
| Morningstar | 基金研究 |
| S&P Global | 标普全球 + Capital IQ |
| FactSet | 万得海外版 |
| Moody’s | 评级与信用数据 |
| MT Newswires | 即时新闻 |
| Aiera | 财报会议转写 |
| LSEG | 伦交所/路孚特 |
| PitchBook | 一级市场数据 |
| Chronograph | PE 投后监控 |
| Egnyte | 文档存储 |
书籍转skill
将技术书籍(PDF/EPUB)转化为 Claude Code 可加载的结构化 skill,让书中框架和知识点在工作时按需调用
book-to-skill
【2026-5-6】book-to-skill 是 Claude Code skill,把技术书籍的 PDF 或 EPUB 自动提取并生成结构化 skill 文件,包括按章节加载的摘要、术语表、设计模式速查表。
- GitHub book-to-skill
用法
/book-to-skill your-book.pdf
# PDF — derive skill name from filename
/book-to-skill ~/Downloads/designing-data-intensive-applications.pdf
# EPUB — specify a custom slug
/book-to-skill ~/books/clean-code.epub clean-code
# Full path with explicit name
/book-to-skill /tmp/ddd-evans.pdf domain-driven-design
网页设计
Anthropic 发布 Claude Design,设计师圈子里刷屏了。
- 专门给设计师用的 AI 工具,把设计思维和 AI 代码生成直接捏在一起,演示视频里随便聊几句就能出一个像样的设计稿,「这就是设计的未来」。
但闭源,只能通过官方 Claude 账号使用,而且额度少的可怜,用上原生 Claude design 对大多数人非常困难。
GitHub 上 开源项目
- Open Design 项目(作者:@Tom Huang)完全开源,Apache 2.0 协议,可自己部署,接自己的 API Key,可以改代码,可以二次开发。
- 其他
Open Design
Open Design 项目(作者:@Tom Huang)完全开源,Apache 2.0 协议,可自己部署,接自己的 API Key,可以改代码,可以二次开发。
覆盖网页设计的方方面面
- 31个技能
- 各种格式的设计原型
ppt 制作
ppt制作技能
GitHub 上和 PPT 相关的 Skill 项目。
结论:
- 做 PPT 这件事,已经不只是“让 AI 帮你写几页内容”了,而是分成了好几条路线。
路线
(1)如果做漂亮网页 PPT,优先看:
- guizang-ppt-skill:电子杂志感很强,适合发布会、分享、视觉化报告。
- next-slide:产品化程度高,零依赖 HTML,中文场景友好。
- html-ppt-skill:更像模板工厂,适合研究通用 HTML PPT 生成。
- revealjs-ppt-skill:标准 reveal.js 路线,适合技术分享、课程、文档型演示。
(2)如果你最终要的是可编辑 PPTX,可以重点看:
- anthropics/skills/pptx:官方基线型 PPTX skill。
- MiniMax-AI/pptx-generator:PptxGenJS 路线,生成、读取、编辑都比较工程化。
- powerpoint-skill:适合研究 HTML 到 PPTX 的高保真转换。
- mcp-server-ppt:更偏 Windows + Office 自动化场景。
(3)想做“高级感网页 PPT”,先看
- next-slide + guizang-ppt-skill + html-ppt-skill。
(4)想做“真正可编辑的 PPTX”,先看:
- anthropics/pptx + MiniMax pptx-generator。
(5)想把 PDF、图片、论文转成演示,可以看:
- glmv-pdf-to-ppt、image-to-pptx-skill、paper-slides 这类专用工具。
流程图
drawio 流程图
【2026-6-3】一句话绘制 drawio 流程图
claude mcp add drawio -- npx @next-ai-drawio/mcp-server@latest
视频制作
video-use
【2026-5-2】video-use 用”文本优先”思路革新视频剪辑:
- 先逐词分析语音内容再针对性处理画面,自然语言指令就能完成去废话、调色、字幕全流程,还能三轮自检质量。
- 开源地址:video-use。
- 中文用户建议替换Scribe为阿里FunASR并使用思源黑体。
ppt2video
安装
pip install ppt2video
使用
from ppt2video.tools import *
meta = Meta(
ppt_file='your_ppt_slide.pptx', # Name of your PPT file
google_application_credentials='/config/google_cloud.json' # Location and filename of your Google Cloud service account key
)
# Run the conversion
ppt_to_video(meta)
slides2video
slides2video 在线体验 上传pdf/ppt,自动生成脚本+视频
开源神器 slides2video
- 一键将 HTML 幻灯片 / PNG 素材转为带 AI 配音的 MP4 视频,深度对接豆包 TTS,搭载海量音色库,支持方言、IP 仿音、多情感与客服专属音色。
- 依托 ffmpeg + Playwright 实现无间隙音频合成,命令行极简操作,支持断点续跑、跳过重复环节,无需专业剪辑,快速产出教学、演示、自媒体视频,零基础也能批量生成高质量有声 PPT,办公与创作效率直接拉满!
支付宝打赏
微信打赏