鹤啸九天 自律更自由,平凡不平庸 Less is More

优质 Skills 汇总

2026-04-30
阅读量

Notes(温馨提示):

  1. ★ 首次阅读建议浏览:导航指南, 或划到本页末尾, 或直接点击跳转, 查看全站导航图
  2. 右上角工具条搜索文章,右下角二维码关注微信公众号(鹤啸九天),底栏分享、赞赏、评论
  3. ★ 转载请注明文章来源,知识点积累起来不容易,水滴石穿,绳锯木断,谢谢理解
  4. ★ 如有疑问,邮件讨论,欢迎贡献优质资料


Skill 应用

Skill 原理

Skill 介绍

目前,skill 都以 markdown 格式存在

pdf-to-markdown/
├── SKILL.md                  # Skill说明文档(含元数据、使用指南、核心指令)
├── scripts/                  # 自动化脚本(含各类可执行脚本)
│   └── convert.py            # 转换pdf为md的自动化脚本
└── evals/                    # 测试工具集
    └── evals.json            # 3个典型的测试用例

详见站内专题:Skill 技术专题

HTML

2026年5月10日,Claude Code 工程师塔里克·希希帕尔(Thariq Shihipar)发文,标题 《在 Claude Code 工作流中,HTML 为何“不讲道理地好用”》。

理由:

HTML 可以承载 Markdown 完全做不到的 8 种内容:表格、CSS、SVG、代码高亮、JS 交互、工作流程图、空间画布数据、真实图像,而且这一切,打开浏览器立刻能用 🔥

生产场景用例:

  • ✅ 规格与规划文档
  • ✅ AI 代码审查
  • ✅ 设计与原型验证
  • ✅ 研究与报告
  • ✅ 定制化的一次性编辑界面

🧐为什么偏偏是 Claude Code,而不是 Claude 聊天界面或者 Claude 设计工具?

  • 因为 Claude Code 有完整的上下文堆栈:文件系统访问权限、MCP 服务器、Chrome 浏览器内的 Claude,加上 Git 历史记录。
  • 这些能力凑在一起,才让“输出 HTML”这件事变得值钱——它不仅仅是好看,而是真正可运行、可交互、可继续被 AI 修改的功能块。

⚠️但关键瓶颈依然现实:Token 成本。

  • HTML 比 Markdown 啰嗦得多,相同内容量可能要烧掉 2-4 倍的 Token。一旦上下文窗口紧张,这个开销会非常致命。
  • 所以问题:HTML 能否真正取代 Markdown 成为 AI 编码代理的默认格式?还是说它只会是特定高价值场景的“奢侈选择”?

信息获取

去网上找点东西,就抓瞎了:

  • 📺 “帮我看看这个 YouTube 教程讲了什么” → 看不了,拿不到字幕
  • 🐦 “帮我搜一下推特上大家怎么评价这个产品” → 搜不了,Twitter API 要付费
  • 📖 “去 Reddit 上看看有没有人遇到过同样的 bug” → 403 被封,服务器 IP 被拒
  • 📕 “帮我看看小红书上这个品的口碑” → 打不开,必须登录才能看
  • 📺 “B站上有个技术视频,帮我总结一下” → 连不上,海外/服务器 IP 被屏蔽
  • 🔍 “帮我在网上搜一下最新的 LLM 框架对比” → 没有好用的搜索,要么付费要么质量差
  • 🌐 “帮我看看这个网页写了啥” → 抓回来一堆 HTML 标签,根本没法读
  • 📦 “这个 GitHub 仓库是干嘛的?Issue 里说了什么?” → 能用,但认证配置很麻烦
  • 📡 “帮我订阅这几个 RSS 源,有更新告诉我” → 要自己装库写代码

每个平台都有自己的门槛——要付费的 API、要绕过的封锁、要登录的账号、要清洗的数据。你要一个一个去踩坑、装工具、调配置,光是让 Agent 能读个推特就得折腾半天。

总结

  • Agent-reach 各社媒平台数据获取
  • opencli 浏览器自动化
  • bb-browser 浏览器 API: 坏孩子浏览器 BadBoy Browser, 不需要密钥,不需要爬虫,不需要模拟

信息抓取

MediaCrawler

MediaCrawler - 自媒体平台爬虫 🕷️

小红书、抖音视频、快手视频、B 站视频、微博帖子、百度贴吧帖子、知乎问答文章

# 依赖 playwright
uv run playwright install
# 运行
# 项目默认未开启评论爬取,如需评论请在 config/base_config.py 中修改 ENABLE_GET_COMMENTS
# 其他功能开关也可在 config/base_config.py 查看,均有中文注释

# 从配置中读取关键词搜索并爬取帖子与评论
uv run main.py --platform xhs --lt qrcode --type search

# 从配置中读取指定帖子ID列表并爬取帖子与评论
uv run main.py --platform xhs --lt qrcode --type detail

# 使用 SQLite 数据库存储数据(推荐个人用户使用)
uv run main.py --platform xhs --lt qrcode --type search --save_data_option sqlite

# 使用 MySQL 数据库存储数据
uv run main.py --platform xhs --lt qrcode --type search --save_data_option db

# 其他平台示例
uv run main.py --help

Agent-Reach

Agent-Reach

  • 所有工具开源、所有 API 免费
  • Cookie 只存在你本地,不上传不外传。代码完全开源
  • 底层工具(yt-dlp、twitter-cli、rdt-cli、Jina Reader 等)定期追踪更新到最新版

安装

# 安装
帮我安装 Agent Reach:https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/install.md
# 更新
帮我更新 Agent Reach:https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/update.md

【2026-5-11】AnySearch

【2026-5-11】谷歌搜不到的80%互联网,AnySearch全打通了!开发者连夜接入

5月11日,AnySearch 产品海外正式上线。

  • GitHub:anysearch-ai
  • 也可在ClawHub、SkillHub、Glama、skills.sh等插件商店直接获取

定位:AI时代的「搜索基础设施」,专为AI Agent打造统一的高质量搜索入口。

AnySearch 通过大模型获取 Reddit 论坛、代码仓库、股票市场等多种信息

安装

  • 官网 AnySearch,点击 Install/安装,复制安装教程直接输入Agent,部署完成。
Install the AnySearch SKILL according to 
https://anysearch.com/install/skill-install.md

评测

  • AnySearch 与 Brave、Perplexity 做了对比,显然 AnySearch输出的结果更丰富。
  • 基准测试中,AnySearch在准确性和响应延迟两个维度,均优于同类AI搜索产品Parallel和Brave。
  • 与同类Brave Search测试对比,结果显示,AnySearch数据更完整、分析更深入、回答更全面

公众号文章抓取

wechat_articles_spider

浏览器操控

bb-browser

bb-browser 浏览器 API: 坏孩子浏览器 BadBoy Browser

  • 不需要密钥,不需要爬虫,不需要模拟

已经登录了微博、知乎、B站、小红书、Twitter、GitHub、LinkedIn — bb-browser 让 AI Agent 直接用你的登录态

# 安装
npm install -g bb-browser
# 使用
bb-browser site update        # 拉取社区适配器
bb-browser site recommend     # 看看哪些和你的浏览习惯匹配
bb-browser site zhihu/hot     # 开搞

bb-browser site twitter/search "AI agent"       # 搜索推文
bb-browser site zhihu/hot                        # 知乎热榜
bb-browser site arxiv/search "transformer"       # 搜论文
bb-browser site eastmoney/stock "茅台"            # 实时股票行情
bb-browser site boss/search "AI 工程师"           # 搜职位
bb-browser site wikipedia/summary "Python"       # 维基百科摘要
bb-browser site youtube/transcript VIDEO_ID      # YouTube 字幕全文
bb-browser site stackoverflow/search "async"     # 搜 StackOverflow

OpenCLI

OpenCLI

使用

npm install -g @jackwener/opencli
opencli bilibili hot --limit 5
opencli twitter trending

垂类知识

金融

【2026-5-10】Claude 的金融 Skills 开源

Anthropic 把华尔街分析师每天干的活,拆成了一套 Claude 可以直接装的插件包

  • 替分析师起草工作底稿(模型、备忘录、研报、对账单)的,不做投资决策、不执行交易、不绑定风险、不批准开户,每一份产出都摆在那儿等人类签字
  • 边界划得很干净,金融行业最敏感的就是责任,能跑活但不背锅,反而是 To B 落地最现实的姿势

Anthropic 官方仓库 claude-for-financial-services,把投行、股票研究、私募股权、财富管理这四条华尔街最贵的赛道全端了出来

  • 仓库地址:financial-services
  • Apache 2.0,全部 Markdown + YAML,没有 build step,fork 下来就能改

安装方法

# 1. 添加 marketplace
claude plugin marketplace add anthropics/claude-for-financial-services

# 2. 先装核心包(带所有数据连接器)
claude plugin install financial-analysis@claude-for-financial-services

# 3. 按需挑 Agent
claude plugin install pitch-agent@claude-for-financial-services
claude plugin install gl-reconciler@claude-for-financial-services
claude plugin install market-researcher@claude-for-financial-services

# 4. 按需挑垂直行业包
claude plugin install investment-banking@claude-for-financial-services
claude plugin install equity-research@claude-for-financial-services

两层:

  • Agents(11 个):端到端的工作流智能体,比如 Pitch Agent、Earnings Reviewer、GL Reconciler,每个都是自包含插件,装上就能跑一整条流水线
  • Vertical Plugins(7 个垂直行业包 + 2 个合作伙伴包):底层的 Skill、斜杠命令、数据连接器,按金融子行业打包,你不想要完整 Agent,只装这些底层能力也行

而且所有东西两种部署方式同源——既能在 Claude Cowork 里当插件用,也能通过 Claude Managed Agents API(/v1/agents)丢到自家工作流引擎后面跑无头模式,同一个 system prompt、同一组 skill,你选在哪儿落地

业务方向 Agent 干什么活
客户与咨询 Pitch Agent 可比公司 + 先例交易 + LBO → 出一份带品牌的 pitch deck
  Meeting Prep Agent 客户会议前自动出一份 briefing pack
研究与建模 Market Researcher 给一个赛道/主题 → 行业概览 + 竞争格局 + peer comps + 标的清单
  Earnings Reviewer 财报电话会 + 公告 → 更新模型 → 起草研报
  Model Builder DCF、LBO、三表模型、可比公司分析,直接在Excel里跑
基金运营 Valuation Reviewer 接收GP报送包 → 跑估值模板 → 准备LP报告
  GL Reconciler 找总账break、追根溯源、走签字流程
  Month-End Closer 月末结账:计提、滚存、差异说明
  Statement Auditor LP报表分发前的审计
运营与开户 KYC Screener 解析开户文档 + 跑规则引擎 + 标记缺口

每个 Agent 都是独立打包的,bundle 了它要用的全部 skill,装一个就够,不用先装一堆依赖

11 个 MCP 连接器

  • MCP 访问可能需要数据商的订阅或 API Key
数据源 内容
Daloopa 标准化财务数据
Morningstar 基金研究
S&P Global 标普全球 + Capital IQ
FactSet 万得海外版
Moody’s 评级与信用数据
MT Newswires 即时新闻
Aiera 财报会议转写
LSEG 伦交所/路孚特
PitchBook 一级市场数据
Chronograph PE 投后监控
Egnyte 文档存储

书籍转skill

将技术书籍(PDF/EPUB)转化为 Claude Code 可加载的结构化 skill,让书中框架和知识点在工作时按需调用

book-to-skill

【2026-5-6】book-to-skill 是 Claude Code skill,把技术书籍的 PDF 或 EPUB 自动提取并生成结构化 skill 文件,包括按章节加载的摘要、术语表、设计模式速查表。

用法

/book-to-skill your-book.pdf

# PDF — derive skill name from filename
/book-to-skill ~/Downloads/designing-data-intensive-applications.pdf
# EPUB — specify a custom slug
/book-to-skill ~/books/clean-code.epub clean-code
# Full path with explicit name
/book-to-skill /tmp/ddd-evans.pdf domain-driven-design

网页设计

Anthropic 发布 Claude Design,设计师圈子里刷屏了。

  • 专门给设计师用的 AI 工具,把设计思维和 AI 代码生成直接捏在一起,演示视频里随便聊几句就能出一个像样的设计稿,「这就是设计的未来」。

但闭源,只能通过官方 Claude 账号使用,而且额度少的可怜,用上原生 Claude design 对大多数人非常困难。

GitHub 上 开源项目

  • Open Design 项目(作者:@Tom Huang)完全开源,Apache 2.0 协议,可自己部署,接自己的 API Key,可以改代码,可以二次开发。
  • 其他

Open Design

Open Design 项目(作者:@Tom Huang)完全开源,Apache 2.0 协议,可自己部署,接自己的 API Key,可以改代码,可以二次开发。

覆盖网页设计的方方面面

  • 31个技能
  • 各种格式的设计原型

ppt 制作

ppt制作技能

GitHub 上和 PPT 相关的 Skill 项目。

结论:

  • 做 PPT 这件事,已经不只是“让 AI 帮你写几页内容”了,而是分成了好几条路线。

路线

(1)如果做漂亮网页 PPT,优先看:

  • guizang-ppt-skill:电子杂志感很强,适合发布会、分享、视觉化报告。
  • next-slide:产品化程度高,零依赖 HTML,中文场景友好。
  • html-ppt-skill:更像模板工厂,适合研究通用 HTML PPT 生成。
  • revealjs-ppt-skill:标准 reveal.js 路线,适合技术分享、课程、文档型演示。

(2)如果你最终要的是可编辑 PPTX,可以重点看:

  • anthropics/skills/pptx:官方基线型 PPTX skill。
  • MiniMax-AI/pptx-generator:PptxGenJS 路线,生成、读取、编辑都比较工程化。
  • powerpoint-skill:适合研究 HTML 到 PPTX 的高保真转换。
  • mcp-server-ppt:更偏 Windows + Office 自动化场景。

(3)想做“高级感网页 PPT”,先看

  • next-slide + guizang-ppt-skill + html-ppt-skill。

(4)想做“真正可编辑的 PPTX”,先看:

  • anthropics/pptx + MiniMax pptx-generator。

(5)想把 PDF、图片、论文转成演示,可以看:

  • glmv-pdf-to-ppt、image-to-pptx-skill、paper-slides 这类专用工具。

流程图

drawio 流程图

【2026-6-3】一句话绘制 drawio 流程图

  • 日本开发者提供 next-ai-draw-io: demo, github中文文档
  • Next.js网页应用,与draw.io图表无缝结合。通过自然语言命令和AI辅助可视化来创建、修改和增强图表
claude mcp add drawio -- npx @next-ai-drawio/mcp-server@latest

视频制作

video-use

【2026-5-2】video-use 用”文本优先”思路革新视频剪辑:

  • 先逐词分析语音内容再针对性处理画面,自然语言指令就能完成去废话、调色、字幕全流程,还能三轮自检质量。
  • 开源地址:video-use
  • 中文用户建议替换Scribe为阿里FunASR并使用思源黑体。

ppt2video

ppt2video

安装

pip install ppt2video

使用

from ppt2video.tools import *

meta = Meta(
    ppt_file='your_ppt_slide.pptx',  # Name of your PPT file
    google_application_credentials='/config/google_cloud.json'  # Location and filename of your Google Cloud service account key
)

# Run the conversion
ppt_to_video(meta)

slides2video

slides2video 在线体验 上传pdf/ppt,自动生成脚本+视频

开源神器 slides2video

  • 一键将 HTML 幻灯片 / PNG 素材转为带 AI 配音的 MP4 视频,深度对接豆包 TTS,搭载海量音色库,支持方言、IP 仿音、多情感与客服专属音色。
  • 依托 ffmpeg + Playwright 实现无间隙音频合成,命令行极简操作,支持断点续跑、跳过重复环节,无需专业剪辑,快速产出教学、演示、自媒体视频,零基础也能批量生成高质量有声 PPT,办公与创作效率直接拉满!

结束


支付宝打赏 微信打赏

~ 海内存知已,天涯若比邻 ~

Share

Similar Posts

Related Posts

上一篇 在线蒸馏 OPD

标题:在线蒸馏 OPD

摘要:新兴训练技术:在线蒸馏

标题:大模型智能客服落地案例

摘要:大模型智能客服应用案例分析, Usecase of Intelligent Customer Service

站内可视化导航

文章可视化导读:鼠标划过图形块时,如果出现蓝色光环, 点击即可跳转到对应主题

Comments

--disqus--

    My Moment ( 微信公众号 )
    欢迎关注鹤啸九天