-
大模型 LLM 驱动的智能体如何应用?
-
分布式训练知识点
-
大模型领域扫地僧:DeepSeek(深度求索)介绍,各个版本模型总结
-
自然语言转结构化查询 NL2SQL 专题, 大模型对 NL2SQL 的应用方案
-
大模型LLM部署工具,如 Ollama
-
大模型工业落地的技术经验:如何快速修复基座模型的知识点?
-
大模型会往哪个方向发展?
-
端到端语音交互方案汇总
-
Transformer、Attention 有什么问题?如何改进?是唯一选择吗?
-
如何检测AIGC内容?区分机器还是人工编写?怎么攻击AIGC/LLM内容?
-
大模型时代的推荐系统方法总结
-
大模型工业落地的技术经验总结:参数高效微调 PEFT
-
大模型工业落地的技术经验:RAG 检索增强生成及其改进版本
-
大模型推理能力专题,包含openai o系列、deepseek r1等长程思考模型
-
谈谈影响LLM发展的重要定律, 规模法则(Scaling Law)
-
RLHF 原理及各个改进版本
-
数据质量直接决定模型上限,如何高效利用数据?
-
大模型原理、架构、代码理解、改进
-
创新创业方面的书籍
-
音频生成技术,如音乐生成、视频配音
-
文生视频技术
-
大模型训练原理,如何训练,有什么经验?
-
分布式训练知识点
-
DeepSpeed 知识点、训练技巧总结
-
数据标注流程介绍,大模型时代如何提升数据标注效率?