-
大模型工业落地的技术经验:如何快速修复基座模型的知识点?
-
大模型会往哪个方向发展?
-
端到端语音交互方案汇总
-
Transformer、Attention 有什么问题?如何改进?是唯一选择吗?
-
如何检测AIGC内容?区分机器还是人工编写?怎么攻击AIGC/LLM内容?
-
大模型时代的推荐系统方法总结
-
大模型工业落地的技术经验总结:参数高效微调 PEFT
-
大模型工业落地的技术经验:RAG 检索增强生成及其改进版本
-
大模型推理能力专题,包含openai o系列、deepseek r1等长程思考模型
-
谈谈影响LLM发展的幻觉问题及其解法
-
谈谈影响LLM发展的重要定律, 规模法则(Scaling Law)
-
RLHF 原理及各个改进版本
-
数据质量直接决定模型上限,如何高效利用数据?
-
大模型原理、架构、代码理解、改进
-
创新创业方面的书籍
-
音频生成技术,如音乐生成、视频配音
-
文生视频技术
-
大模型训练原理,如何训练,有什么经验?
-
分布式训练知识点
-
DeepSpeed 知识点、训练技巧总结
-
训练大模型前,如何快速预估显存消耗?设计最合适的训练方案
-
数据标注流程介绍,大模型时代如何提升数据标注效率?
-
大模型时代的开发模式,如何用LLM模式重构已有应用?
-
混合专家模型,MoE系列
-
开源大模型笔记