鹤啸九天

路漫漫其修远兮，吾将上下而求索

大模型多轮会话

2025-08-10

大模型对话系统 agent mermaid 推理安全工具调用

多轮长文本压缩

大模型如何实现任务型多轮会话？复杂推理，如何处理长文本？如何提升工具调用准确率？

Read All
全模态大模型专题

2025-08-08

大模型

qwen 多模态阿里蚂蚁全模态双工实时端侧 vllm 具身智能端侧

全模态大模型原理及各种实现

Read All
大模型自动评估

2025-08-05

大模型

评估评测 agent 阿里

大模型如何自动评估？LLM-as-a-judge 和 Agent-as-a-judge 是什么？

Read All
强化学习进化史

2025-08-02

鹤啸九天

深度学习

深度学习强化学习动态规划贝尔曼方程量化交易游戏蒙特卡洛博弈论纳什均衡零和游戏

强化学习发展过程，背后的原理，未来会怎么走？

Read All
大模型与因果推断

2025-08-02

鹤啸九天

大模型

大模型因果推理 uplift

大模型推理能力如何提升？引入因果推理。大模型+因果推断=？

Read All
扩散语言模型

2025-08-01

鹤啸九天

大模型

扩散模型语言模型自回归深度搜索 agent 何恺明田渊栋

新兴方向：扩散语言模型

Read All
多模态大模型案例

2025-07-31

鹤啸九天

大模型

多模态 moe 美团

多模态新兴大模型

Read All
GUI/OS Agent 智能体应用

2025-07-23

大模型

Agent 角色模拟多模态可视化强化学习

大模型 LLM 驱动的设备操控GUI智能体/OS

Read All
智能体记忆设计 Agent Memory

2025-07-21

大模型

LLM agent 智能体记忆强化学习 graphrag rag 知识图谱遗忘

智能体记忆设计专题

Read All
通用智能体 Agent

2025-07-20

大模型

LLM agent 智能体 manus genspark langchain

通用智能体专题

Read All
世界模型 World Model

2025-07-15

大模型

LLM AGI 世界模型系统快思考慢思考因果模拟器具身智能

世界模型专题笔记

Read All
大模型时代的知识图谱

2025-07-01

大模型

大模型知识图谱 rag 记忆 neo4j LLM

如何用知识图谱提升LLM推理能力？LLM如何加速知识图谱应用落地？

Read All
上下文工程指南

2025-06-27

大模型

prompt 大模型 context cpu manus langchain 刘鹏飞上海交大硅基碳基

提示工程、Agent不管用？试试上下文工程

Read All
文档问答、长文本创作专题

2025-06-24

大模型

长本文创作 rag 搜索窗口大模型多模态文档问答 ragflow 知识图谱

大模型文档问答，辅助长文本创作有哪些问题，怎么解决

Read All
VLA专题

2025-05-04

鹤啸九天

人工智能

具身智能机器人机械臂 ros 世界模型 system qwen 世界模型

端侧多模态应用场景：机械臂、具身机器人等

Read All
AI+游戏

2025-05-01

鹤啸九天

大模型

大模型搜索 agent 游戏

RL/大模型在游戏中的应用

Read All
LLM/Agent 自我进化

2025-04-20

大模型

Agent 自学习进化自动化训练 openclaw 小米罗福莉 hermes

LLM/Agent 如何实现自我进化？

Read All
Agent 智能体设计

2025-04-19

大模型

Agent 多模态 agi 自学习进化自动化训练记忆 Human 斯坦福 openclaw loop claude

LLM Agent 落地时，如何抉择、如何设计架构？

Read All
LLM基建 MCP+A2A+Skills

2025-04-10

大模型

mcp a2a langchain anp acp agent skills

LLM 基础设施架构：MCP+A2A+ACP+ANP, Agent 通信协议

Read All
大模型应用: 辅助编程

2025-02-25

鹤啸九天

大模型

大模型代码生成代码测试 ak47 vibe rpa ak47

大模型代码辅助专题

Read All
大模型应用: 搜索

2025-02-02

鹤啸九天

大模型

大模型搜索 deepseek agent

大模型搜索专题

Read All
Agent 智能体应用

2025-01-23

大模型

Agent 角色模拟多模态 kaggle 操作系统 agi manim 可视化 dqn 强化学习自学习进化俄罗斯方块字节电商

大模型 LLM 驱动的智能体如何应用？

Read All
MS-Swift 框架介绍

2025-01-12

鹤啸九天

大模型

GPU llama-factory 阿里 swift

大模型训练框架：ms-Swift

Read All
LLaMA-Factory 使用指南

2025-01-10

鹤啸九天

大模型

GPU Tensorflow Pytorch 并行计算分布式 huggingface 阿里云火山 unsloth llama-factory vllm FSDP deepspeed

分布式训练知识点

Read All
分布式训练框架

2025-01-10

鹤啸九天

大模型

GPU Tensorflow Pytorch 并行计算分布式 huggingface 阿里云火山 unsloth llama-factory vllm FSDP

分布式训练知识点

Read All

2/14

--disqus--

Tags

毕业季诗歌国画书法撒贝宁诗词大会王国维人间词话苏东坡辛弃疾大学 vr 全景武汉旅游相册路遥史铁生莫言刘慈欣古籍历史刀郎音乐五线谱简谱教育制度游戏麻将 cs ai 兴趣曲线掼蛋湖北黄冈人才时差方向地球地震蕲春茭白胡焕庸司马迁玉溪日历农历阳历阅读导航指南操作系统进程线程协程回调异步 mac 苹果 windows word pdf 代理高德纳图灵冯·诺依曼陈皓少儿编程网络体系结构 CPU arm x86 OSI 编程语言编码 32 64 可视化路由器交换器调制解调器猫 lan wan wlan ap tcp udp 下载种子磁力电视卫星地面波广播蓝牙耳机 wifi 内网穿透云盘浏览器 vpn tor 墙人生规划贫富差距家庭教育数据挖掘机器学习数据分析大数据增长黑客数据金字塔 sql zepplin hadoop hive tez spark storm 服务质量评分卡 clickhouse kafka zookeeper 数据库 mysql NPS 统计学 excel vlookup 贝壳分互信息熵皮尔逊肯德尔 pearson kendall 爬虫 json 加密幸存者偏差百度职场 graphviz echarts pyecharts matplotlib seaborn streamlit 3b1b jupyter 相关性 mathematica pandas tableau manim SQL python pymysql sqlite redis go serverless 云数据库 mongodb 数学有限状态机 t-sne 分形元胞自动机图灵斑图维数灾难混沌富豪社会阶级留学生教育穷人翻身阶层潜规则幂律分布社会出路俱乐部最优停止理论斩杀线户口户籍落户房产出国北京银行开户地铁车牌诸葛亮周易李叔同鬼谷子苏轼东坡柏拉图苏格拉底道德经风水算命命理马列朝鲜商鞅文化日本阿拉伯制度控制论郭继承意义佛系童年记忆哲学政治毛泽东毛选投资孙正义自传财务自由穷爸爸富爸爸罗伯特清崎经济周期康波美林周金涛理财韭菜税凉子访谈录衡水中学海淀学区脱口秀原生家庭罗翔香港公积金贷款斯坦福居住证退休社保新加坡美国生活经济 jekyll 端口 markdown Foxit RubyGems HTML CSS 建站阿里云 github 公司腾讯云插件 gitee 码云 latex 公式表格 ocr 转换编辑画图 draw 高考成长经历佛教禅修龙泉寺宗教大悲寺心经三摩地基督教伊斯兰教犹太教道教 linux shell bat ubuntu yaml 文件服务 vscode crontab curl post ssh 隧道 tmux ip nohup 键盘 conda git svn gitlab cli 傅里叶 FFT 级数高德 gps geohash base64 北斗定位 gpx 节日节假日时间时区宠物交通信号灯大模型 gis 地理周志华通用逼近定理归纳演绎漂移逼近本质农村村官秦玥飞反贪反腐国际联合国新闻媒体陈行甲俄罗斯 r Go web 输入提示模型部署 hertz oop 面向对象 workflow 流程引擎进化论生命心理学乔姆斯基 Noam_Chomsky 汉语英语拼音注音输入法翻译汉字繁体简体二简字学习方法商务简历面试 996 emoji 表情线性代数矩阵论欧式空间希尔伯特完备泛函谷歌深度学习 pipeline 机器学习流程方法论技术债 AI 人工智能朱松纯乌鸦鹦鹉唐杰逻辑视觉问答 VQA 人类简史人文康德汉字屋张首晟姚期智天道沈向洋戴海琼达摩院 Bengio SNN 神经网络 BP 三定律大脑马斯克缸中之脑意识李飞飞休谟维特根斯坦资料吴恩达田渊栋博士 Facebook 李沐陈天奇刘知远数据结构算法 KMP Morris 二叉树字符串 leetcode 图匹配匈牙利牛顿法二分法字节排序实习应届生招聘求职算法工程师工业界学术界危机能力等级调参调包软考证书最优停止 star ober 职级薪资待遇 RNN CNN GAN snn 脉冲 agi 液态神经网络 ML 表示学习 hinton 反向传播雅各比 sigmoid 激活函数三棕一蓝泛化叠加定理万能逼近定理哈密顿 kan 样条 hopfield transformer NLP 对话系统多轮闲聊图灵测试智能音箱个人助理智能客服 AIGC LLM Linux Linus 天才人生意义三观技术价值观不平衡损失函数 Tensorflow Python pytorch 框架 softmax 李宏毅强化学习 wandb swanlab 生活大爆炸自然语言处理台词身份证华为微信实战清华大学天机自行车 AGI 类脑类机 waitbutwhy 脑机接口拖延症软素质工作效率认知自律沟通塔勒布黑天鹅反脆弱情绪一元论二元论事实观点人性时间管理自证人生伴侣选择王志文孤独聊得来约会婚姻 pua 纪录片人口计算机 Shell 编程 Numpy Pandas Matplotlib Web virtualenv pypy anaconda 多进程多线程编码regex jsonl 编码规范单元测试压力测试 qps 代码评审 GUI 界面函数模型部署 gradio 装饰器设计模式副业 mba mpa 程序员中年危机王阳明思考财经科技风景电影剑桥大学斯坦佛大学研究报告计算机视觉语音识别医疗影响红杉创业读书笔记哈佛大学幸福电子书西瓜书交叉验证过拟合偏差方差误差内插外推集成学习半监督多模态不均衡分布判别生成决策树 xgb 丘成桐陶哲轩软件 matlab 魔方互联网 MIT Aaron_Swartz 季逸超 Magi 阿桑奇斯诺登棱镜门迈克菲暗网比特币表网深网梁冬华大基因自然宇宙神学病毒细菌真菌 SARS SARI 武汉肺炎埃博拉蝙蝠血型微积分经典力学热力学第二定律寿命施一公性别辩论民科民粹甲醛癌症果壳饮酒新冠奥密克戎化妆激素心脏做饭晕车猝死白发薛定谔的猫芝诺的乌龟拉普拉斯兽麦克斯韦妖量子力学宇宙速度特斯拉电核颜色镜片飞机火箭磁悬浮打印噪音声音充电宝原理杨振宁中医西医针灸法医生物双面实验随机量子计算机量子纠缠量子叠加摩尔定律概率统计正态分布长尾分布样本数置信度赌博香农凯利庄家回归分类定理定律年会抽奖信息论相对熵交叉熵区块链桥水基金智能合约零知识证明 usdt opencv 数字图像滤波三维水印 sam 马赛克 OCR 豆包图片编辑 deepseek diffusion 扫地机器人自动驾驶何恺明 CVPR 论文 sota ffmpeg 视频婴儿 chrome gan rnn lstm seq2seq 文本评价 BLEU 好未来 paraphrase 复述 gpt VAE vae 扩散 chatgpt 编码器各项同性各项异性注意力解码贪心推测解码集束搜索温度采样多项式对比 moe 自回归投机采样 Transformer BERT GPT Attention BeamSearch 杨植麟 XLNet 循环智能 roformer rwkv 苏剑林检索芯片序列化三蓝一棕帕累托 retnet yoco ttt 文本生成对抗攻击 OpenAI ChatGPT 具身智能模仿学习 nanaogpt baby 专家 bert 自监督 Milvus elasticsearch es unilm simcse gpu 迁移学习 sentence 句向量向量化独热词嵌入 word2vec ALBERT rasa diet sbert 长文本窗口彩票假设蒸馏 C C++ STL http openssl 内存泄露编程技能 UML C/C++ make 文化密码 vc pe 风险投资斜杠青年自由职业自媒体知识付费商业思维写作公众号小店图片工作咸鱼远程跨境电商抖音 TikTok 众包平安科技在线教育 aigc icu 币圈硅谷牛马独立开发凯文凯利 opc AI圣经遗忘曲线 BAT TMD 陆奇张一鸣 FLAGS 拼多多 Keep 小程序电商俞永福 ofo 信息 IoT openai coze 问答收益广告知乎小度滴滴美团外卖贾磊李彦宏黑话公司注册外包五险一金天眼查法律仲裁股权廿面体管理个税股票上市 ipo 一人公司政策疫情地图 yolo cv 卡尔曼滤波器目标跟踪无人机 gcn st-gcn 骨骼安防摄像头特征工程 tensorflow sklearn 特征可解释 spearman 相关系数 scikit-learn 文本服务 AutoML NAS auto-sklearn 元学习 autoresearch QA kbqa document FSM 台大陈蕴侬 JSGF 图灵测试推荐系统阅读理解智能音箱 faiss nl2sql 知识库外呼 ccf 流形学习降维无监督学习 embedding pca AIML DAG 调度文本摘要指代消解省略补全 kenlm fasttext 文本分类句法分析 OOV 分词纠错停用词词库同义词近义词次词 subword 分句信息抽取实体识别 ner 关系抽取正则表达式 llm agent 扣子阿里机器翻译提示攻击小红书增强学习动态规划贝尔曼方程量化交易蒙特卡洛俄罗斯方块机器人密码学同态加密彩虹表加盐王小云摩斯密码二维码文件安全白帽黑帽联邦学习群体学习几何学导数梯度极限幂级数傅里叶级数 OOD 分布外泛化爱可可 huggingface 专利硕士论文造假 openclaw hermes 乌合之众成长性格九型人格 16型人格荣格心理学 MBTI 星座安全感演讲 KG KB-QA 知识图谱 jena neo4j 因果科学集智俱乐部广告预估亚里士多德 uplift CodeReview 技术氛围华山论剑 TCP UDP star法则代码规范推理思维三段论 BBC 二八原则心智命运优越感读书内耗会议效率舒适区二八定律 KPI OKR 复盘昨天今天明天表达孙子兵法三十六计创新扩散曲线情商人脉嫡系 CTR FM Wide&Deep kaggle 短视频搜索马太效应长尾 CRS 交互式信息茧房贝叶斯频率学派贝叶斯学派点估计分布估计参数估计区间估计 MLE MAP HMM CRF 概率分布人道多任务学习 ctr cvr ple 多分类多标签 LTR TensorFlow NCE KL散度指标阿里妈妈威尔逊 wilson 最优化梯度下降凸函数凸优化 KKT 距离计算相似度 Pareto 编辑距离运筹 A/B实验假设检验因果推理灰度发布 nginx 平滑发布金丝雀反向代理 interleaving 谬误测试 gRPC Restful 服务部署 HTTP PS 参数服务器分布式 GPU MLOps AUC PR 混淆矩阵评价互联网金融 kappa 马修斯 mcc mae elo 竞技博弈 k8s docker cpu mlx launch JavaScript js node.js vue 前端 vite npm yarn restful Swagger Session RPC 微服务 GraphQL 低代码拖拽 api celery apache 性能限流 xgboot 天池 kdd oov 金融 flask django fastapi Gunicorn supervisor genvent grequests 用户模拟器性格模拟角色模拟 simulator 智能体数字分身评测画像个性化语义 simhash hash 哈希 ASR TTS 情感计算声纹识别说话人识别直播 webrtc 智能外呼智能家居手语合成全双工通信 paddle 音箱响铃智谱通义千问端侧 gnn 图挖掘复杂网络 stgcn 负采样增强层次分类 tensorrt albert idf bm25 意图识别评估 adb otg 手机内存闪存 rom ram 接码 MQTT 物联网 5G 纳什均衡 ZigBee 电脑协同分屏边缘计算硬件对话传感器聆思云计算股市 K线对冲溢价均线 P2P 四大行风控浑水做空招商加息降息房价房贷利息贝壳幸福里安居客 cps cpm 麦田居理 kk 未来预测 TPU Pytorch 并行计算加速 cuda 推理加速 onnx zero lpu 云服务魔塔昇腾寒武纪时间序列炒股知识追踪认知诊断情感智能离散情感空间维度情感空间情感分析聚类文本相似度 kd nsw knn 群体集体异常检测 meta 小样本学习主动学习 nlp language-model attention 黑盒模型第一性原理遗忘超参网格搜索随机搜索学习率模型坍缩 loss 对比学习无监督 datasets 爱因斯坦相对论物理光三体费曼学习金字塔康奈尔笔记法心流上瘾奶头乐杨振宁渗透式学习法架构设计淘宝 58 DAO MVC MTV 客户端服务端云端车辆网无人驾驶何晓飞飞步造车微软黄埔军校汽车世界模型蔚来索引正排倒排 pagerank Google ES seo magi omnity 笛卡尔黎曼几何欧式非欧 rpa 宇树波士顿动力数据集大疆银发 vla 前沿技术科学技术成熟度曲线元宇宙扎克伯格虚拟人数字人 AR VR prompt 思维链 MakeFile GCC cmake 柳传志联想倪光南孙宏斌柳青杨元庆产品 MVP PMF B端 C端增长运营营销线上化智能化信息化博弈论纳什内卷谋略商场高铁农民工草台班子医保驾照驾校驱动培训用户画像瓦森纳政府 gdp kfk 智囊团制造产业玩具川普中国银发经济逻辑回归第二大脑本我自我超我睡眠欲望 system 系统成瘾图形学 opengl webgl three.js vtk slam 高斯泼溅标签骚扰电话 id 雪花 session 用户建模隐私诺贝尔三重脑励志达利欧社交向上革命 poe openrouter o1 图像飞书 sora 点子价格黑客松开源协议社区清华奇绩创坛贾扬清 ilya altman 上海交大商汤翁丽莲翁荔百川月之暗面 META 杨红霞 mit 微调虚拟号 langchain mcp 代码 CLIP vit controlnet 逆向工程 llama mamba jamba mistral 推荐标注 cici ollama 舆情 sd lora unet 视频生成 stable 条件控制设计视频理解 tt tiktok 剪辑拍摄蒙版关键帧滤镜摄影 moviepy lux you-get 扩散模型拼接鱼眼视频号 milvus vector qwen ak47 manus 快思考慢思考灾难幻觉生命游戏涌现 norm GNN 因果缩放定律 plugin RL Agent 人脑 GRPO DAPO aiot 小米认知模型灾难遗忘正则 peft 罗福莉 rft gptoss 美杜莎 vllm 量化 deepspeed sglang gemm gguf 函数调用 tool 工具 rl dm tts 语音小爱 cui gui lui RAG 陈丹琦自动化模型编辑 raft baichuan ChatGLM 目标检测百炼训练全模态多模态诅咒 mixtral 北大范式 dify claude skills 显存提示词昆仑万维创新 persona 不可能三角 ppo rlhf dpo odpo 自学习奖励逆强化学习扩展法则 google deepmind anthropic rag kimi r1 伯克利 cot 波将金图神经网络符号主义课程学习 search think 顿悟上下文 oft 奖励函数克隆阶跃星辰 ssm 不确定稳定测试时计算联想记忆 lm_studio tableqa 火山 unsloth llama-factory FSDP swift dqn 进化代码生成代码测试 vibe a2a anp acp Human loop 机械臂 ros 长本文创作文档问答 ragflow context 刘鹏飞硅基碳基模拟器 genspark graphrag 语言模型深度搜索零和游戏蚂蚁双工实时压缩 ood 阿里小蜜改写龙猫 longcat 客服测试时流式阿里巴巴 skill gemini 龙虾 openhuman multica codex 自进化 deepagents harness OPD html token 算力中转站 grpo

Links

AI Hot：全球大模型实时资讯
WaitButWhy：国外知名科技博主
科学空间：苏剑林科学空间
3blue1brown：优质数学教学视频
prajwalsouza可视化项目：传染病可视化模拟
Google AI Lab：汇总各种有意思的demo
Polo club：Human-Centered AI of Georgia Tech, 各类AI可视化工作，含GAN Lab
Sam Altman：OpenAI CEO的成功学指南
OpenAI研究员Lilian：OpenAI机器人项目研究员的技术博客
Jason Wei：ChatGPT核心技术CoT发明人博客，Google Brain 员工 & CoT 发明人
Lingdong：CMU在读学生Lingdong的项目集合,含文言文写代码
MANA：AI算法市场
Yann Lecun(杨立昆)：三巨头之一
Andrej Karpathy：深度学习界的AK47
Jay Alammar：【精品】图解系列
Sebastian Ruder：DeepMind成员的最新技术跟进
李宏毅 (Hung-yi Lee)：台大教授
Colah’s Blog：精品文章
ayaka绫香(新加坡)：nlp研究者, 计算机+语言学, ChatGPT
渐构：日本博士，西电老师，曾经的DL讲师团成员
集智俱乐部：没有围墙的大学
知识分子：饶毅科学知识
红杉：行业投资报告
prajwalsouza可视化项目：传染病可视化模拟
一亩三分地：北美华人社区
Floydhub：Floydhub技术博客
爱可可：微博大V，实时更新最新技术
RL入门资料：Deep Reinforcement Learning from beginner to expert
深度学习前沿笔记：张俊林的优质专栏
Sota技术汇总：AI领域state-of-art技术汇总
Sota代码：各领域效果最佳论文及代码
Neurohive：AI领域最新数据集+Sota效果（俄罗斯）
Tensorflow中国社区：谷歌组织的TF社区
酷壳：左耳朵耗子
莫烦系列教程：Python、ML、RL等教程
全球架构师峰会：架构师领域技术交流
5to9：国外创业案例
黄海广博士的学习总结(github)：机器学习、深度学习课程总结及完整资料
数林觅风：精美脑图笔记
数学研发论坛：数学爱好者
码云同步：代码同步，解决github不稳定的问题
hht：实践

Subscribe