The School of AI Beijing
- SoAI-The School of AI主页,SoAI-Beijing项目主页
-
温馨提示
如果在你浏览的是github里的readme文件,无法查看视频,
目录
- 关于SoAI-About The School of AI
- 学习资料-Learning material
- 开发环境-Dev environment
- 课程列表-Syllabus
- 课程内容-Contents
- 作业汇总-Homework Summary
- 参考资料-References
- 结业答辩-Graduation presentations
- 交流分享-Share
-
合作方-Partner
关于SoAI-About The School of AI
- An international educational non-profit platform dedicated to studying, teaching and creating AI to help solve the world’s most difficult problems. Our mission is to offer a world-class AI education to anyone on Earth for free.
- Siraj对SoAI的介绍
- 北京分部有中文、英文两个版本,详情:
SoAI-北京
Fast.AI
开发环境-Dev environment
- 多种方式:本地、云环境,由于不少项目需要GPU支持,建议采用云环境
本地环境-Local env
- 为什么大家都用jupyter notebook?深度学习代码只能在notebook上跑吗?
- 非也,notebook主要用于教学展示,代码分享,工程落地时,必须转成单个的python文件,按照机器学习的基本流程划分文件及目录,常见的结构如下:
- data:数据目录,包含:
- train.txt
- test.txt
- validation.txt(可选)
- bin:核心代码,主要包含:
- model.py:模型定义
- feature.py:特征工程部分,离线训练和在线评估都有
- train.py:模型训练代码
- predict.py:在线预测(inference,推断)
- model:模型存放
- log:日志目录
- 训练日志,如tensorboard日志
- conf:配置文件
- common:公共库、组件
- eva.py:效果评估
- data:数据目录,包含:
云环境-Cloud env
- Google colab,与github直接打通,免费GPU(Tesla T4)
- 如果无法访问,建议使用Kaggle,fastai接入指南,从0到1走进kaggle
- 【2019-05-12】kaggle注册时可能收不到验证码,原因是伟大的墙,解决方法:①找个v-p-n②kaggle注册无法激活怎么办
- fastai官方代码库
学习资料-Learning material
- 第1课的官方视频,图像分类-需vpn,bilibili-无需vpn,第1课的更新,第一课笔记
入门必读-Must read for beginners
- 知识体系(参考第一次课:深度学习入门指南)
- 如何高效学习
- 知乎:为什么大多数人宁愿吃生活的苦,也不愿吃学习的苦?(主动吃苦)
- 学习金字塔:
- 主动学习>被动学习
- 教授>总结>实践>看书>听课
- 费曼技巧:终极快速学习方法
- 怎么成为大牛?走出舒适区,进入学习区
- 大脑的学习之道:图谱结构+注意力+联想记忆+推理反思
- 数学基础:(选读,如果想深入学习,就必读)
- 线性代数(35%)
- 资料:「Deep Learning」读书系列分享第二章:线性代数-分享总结 【文字版】, 线性代数笔记
- 概率与信息论(25%)
- 资料:「Deep Learning」读书系列分享第三章:概率和信息论-分享总结,【文字版】
- 其他资料:Deep Learning解读合辑-国庆特辑, 视频版
- 线性代数(35%)
- Python生态圈
- numpy, 矩阵运算工具,资料如下:
- pandas,表格数据分析工具,资料如下:
- matplotlib,画图工具,资料如下:
- 机器学习入门:
- 深度学习入门:
- 神经网络讲解【3Blue1Brown优质讲解】,该系列一共4个视频,第一个如下:
- 神经网络Web Demo,可在线体验神经网络训练过程
- 神经网络3D仿真特效(多种网络结构对比)
- 手写数字识别在线体验
课程列表-Syllabus
Fast.AI系列速成实战课程,时间安排如下:
- 注意:这是github page搭建的主页,如想进入github,请点击“View on Github”,示例如下:
- 历次ppt课件资源
时间-Date | 章节-Chapter | 题目-Topic | 预习资源-Resources | 正式解读-Interpretation | 作业-Homework | |
---|---|---|---|---|---|---|
2019-04-21 | 介绍 | 深度学习入门指南 | 请完成ppt里提到的作业,长期 | 这节课长达2h,内容非常多,覆盖深度学习入门几乎全部知识点 | 完整看完80+页的ppt,并预习第二课 | |
2018-04-27 | 第一课 | 宠物图片分类,英文视频,中文版笔记 | Github代码 | 安装fastai环境并动手实现,代码解析:Github本地,Colab,Kaggle | 亲手执行本次代码,熟悉fastai环境 | |
2018-05-12 | 第二课 | 特征工程及SGD,英文视频,中文版笔记 | Github代码 | github,colab,kaggle示例 | ①熟悉fastai+kaggle环境②执行scikit-learn代码,github库里,code/lecture_2目录下 ③学完google机器学习速成课速成课(地址见本页面的入门必读) ④预习神经网络fastai第五课-反向传播与神经网络 | |
2018-05-* | 第三课 | 多标签分类,英文视频,中文版笔记 | Github代码 | - | 作业 | |
2018-05-* | 第四课 | NLP&推荐系统,英文视频,中文版笔记 | Github代码 | - | 作业 | |
2018-05-* | 第五课 | 从反向传播到神经网络,英文视频,中文版笔记 | Github代码 | github代码,ppt | 作业 | |
2018-05-* | 第六课 | 正则化卷积,英文视频,中文版笔记 | Github代码 | - | 作业 | |
2018-05-* | 第七课 | Resnets、GAN等,英文视频,中文版笔记 | Github代码 | - | 作业 | |
- | - | - | - | - | - | 作业 |
最新课程安排见project区,Fastai中文笔记,kaggle中文代码
课程内容-Contents
- 本教程以fastai的速成课为蓝本(注意:需要vpn,如果没有,请往下看,找bilibili上的视频)
-
如有问题,可以去SoAI论坛提问
- ppt资源
第一课 深度学习入门指南-Intro to Deep Learning
- 深度学习入门全貌,请仔细看
第二课 图像分类-Image Classification
- 主题:fastai课程的第一课进行讨论:图像分类。
- 时间:于4月27日星期日下午5点举行
- 地点:双清路77号院双清大厦4号楼4层清华数据科学研究院
议程:
- 介绍fastai第1课的必要资源,如何获取fastai的资源
- 学生现场演示第一课作业
- 自由问答, 遇到困难
视频资料:(来自哔哩哔哩)
作业汇总-Homework Summary
- 作业提交指南
- Homework
- 分线上和线下渠道,将自己的作业整理到github或colab,去project作业汇总区新建自己的卡片
- 也可以去Fast.AI论坛-SoAI区提问
- 【注意】如何在issue中提问
参考资料-References
CNN和CV
- iris数据集+机器学习实战
- CNN简介
- 计算机视觉
- CNN基本结构
- 应用
- 反思
结业答辩-Graduation presentations
介绍 Introduction
- 时间:2019-06-16
- 中文分支的往期内容及课件,见地址
- 答辩现场,由于学员较多,时间长,从16:00-19:40,衷心感谢各位坚持到最后
中文分支 Chinese branch
- 第一位 邢畅, xingchang, 16:07,学习总结,在地理信息系统里的应用
- 介绍了GIS领域的应用,整理了详细的学习笔记、脑图
- 第二位 张天奇,Tianqi.Zhang,16:27,kaggle比赛,基于新闻语料的股价涨跌预测,Eric Zhang
- 成绩:356/2800, ≈13%,4个人的团队,负责特征工程+多线程实现,xgboost主要负责分类
- 提问:
- xGBoost的原理,既可以用于分类,还可以用于回归
- 代码里将的metric用的是MSE,而xgb导入的是分类器,看似矛盾?
- 第三位 五个人,推荐资料:数学基础张宇36讲,课程内容回顾;
- 蒋宝尚,mnist的python实现,文本分析(大爆炸+华为+五月天)
- 周启红,学术文章关键词提取,学习过程中遇到的坑儿
- 王瑞华,视频汇报
- 第四位 黄安付,17:15,专题报告:fit_one_cycle()详解
- 优化算法,鞍点(saddle point),病态矩阵,粒子群算法
- 提问:动量解释,附加SGD系列优化算法演进,An overview of gradient descent optimization algorithms,How to Escape Saddle Points Efficiently,SGD算法比较,如下图,注意:v是动量部分,g是梯度部分
- 第五位 李靖华,17:36,学习总结
- git,学习方法总结
- 实习经历,4w张图片分类,用代码1天完成,做事情时先别急着动手
- 成功拿到创新工场的实习机会,新人到职场的华丽蜕变
- 总结
- 答辩里的几个技术点可以继续深挖:
- ①sgd各种算法演化,动量和梯度分别对应哪一块?这道题是新手的进阶题,打怪升级的典型门槛
- ②kaggle项目里的矛盾点要必要澄清下,基于新闻预测股价,为什么用xgb分类?特征工程部分可以继续系统化,不满足于简单的数据处理
- ③实习经历里的4w张图像标注任务可以补充描述下,说不定有更好的办法
- 答辩里的几个技术点可以继续深挖:
英文分支 English branch
- 张子涵, I wrote a short article with some doodling on neural networks and how they work. Here is the link if you want to check it out medium文章
- Mohamed Amine Aguir的Convolutional Neural Network
- Nabil Affo的Uber ride评论分类项目,jupyter代码, Medium文章Loss functions in machine learning and deep learning
- Alexander R Kivaisi, Categorizing Soccer Teams(代码见资料汇总区), Medium文章Data Augmentation
- Min Wang(汪敏)
- Yuanyuan,CFAIR-10图像分类
资料汇总-Resources
- 部分学员的答辩整理已收集到目录, 欢迎大家积极分享自己的资料,共同学习,添加方式,回复本帖
- Part of the resources have been collected to this address, it’s recommended to share your own ppt/code/post here by reply bellow, learn from each other
- 大部分基础知识以及扩展资料都在之前的课程ppt中,多看SoAI主页The School of AI Beijing,毕业了并不代表学完了,或者真的学好了,请大家有空多温习,少走弯路
交流分享-Share
欢迎大家入群分享、交流!
- Fast.AI论坛-SoAI北京区(英文为主)
- The School of AI 北京中文版 QQ群, 王奇文, 联系我?wqw547243068@163.com, qq: 547243068
合作方-Partners
- 大数据文摘+清华数据科学院研究院
- 举办地点:清华大学
- 时间:每周末一次,如想参加,请先文摘助手微信,往期海报如下: