- 注:本文源自github地址
鹤啸九天的技术资料
资料汇总
目录
注意:目录链接只能有一个#号
另外一种页面内链接方法:
点这里从头再读一遍
积累平时的代码
Github/编辑
名词解释
解释(代码引用示例之一)
select * from table where a=3 limit 10;
备注信息:
- Git简易指南,图说Git,git文件状态和工作区域
- 【2018-7-24】Git交互式在线学习,最好的实战教程,图例:
- github官方markdown指南
- github readme语法简介,【2018-6-10】github page jeklly主题,【2019-04-29】Jeklly主题大全
- MarkDown语法笔记(完整版)
- 马克飞象markdown语法在线测试
- Latex在线调试,吴文中数学公式编辑器,公式在线编辑,所见所得,支持图片输出
- github自带公式显示 \(f \left( x _ { n + 1 } \right) - f \left( x _ { n } \right) = f ^ { \prime } \left( x _ { n } \right) \left( x _ { n + 1 } - x _ { n } \right)\)
- latex4technics
-
知乎提供公式生成图片服务:https://www.zhihu.com/equation?tex=y+%3D+%5Cphi%28%5Csum+W_%7Bij%7DX_j+%2B+b%29+
- Markdown如何插入目录
- 【2019-03-17】富文本转markdown在线编辑器,可以讲html复制为markdown格式,自动转换链接,不用挨个复制,Markdown在线编辑器
- 看到一篇好文章,想发布到markdown博客上,结果,图片太多,人肉代价大,可以使用富文本编辑器转换,复制→粘贴→微调
- 【2023-2-6】markdown转微信公众号格式
- WXMarkdown
- 公众号 Phodal 专用编辑器
- 阿禅的knb:markdown转公众号外,还支持一键生成主题样式;免费,不支持图片上传
- Md2All: 支持 一键排版 、自定义css、80多种代码高亮。能让Markdown内容无需作任何调整就能一键复制到微信公众号、博客园、掘金、知乎、csdn、51cto、wordpress、hexo。。。等平台。支持把图片自动上传到云图床; 支持Latex数学公式在公众号等平台完美显示;支持生成带样式的html文件;甚至支持直接用原生的html,css排版。
- 壹伴助手(收费):壹伴助手插件是一款运行在浏览器上面的公众号运营管理插件,可直接搭载在公众号后台使用,无需跳转到第三方编辑器(这是个插件类似一个小软件,安装在浏览器里)。
- 秀米(部分收费):基础功能免费
- 135编辑器
- 【2020-02-11】Jekyll中支持Jupyter Notebook
- 【2020-2-14】Excel转markdown,源自多种格式(md,json,yaml,xml,html,csv,sql,latex等)之间转换表格(table),TableConvert
流程图: (代码引用示例之二)
可视化
地图数据可视化
- 地图汇
- 5min上手写echarts第一个图标,echarts如何从json文件读数据?
- 【2017-7-30】Google开发的数据可视化web工具Facet Dive,【2018-3-13】可以嵌入jupyter notebook做特征工程可视化分析, 安装方法参考PAIR-CODE,Google AI,【2018-9-11】集成到tensorboard工具中:what-if,【2020-1-8】北京大学高维数据可视化
- [2018-6-15]数据挖掘软件:weka适用于EDA探索性数据分析,Orange数据挖掘和机器学习软件
- 北大可视化,词云生成图悦
- [2018-2-28] OLAP可视化分析工具,官网,saiku社区版,安装方法,简介,Kylin, Mondrian, Saiku系统的整合,saiku安装教程
- 【2018-3-5】python+echarts给你的数据做美颜,pycharts安装,官方文档,jupyter notebook中使用pycharts,github代码完整示例,【2019-05-22】pyechart旧版绘图参数介绍-官网没有,效果示例:
- 【2018-9-27】vue组件demo网站,Element UI组件库
- 【2018-9-27】从输入 URL 到页面显示都发生了什么?英文原版,浏览器输入URL后发生了什么
- 深入,浏览器工作原理,浏览器的工作原理:新式网络浏览器幕后揭秘
- 【2018-9-27】在线简历-动态
- 【2018-12-17】python Django快速搭建博客,【2019-10-10】Django官方中文教程
学习资料
学习技巧
- @爱可可-爱生活(新浪微博):
- 互联时代怎么阅读?
- 读书重在结构生长,形成扎实的支撑;
- 碎片阅读重在视野的纳新和扩展,开枝散叶;
- 思考重在提炼和关联,勾画错综的经脉。
- 学习就是如此,由外而内,无广不精,无博不深,但能坚持必有所成。
- 网络阅读的最佳实践,不在“取”,在“舍”,知舍才能知关键,料不在多,有感悟一二足矣。
- 费曼技巧:通过向别人清楚地解说一件事,来确认自己真的弄懂了这件事。参考:号称终极快速学习法的费曼技巧,究竟是什么样的学习方法?
- 学习金字塔
- 【2018-7-27】什么是博士?来自知乎帖子:学位到底有多重要,硕士学位与博士学位的差距有多大
- 【2019-08-19】
所有的优越感都不是来自容貌、身材、知识、家族、财富、地位、成就和权利,它只来自缺见识和缺悲悯。 《三体》:“弱小和无知不是生存的障碍,傲慢才是”.
附:
- 读书的意义
- 不读书的人,看到的只是别人画给他看的美好世界;
- 读了书之后,你认识了黑暗和丑陋;
- 只有读了更多的书之后,你就站在了巨人的肩上,看到了希望和光明
- 【2021-12-24】王国维《人间词话》人生三境界。古今之成大事业、大学问者,必经过三种之境界:
- ①昨夜西风凋碧树,独上高楼,望尽天涯路。此第一境界。
- ②衣带渐宽终不悔,为伊消得人憔悴。此第二境界。
- ③众里寻他千百度,蓦然回首,那人却在,灯火阑珊处。此第三境界也。
数学基础
- 【2019-09-29】21张GIF动图让你轻松了解各种数学概念
- 【2019-06-18】数学基础概率,来自:深度学习知识大全
- 【2018-12-16】一图解释数学体系-数学深渊
- 可微可导可积连续之间的关系
- 【2019-04-30】微积分的本质
- 如何通俗讲解放射变换?
- 在线几何作图GeoGebra(源自 马同学高等数学)
- 3Blue1Brown出品(接受捐助):线性代数的本质-Essence of Linear Algebra-视频教程,Bilibili上《线性代数本质》双语视频教程.文字版,类似视频还有微积分本质,笔记.制作教学视频的代码
- 【2021-2-20】国外通俗易懂讲解数学betterexplained
- 【2019-10-24】马同学高等数学-线性代数学习笔记,【2019-12-31】交互式线性代数-Interactive Linear Algebra -【2018-9-4】Google出品:动图解释反向传播
- 行列式的本质(马同学高等数学).《数学拾遗》英文版百度云地址.
- 矩阵分解(加法偏),矩阵分解(乘法篇),很不错
- 如何通俗的解释放射变换,生动讲解矩阵的空间变换:平移、缩放、旋转、对称(xy或原点)、错切、组合。行列式的本质是什么?—万门大学童哲的解释:行列式就是线性变换的放大率!理解了行列式的物理意义,很多性质你根本就瞬间理解到忘不了!
- 【2018-8-17】广义线性模型是什么鬼?
- 行列式:行列式,记作 det(A),是一个将方阵 A 映射到实数的函数。行列式等于矩阵特 征值的乘积。行列式的绝对值可以用来衡量矩阵参与矩阵乘法后空间扩大或者缩小 了多少。如果行列式是 0,那么空间至少沿着某一维完全收缩了,使其失去了所有的 体积。如果行列式是 1,那么这个转换保持空间体积不变
- 【2017-11-24】遇见数学:图解线性代数
- 六大概率分布
- 最优化算法-避开鞍点
- 【2018-11-15】数说工作室:概率论-上帝的赌术,协和八:说人话的统计学,做统计,多少数据才算够,【2018-5-20】【精华】说人话的统计学-合集,【2019-08-30】统计之都,【2020-3-11】概率统计思维的建立
- 频率学派与贝叶斯学派之争:知乎网友解释,频率学派最先出现,疯狂打压新生的贝叶斯学派,贝叶斯很凄惨,就跟艺术圈的梵高一样,死后的论文才被自己的学生发表,经过拉普拉斯之手发扬光大,目前二派就像华山派的剑宗和气宗。频率学派挺煞笔的,非得做大量实验才能给出结论,比如你今年高考考上北大的概率是多少啊?频率学派就让你考100次,然后用考上的次数除以100。而贝叶斯学派会找几个高考特级教师对你进行一下考前测验和评估,然后让这几个教师给出一个主观的可能性,比如说:你有9成的把握考上北大。
- 这个区别说大也大,说小也小。(1)往大里说,世界观就不同,频率派认为参数是客观存在,不会改变,虽然未知,但却是固定值;贝叶斯派则认为参数是随机值,因为没有观察到,那么和是一个随机数也没有什么区别,因此参数也可以有分布,个人认为这个和量子力学某些观点不谋而合。(2) 往小处说,频率派最常关心的是似然函数,而贝叶斯派最常关心的是后验分布。我们会发现,后验分布其实就是似然函数乘以先验分布再normalize一下使其积分到1。因此两者的很多方法都是相通的。贝叶斯派因为所有的参数都是随机变量,都有分布,因此可以使用一些基于采样的方法(如MCMC)使得我们更容易构建复杂模型。频率派的优点则是没有假设一个先验分布,因此更加客观,也更加无偏,在一些保守的领域(比如制药业、法律)比贝叶斯方法更受到信任。
- 频率 vs 贝叶斯 = P(X;w) vs P(X|w) 或 P(X,w)
- 频率学派认为参数固定,通过无数字实验可以估计出参数值——客观;
- 贝叶斯学派认为参数和数据都是随机的,参数也服从一定的分布,需要借助经验——主观
- 【2018-8-13】贝叶斯概率模型一览,贝叶斯概率-精简讲解
- 【2018-8-16】可视化讲解贝叶斯推断
- 【2018-9-7】深度学习与贝叶斯暑期培训教程DeepBayes,含ppt、视频,github地址:Seminars DeepBayes Summer School 2018,video视频,slides资料
- 【2018-11-30】透彻理解马尔科夫蒙特卡洛,马尔科夫链可视化讲解Markov Chains
- 【2018-11-29】透彻理解最大似然估计
- 统计学基础知识【脑图笔记】
- 大矩阵相乘:分布式版本,MapReduce实现矩阵相乘,Hadoop实现大矩阵相乘之我见
- A大B小(内存受限)
- AB都大(内存受限)
- 不受内存限制(最小粒度)
- Colah的Visual Information Theory,中文翻译
- 【2017-11-24】遇见数学,图解普林斯顿微积分系列
- 【2018-8-16】精品:可视化交互式讲解概率论
- 【2018-9-25】数学的深渊图
- 【2018-9-30】再谈MCMC方法
- 【2018-11-30】理科生大战心灵鸡汤,20个数学案例
- 【2019-04-09】可交互数学课本Mathigon,github地址
- 【2019-07-09】精品:傅里叶变换交互式入门
- 【2019-07-15】马同学高等数学:如何通俗讲解牛顿法
- 切线方程: \(f \left( x _ { n + 1 } \right) - f \left( x _ { n } \right) = f ^ { \prime } \left( x _ { n } \right) \left( x _ { n + 1 } - x _ { n } \right)\)
- 【2019-11-20】变分法的基本问题:最速下降线,浙大ppt:泛函与变分原理
- 【2020-6-30】化繁为简,一张图梳理梯度、散度、旋度、Jacobian、Hessian、Laplacian
- 图中的细实线箭头表示了四种一阶微分运算,包括梯度、散度、旋度和 Jacobian。
- 每条箭头的起点表示了相应运算的自变量的类型,终点表示了相应运算的因变量的类型,例如梯度运算是作用在标量上的,结果是向量。
- 图中的「向量」默认为列向量
- 【2020-8-27】博弈论速成指南,融入深度学习的经典想法和新思路
- 五元素标准有助于理解 AI 环境中的游戏动态,即对称 vs 非对称、完美信息 vs 非完美信息、合作 vs 非合作、同时 vs 序列和零和 vs 非零和。
- 对称博弈统治 AI 世界,其中大多数基于 20 世纪最著名的数学理论之一:纳什均衡
- 博弈论中正在影响机器学习的新想法:平均场博弈、随机博弈、演化博弈
- 【2020-10-12】Essentials of Mathematical Methods
- 全书总共 33 章分成六个部分:
- Mathematical Foundations(数学基础)
- Mathematical Optimization Methods(数学优化方法)
- Classical Statistical Methods(经典统计方法)
- Dynamics Modeling Methods(动力系统建模方法)
- Statistical Learning Methods(统计学习方法)
- Optimal Control and Reinforcement Learning Methods(最优控制和强化学习方法)
计算机基础
- 【2018-5-1】数据结构总结篇_
- 排序算法总结:视觉感受常见排序算法
- 【2017-8-1】排序算法可视化对比Sorting Algorithms Animations,日本程序猿做的排序动画,舞动的排序算法【舞蹈视频】
- 【2018-4-28】算法可视化网站Visualgo,包含动画演示+伪代码,旧金山大学的数据结构算法可视化
- 【2019-05-30】基础算法可视化algorithm-visualizer,GitHub地址,演示地址
- 【2019-06-18】算法导论C++实现
- 海量数据处理算法总结【超详解】
- 水库抽样算法精简,空间亚线性算法
- 【2019-07-18】逆采样(Inverse Sampling)和拒绝采样(Reject Sampling)原理
- 【2019-06-06】程序员小吴的图解Leetcode
- 【2019-06-10】LeetCode 代码实现
- 【2019-06-18】代码体系概览,摘自Leetcode题集
- 【2020-2-8】清华大神分享的信息学竞赛资料
- 【2019-11-13】计算机编程史
分布式计算
推荐系统
- 项亮:关于LDA,pLSA,SVD和Word2vector的一些看法:
- SVD算法是指在SVD的基础上引入隐式反馈,使用用户的历史浏览数据、用户历史评分数据、电影的历史浏览数据、电影的历史评分数据等作为新的参数
- LSA最初是用在语义检索上,为了解决一词多义和一义多词的问题,将词语(term)中的concept提取出来,建立一个词语和概念的关联关系(t-c relationship),这样一个文档就能表示成为概念的向量。这样输入一段检索词之后,就可以先将检索词转换为概念,再通过概念去匹配文档。在实际实现这个思想时,LSA使用了SVD分解的数学手段.x=TSD
- PLSA和LSA基础思想是相同的,都是希望能从term中抽象出概念,但是具体实现的方法不相同。PLSA使用了概率模型,并且使用EM算法来估计P(t|c)和P(c|d)矩阵.LDA是pLSA的generalization:一方面LDA的hyperparameter设为特定值的时候,就specialize成pLSA了
- NMF:一种矩阵分解,要求输入矩阵元素非负,目标和 SVD 一样。
- pLSA:SVD 的一种概率解释方法——要求矩阵元素是非负整数。
- LDA:pLSA 加上 topics 的 Dirichlet 先验分布后得到的 Bayesian model,数学上更漂亮。
- 为什么是 Dirichlet 先验分布,主要是利用了 Dirichlet 和 multinomial 分布的共轭性,方便计算。
- 【2018-8-2】LDA:无监督,文本主题模型,pLSA的贝叶斯版本。【精】一文详解主题模型LDA,简述LDA主题模型
- 从item-base到svd再到rbm,多种Collaborative Filtering(协同过滤算法)从原理到实现
- 案例分享:世纪佳缘推荐系统经验分享
- 《推荐系统实践》阅读笔记:LFM模型、图模型、slop one和SVD算法
- 实时推荐系统
- 【2019-04-22】从FM推演各深度CTR预估模型-含代码,覆盖CTR预估的前因后果,FM,DeepFM, NFM, DIN, AFM, DCN
- 【2020-3-27】谷歌、阿里们的杀手锏:三大领域,十大深度学习CTR模型演化图谱
- 【2020-3-27】CTR预估发展图谱
机器学习
特征工程
- 江湖名言:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
- 知乎:特征工程到底是什么
- 使用sklearn做特征工程
- 使用python进行描述性统计
- 使用sklearn优雅的进行数据挖掘
- 使用sklearn进行集成学习:理论,实践 特征工程常用方法:
- 不平衡数据集如何处理?研究表明,在某些应用下,1∶35的比例就会使某些分类方法无效,甚至1∶10的比例也会使某些分类方法无效。
- 分类问题中不平衡数据集的解决方案,正负样本玄虚
- 1.过抽样:简单赋值负样本——最常用,容易过拟合,SVM模型里用途不大
- 2.欠抽样:随机减少正样本——造成信息丢失
- 3.算法层面:(1)重构训练集,按错分代价对训练集重构(2)代价敏感函数,大样本高代价,小样本低代价
- 4.特征选择:选取有区分度的特征
- 解决真实世界的问题:如何在不平衡数据集上使用机器学习,非平衡数据机器学习,【2019-04-25】如何处理机器学习中的不平衡类别问题-含代码实现
- 【2017-12-25】知乎:机器学习中的测试机和训练集如何划分?,与时间强相关的问题需要按照时间划分,否则(大部分ML问题)应该随机抽样,与时间无关(应用了未来函数)。随机划分保证了训练集和测试集的历史场景是类似的,就类似于这些数据都是同一台机器同一时期产生的两类数据集。这样计算出的准确率能最真实的反映模型对这段数据学习的效果
- 【2018-4-8】【(Google)机器学习全面入门(96页)】《Jason’s Machine Learning 101》by Jason Mayes, ppt展示google机器学习+深度学习中的应用,含视频
- 【2018-4-15】Google机器学习43条军规,中文版,原版,【2019-10-09】Google机器学习漫画
- 【2020-5-4】机器学习顶会上的讲座汇总:A Collection of Conference & School Notes in Machine Learning -【2018-5-4】SAP的梁劲(Jim Liang)整理的从基础概念到数学公式,这是一份520页的机器学习笔记(图文并茂),百度云地址,Dropbox地址
- 【2018-5-18】《Random Forests - What, Why, And How》by Andy Liaw, 随机森林解析
- 【2019-10-24】徐亦达机器学习:Variational Inference Basics 变分推断基础【2015年版-全集】,相关论文-变分推断综述 Variational Inference: A Review for Statisticians,知乎:如何通俗易懂的理解变分推断
- 【2020-8-20】Amazon免费在线机器学习课程 #bilibili#搬运:
基本概念
- 【2018-10-25】偏差(Bias)与方差(Variance), E = B^2 + V + e
- $E=B^2+V+e$
- ,
- 【2019-09-27】机器学习白板推导
- 【2020-3-26】概念漂移:为什么机器学习模型会逐步退化?
算法总结
- 微软-ML算法指南:pdf版下载地址
- 详细讲解How to choose algorithms for Microsoft Azure Machine Learning
- 【2020-7-15】新版
- scikit-learn官方总结,Scikit-learn Cookbook:英文本,中文译本,MarkDown格式。【2018-6-12】scikit-learn中文翻译版,主页,scikit-learn网页版,Github版,wiki版,视频版。sklearn库中文版完全手册下载
- 【2017-12-20】Dlib机器学习指南,方法选择:,中文版,dlib中文指南-图
- 算法对比 《统计学习方法》总结:【2019-1-23】Python代码,【2020-6-26】北大研究生的代码实现,第二版课件下载,【2019-11-11】清华教授配套的课件-百度云
- xgboost: 速度快效果好的boosting模型
- 最优化:各种优化算法对比
- 最优化:各种优化算法对比
- 【2017-8-30】SGD comparision
- SGD,Adagrad,Adadelta,Adam等优化方法总结和比较,An overview of gradient descent optimization algorithms
- 为什么更偏爱随机梯度下降
- 【2017-7-31】10686 一次 CTC-RNN 调参经历
- 【2018-3-5】google 出品的机器学习速成课程,基于tensorflow
- 谷歌新出的jupyter开发环境,免费试用GPU,试用谷歌账号即可,google colaboratory,colaboratory简介,【2019-02-13】Google的colaboratory支持直接从github中导入笔记,地址 , 【2018-11-19】Tensorflow官网中文版,【2019-10-09】简单粗暴 TensorFlow 2.0,pdf,tf.wiki中文社区下载地址,github,【2019-11-18】龙龙:tensorflow 2.0免费教程书籍,tensorflow 2.0实战-Deep-Learning-with-TensorFlow-book
- 【2019-06-19】华校专,AI算法工程师手册,包含各类精简笔记
- 【2020-8-31】30天吃掉那只TensorFlow2
异常检测
- IsolationForest。欺诈等是一系列的异常孤立点,而IsolationForest则是检测这类孤立点的一个有效算法。无需样本标记、线性时间复杂度。一般情况下要比OneClasSVM等表现要好。尤其是对非高斯分布的样本空间。
- 【2017-7-31】反欺诈(Fraud Detection)中所用到的机器学习模型有哪些?:
- (1)可视化:相关矩阵+多维尺度变换
- (2)算法模型:时序相关(时间序列分析)、时序无关(无监督学习Isolation Forest、监督学习one-class SVM、统计学密度估计)
- 【2018-9-12】python异常检测工具包pydor
- 【2020-3-7】图解异常检测,Anomaly detection with Keras, TensorFlow, and Deep Learning
机器学习经验总结
- Google机器学习经验总结
- pluskid总结的SVM系列文章(浙大计算机,MIT博士,跟陈天奇和李沐一块做过Mxnet)
- 【2017-8-22】【非常好的web讲解】可视化机器学习(决策树讲解)
- 【2017-8-22】剑桥大学的书籍Introduction to Machine Learning
- 【2017-8-22】Machine Learning is Fun!系列教程。Part 3:Deep Learning and Convolutional Neural Networks,中文翻译:第三章:图像识别【鸟or飞机】?深度学习与卷积神经网络
- 【2017-9-2】维数灾难:精华,维数诅咒,原文The Curse of Dimensionality in classification intel机器学习课程
- 【2017-12-9】Intel AI机器学习课程资料
- 【2017-12-22】图解机器学习(含动图)【2019-04-24】布朗学院出品:交互式图解人工智能AI,【2019-08-16】可视化讲解神经网络基础
- 【2017-12-22】knn原理及代码实现(含kd树),详解kd树
- 【2018-3-23】概率图模型体系:HMM、MEMM、CRF,精华
- 【2019-11-26】概率图演变过程(概率图模型学习笔记,博主有几篇很好的NLP方面的论文读后感)
- 【2018-7-6】Bayesian Methods in Machine Learning – Spring 2018,机器学习中的贝叶斯方法,涉及贝叶斯调参,Radford M. Neal的Bayesian Methods for Machine Learning
- 【2018-7-26】机器学习笔试题精选,原文45 questions to test a Data Scientist on Regression,
- 【2018-7-28】世界最大外文电子书搜索引擎B-OK,【2019-11-08】原猛犸浏览器团队开发的,基于ML的搜索引擎:Magi,使用说明,类似wolfram alpha,其它搜索引擎:俄罗斯的Yandex,不跟踪用户的duckduckgo
- 【20201-13】怎样量化评价搜索引擎的结果质量
- 【2018-8-16】机器学习在线交互式Demo集锦,“Interactive Machine Learning, Deep Learning and Statistics websites”
- 【2018-8-20】机器学习简易入门教程(结合scikit-learn)
- 【2018-8-26】机器学习笔试精选100题(含详细解答)
- 【2018-9-7】8月30日出来的新书:可解释的机器学习Interpretable Machine Learning,破解黑盒秘密。【2020-5-9】中文翻译版本出炉:可解释的机器学习–黑盒模型可解释性理解指南
- 【2018-10-29】机器学习500问
- 【2018-11-15】优质自媒体:数说工作室网页版,分类战车SVM
- 【2018-11-15】机器学习十二大经验和准则
- 【2020-7-26】德国机器学习暑期学校-The Machine Learning Summer School
集成学习
- 多模型stack方法。参考房价预测解决方案
- bagging,boosting,stacking ,集成学习原理详解,一文读懂集成学习,集成学习Ensemble Learning与树模型、Bagging 和 Boosting、模型融合
- ,
- ,
- 【2018-9-14】使用sklearn进行集成学习
- 【2018-11-27】PRML官方英文版下载地址,【2020-3-4】PRML配套python代码
流形学习
- 什么是
流形学习
?传统的机器学习方法中,数据点和数据点之间的距离和映射函数f都是定义在欧式空间中的,然而在实际情况中,这些数据点可能不是分布在欧式空间中的,因此传统欧式空间的度量难以用于真实世界的非线性数据,从而需要对数据的分布引入新的假设。流形(Manifold)是局部具有欧式空间性质的空间,包括各种纬度的曲线曲面,例如球体、弯曲的平面等。流形是线性子空间的一种非线性推广。参考流形学习的简单介绍 流形学习
:本质上,流形学习
就是给数据降维的过程。这里假设数据是一个随机样本,采样自一个高维欧氏空间中的流形(manifold),流形学习的任务就是把这个高维流形映射到一个低维(例如2维)的空间里。流形学习可以分为线性算法和非线性算法,前者包括主成分分析(PCA)和线性判别分析(LDA),后者包括等距映射(Isomap),拉普拉斯特征映射(LE)等。流形学习可以用于特征的降维和提取,为后续的基于特征的分析,如聚类和分类,做铺垫,也可以直接应用于数据可视化等。注:摘自集智百科流形学习(优质,包含代码及案例)。- 拟合线性的流形学习模型:LLE, LTSA, Hessian LLE, 和Modified LLE
- 拟合非线性的流形学习模型:Isomap,MDS和Spectral Embedding
- 效果示意如下:
- 浙大何晓飞的流形学习ppt,讲的很清楚,全面,最佳资料
降维
常见的pca属于无监督,lda有监督,常用降维方法如下图。【2017-12-28】【精华】PCA可视化讲解
- t-SNE是深度学习大牛Hinton和lvdmaaten(他的弟子?)在2008年提出的,lvdmaaten对t-SNE有个主页介绍:tsne,包括论文以及各种编程语言的实现,t-SNE是非线性方法,非常适用于高维数据降维到2维或者3维,进行可视化,具体参考:t-SNE完整笔记(优质,含Python代码实现),t-SNE原理及python实现.t-SNE交互体验:How to Use t-SNE Effectively;t-SNE CSV web demo,可以直接输入csv数据,【2019-06-24】t-SNE 60min简介,覆盖基础、学术和工程
- [2018-1-29]从SNE到t-SNE再到LargeVis,t-SNE原理最佳资料,深刻讲解
- 其他方法参考流形学习,MNIST数据集降维可视化效果展示(经典). Google高维数据交互可视化Web页面,(TensorBoard 的一个内置的可视化工具 Embedding Projector,可以上传数据文件)
- ,【2018-1-22】手写汉字识别
- 参考:TensorFlow-7-TensorBoard Embedding可视化
- 【2018-8-16】腾讯技术博客火光摇曳的文章:VC维的来龙去脉
- 【2019-2-9】股票预测-随机差分-含代码
- 【2019-07-04】聚类算法对比,sklearn可视化对比
深度学习
- 【2019-06-18】深度学习资料大全
- 【2019-08-31】一份简短的深度学习笔记
- 【2018-3-30】越南学生整理的斯坦福AI课程生存指南A survivor’s guide to Artificial Intelligence courses at Stanford (Updated Feb 2020)
什么是神经网络
- 【2019-04-30】what is a Neural Network,Youtube地址
- 【2019-07-15】神经网络分类面到底什么样?可交互
神经网络发展历史
- 重磅!神经网络浅讲:从神经元到深度学习,brief history of neural network-figure
- 图片源自ANN简介
- 【2019-03-21】漫画人工智能简史
- 【2019-10-24】人工智能哲学笔记
神经网络网络结构变化
- 当然,光有强大的内在能力,并不一定能成功。一个成功的技术与方法,不仅需要内因的作用,还需要时势与环境的配合。神经网络的发展背后的外在原因可以被总结为:更强的计算性能,更多的数据,以及更好的训练方法。只有满足这些条件时,神经网络的函数拟合能力才能得已体现 -【2017-8-7】The mostly complete chart of Neural Networks, explained,神经网络结构大全
- 【2019-04-30】神经网络3D仿真视频
- 【2017-12-23】神经网络原理视频(十分直观形象),包含3部分,直观理解反向传播
- 【2019-05-07】神经网络结构可视化
- 【2021-3-9】高颜值的神经网络可视化工具:3D、彩色、可定制,还能可视化参数重要性,神经网络可视化工具nn_vis
- 【2019-10-19】人工智能十大里程碑
深度学习大牛
- Geoffrey Hinton :深度学习鼻祖
- Yann Lecun(杨立昆),CNN发明人,Goeffery Hinton的学生,首创LeNet
- Yoshua Bengio :也是深度学习
- Andrew Ng :Hinton的合作伙伴。coursera公开课,Andrew Ng: Deep Learning, Self-Taught Learning and Unsupervised Feature Learning,《MACHINE LEARNING YEARNING》翻译,【2018-10-24】中文翻译版github
- 深度学习四大天王及其关系
-
- Yann Lecun(杨立昆),CNN发明人,Goeffery Hinton的学生,首创LeNet -
- LeNet-5手写数字识别示意图,CNN手写数字识别实时3D交互,能看到详细的参数(非常直观),【2017-8-8】更令人震惊的3D模拟效果(视频)Neural Network 3D Simulation,制作方官网提供的解释,实时视频中的CNN各层效果What convolutional neural networks see,Deep Visualization Toolbox
- 【2020-5-6】CNN训练过程交互可视化,华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器,如下:
- 【2018-7-23】keras.js实现的web端mnist识别Demo包含各种pre-trained模型
- 可视化资料:Google PlayGround神经网络训练在线演示
- 【2017-12-28】汉化版,好玩的神经网络,来自Tensorflow教程网. ConvNetJS两层神经网络实时训练和可视化(可定制网络结构,看隐层空间,作者是Andrej Karpathy),Andrej Karpathy的其他Demo主页
- 【2018-11-30】3D模型可视化框架:TensorSpace:超酷炫3D神经网络可视化框架,
- 【2019-03-19】TensorEditor: 一个小白都能快速玩转的神经网络搭建工具
- 神经网络可视化-LaTeX,【2018-3-21】2分钟论文-用 谷歌「AI可解释性」看懂机器学习,Building Blocks of AI Interpretability- Two Minute Papers #234,可视化展示Web地址The Building Blocks of Interpretability
- 资料:Deep Learning(ppt),Manifold
- Google AI实验室,包含多种AI Demo(手写预测,卷积网络可视化,高维数据可视化,autodraw,quickdraw,摄像头物品识别,声音合成,实物翻译,手势控制)。
- 【2017-12-26】AI人工智能不断前进,看神经网络如何玩超级玛丽(视频)
- 【2017-11-24】卷积核效果在线实验
- 【2017-9-8】Data Science and Robots,Brandon Rohrer.How Deep Neural Networks Work,ppt
- [2017-9-13]Lighthouse:smart camera,video: the future of home
- 【2017-10-11】吴恩达眼中的深度学习七雄
- 【2020-7-26】吴恩达机器学习落地应用指南,30页ppt;Machine Learning Yearning 中文版
- 斯坦福大学机器学习斯坦福大学机器学习第十课“应用机器学习的建议(Advice for applying machine learning)”学习笔记,本次课程主要包括7部分:
- 1) Deciding what to try next(决定下一步该如何做)
- 2) Evaluating a hypothesis(评估假设)
- 3) Model selection and training/validation/test sets(模型选择和训练/验证/测试集)
- 4) Diagnosing bias vs. variance(诊断偏差和方差)
- 5) Regularization and bias/variance(正则化和偏差/方差)
- 6) Learning curves(学习曲线)
- 7) Deciding what to try next (revisited)(再次决定下一步该做什么)
- 【2017-12-22】李沐:博士这五年,动手学深度学习,GPU购买指南,【2018-10-16】博士五年之后五年的总结
- 【2018-7-22】王飞跃教授IJCAI申办记录
- 【2017-8-30】45个问题测出你的深度学习基本功,45 Questions to test a data scientist on basics of Deep Learning (along with solution),深度学习笔试题,神经网络笔试题
- 【2018-11-20】一图概括深度学习核心知识点,如下:
- 【2019-06-18】清华顾险峰(丘成桐学生)的深度学习的几何观点
深度学习书籍
几本有名的书籍:
- 【2017-8-5】Neural Network and Deep Learning(神经网络与深度学习)
- Michael Nielsen,这本书通俗易懂,由浅入深,细致讲解了神经网络,英文版(官网),配套Code,中文版CSDN下载地址,书籍开源,作者求捐助5美元,GitBook中文翻译地址
-【2017-12-13】Deep learning(AI圣经)。
- (1)Deep Learning中文版,英文版,官方slides地址,github中文读书笔记,Deep Learning presented by Ian Goodfellow现场版(youtube).无法翻墙?看bilibili版本
- (2)雷锋网读书会历次分享集合:Deep Learning解读合辑,更完整的集合AI研习社公开课年度盘点
- (3)清华读书会分享笔记(pdf),【2019-05-09】配套代码
时间 | 类型 | 名称 | 备注 |
---|---|---|---|
Andrew NG | cs229:Andrew NG斯坦福机器学习网易公开课 | 中文字幕 | |
台大林轩田 | Machine Learning Foundations官方ppt,Machine Learning Techniques官方ppt,机器学习基石bilibili地址,机器学习技法bilibili视频地址,机器学习基石百度云链接 密码:30p0,机器学习技法百度云链接,密码:nh16 | 【2018-8-16】AI有道,红色石头精心整理-林轩田机器学习资源汇总,Learning from data下载地址 | |
Hinton | 机器学习和神经网络,网易云课堂 | ||
chris manning | 斯坦福2017季CS224n深度学习自然语言处理课程 | 【2019-07-25】CS224U: Natural Language Understanding | |
李宏毅 | 李宏毅Machine Learning (2017,秋,台湾大学) | ||
陈蕴侬 | 台大陈蕴侬老师的深度学习课程。课程主页,PPT链接 | 2020年新出的课程 | |
牛津 | 深度学习NLP(牛津大学 2017)(英文字幕)bilibili地址 | ||
andrew ng | deeplearning.ai,神经网络和深度学习,bilibili地址,bilibili汉化系列,黄海广博士写的学习笔记,源自AI初学者–(机器学习爱好者),2014斯坦福机器学习,【2018-9-13】Super VIP Cheatsheet: Machine Learning,深度学习 | deeplearning.ai | |
andrew ng | 《MACHINE LEARNING YEARNING》翻译, | 2018-4-23 | |
Ian good fellow | 《深度学习》读书会分享视频集,bilibili地址 | ||
普林斯顿 | 普林斯顿-算法 | ||
吴恩达 | DeepLearning.ai学习笔记彩绘版,百度云地址 | 很好的资料,作者TessFerrandez的信息图地址,相关github地址,AI Transformation Playbook-AI转型指南 | |
Google AI 教学系列片 《Cloud AI Adventures》 | |||
机器学习概念图示 | 来自Chris Albon博士,英文原版需要12$,中文版百度网盘地址(密码:hje1)由大数据文摘提供 | 参考资料:300张小抄表搞定机器学习知识点 | |
语音识别实践 | 解析深度学习:语音识别实践,pdf | 备份pdf链接 | |
集成学习 | 周志华:集成学习方法,Ensemble methods Foundations and Algorithms | 下载地址:人大经管论坛,腾讯微云,fee8kn | CNCC 2016 周志华 57 张 PPT 揭开机器学习本质,西瓜书相关公式、代码实现,【2019-08-22】西瓜书-学习笔记,【2020-6-17】新书:机器学习理论导引 |
Judea Pearl | The book of why,电子版 | ||
邓力、刘洋 | 【2018-11-9】Deep Learning in Natural Language Processing | ||
Artificial Intelligence: A Modern Approach | |||
Convex Optimization | 【2019-08-08】凸优化:算法与复杂度,B站 | ||
Deep Learning Fundamentals: An Introduction for Beginners | |||
Optimization in Operations Research | |||
Artificial Intelligence: A Modern Approach | 参考AI算法8本书 | ||
复旦邱锡鹏教授 | 【2019-04-09】神经网络与深度学习-pdf | ||
伯克利 | 【2019-04-28】Spring 2019 Full Stack Deep Learning Bootcamp,伯克利-全栈深度学习课程 | 覆盖面很广,很有价值 | |
伯克利 | 【2020-7-26】机器学习全面指南 | A Comprehensive Guide to Machine Learning | |
Google研究员Kevin P. Murphy | Machine learning: a probabilistic perspective,pdf | github code |
大神博客
- Andrej Karpathy博客,Colah’s Blog,Neural Networks, Manifolds, and Topology,Understanding LSTM Networks,印度人总结的cnn笔记
- 如何简单有趣的讲解神经网络(优质),什么是人工神经网络(数学模拟过程清晰)
- 一文读懂深度学习,深度学习:像人脑一样深层次思考
- Deep Learning(深度学习)学习笔记整理第一部分,第二部分,第三部分,第四部分,第五部分,第六部分,第七部分,第八部分
- 深度学习为何要深?,超智能体gitbook,台大李宏毅:一天搞懂深度学习,CNN原理3D交互演示-MNIST,CMU备份地址
- 【2017-8-6】Andrew NG, 优质ppt Machine Learning and AI via brain simulations
- 【TensorFlow】:Gentlest Introduction to Tensorflow-日本人Khor SoonHin,中文翻译版:小白也能懂的TensorFlow介绍上,下;CS 20SI: Tensorflow for Deep Learning Research,TensorBoard使用方法,introduction-to-tensorflow(PPT)
- 【2018-1-5】没有博士学位,照样玩转TensorFlow深度学习
- 作者斯坦福学生Chin Huyen, Yann LeCun连发三弹:人人都懂的深度学习基本原理(附视频),【2019-04-28】Deep Learning Zero to All, Tensorflow教程Youtube视频,Github代码
- 【2019-05-11】香港科技大学教授Sung Kim的pytorch速成课,Github代码,PPT,youtube视频.全面解读PyTorch内部机制
- 上海复旦大学吴立德教授的《深度学习课程》,张俊林:深度学习在搜索推荐领域的应用
- 深度学习,从神经元到深度学习,神经网络与深度学习:英文网址,中文版下载地址
- 【2017-8-1】反向传播神经网络极简入门(含python代码实现)。Colah的Calculus on Computational Graphs: Backpropagation.
- 1974年有个Harvard博士生Paul Werbos首次提出了backprop,不过没人理他。1986年,Rumelhart和Hinton一起重新发现了backprop,并且有效训练了一些浅层网络,一下子开始有了名气。那个时候的backprop从现在看来并不是个很清晰的概念,把梯度和更新一块打包了。(知乎達聞西)。论文:Rumelhart D E, Hinton G E, Williams R J. Learning representations by back-propagating errors[M]. MIT Press, Cambridge, MA, USA, 1988.
- BP算法解释(多图):Principles of training multi-layer neural network using backpropagation。BP算法推导,A Gentle Introduction to Artificial Neural Networks,一文弄懂神经网络中的反向传播法——BackPropagation,如何直观地解释 back propagation 算法?
- 寒小阳:深度学习视频
- 【2017-8-22】非常好的机器学习/深度学习系列教程:Machine Learning is Fun,作者Adam Geitgey,知乎专栏中文翻译(来自混沌巡洋舰),系列:
- 第一章:最简入门指南
- 第二章:用机器学习制作超级马里奥关卡
- 第三章:图像识别,鸟还是飞机?深度学习与卷积网络
- 第四章:用深度学习识别人脸
- 第五章:谷歌翻译背后的黑科技:神经网络和端到端学习,Machine Learning is Fun Part 5: Language Translation with Deep Learning and the Magic of Sequences
- 第六章:如何用深度学习进行语音识别?,Machine Learning is Fun Part 6: How to do Speech Recognition with Deep Learning
- 第七章:未翻译,Machine Learning is Fun Part 7: Abusing Generative Adversarial Networks to Make 8-bit Pixel Art
- 第八章:未翻译,Machine Learning is Fun Part 8: How to Intentionally Trick Neural Networks
- [2017-8-23]MRSA KaiMing HeTutorial: Deep Learning for Objects and Scenes
- [2017-8-23]Machine Learning Mindmap / Cheatsheet,sklearn,Data Science, Classification Analysis Jupyter notebook
- 【2017-10-10】26种神经网络激活函数可视化,Visualising Activation Functions in Neural Networks(可交互)
- 【2017-12-14】Google deepmind 深度学习实践和发展趋势
- 【2018-4-10】Google AI面试题
- 【2018-4-13】Tensorflow中国社区,【2019-08-22】MANNA AI代码库,MANNA AI社区
- 【2018-7-12】为什么神经网络非凸?
- 【2018-8-3】ICML2018教程:深度学习的理论理解《ICML 2018 Tutorial-Toward theoretical understanding of deep learning》
- 【2018-11-12】张俊林,公众号布卡洛林区,文章质量很高,深度学习枕边书,深度学习中的注意力机制
- 【2019-07-08】国立台湾大学机器智能与理解实验室MiuLab,包含对话机器人的各种研究及Github代码,Machince Intelligence & Understanding Laboratory,National Taiwan University
- 【2020-4-18】联邦学习诞生1000天的真实现状
案例及Demo
- 【2019-04-12】知乎专题:AI达到什么程度
- ClarifAI图像视频物体识别
- 【2017-8-31】Toranto Deep Learning Demos,涉及图像分类+图像标注,服务性能有限,响应不及时
- Deeplearn.js
- 你们天天嚷嚷神经网络, 可是知道一开始的赫布律么?
- MIT Scene Recognition Demo
- DeepDream Demo
- 20个令人惊叹的深度学习应用(欢迎补充):Demo+Paper+Code
- [2017-9-20]ClarifAI在线Demo(目标检测、人脸识别、色情识别、场景识别等)
- 【2018-2-25】在线demo:黑白图片着色
- 【2018-5-13】TensorFlow.js浏览器里的实时人体姿态估计,【2019-05-06】tensorflow.js web demo大全-github部署 -【2019-04-11】Tensorflow发布实时任务分隔模型,Demo地址
- 【2018-5-13】Kaggle Kernal免费GPU试用案例
- 【2018-5-26】无需深度学习框架,如何从零开始用Python构建神经网络
- 【2018-8-11】手把手:在Colab里把TPU用起来HowTo Start Using TPUs From GoogleColab in Few Simple Steps
- 【2018-9-11】Tensorflow分布式实现(含简介概要+代码+图示)
- 标注工具总结
- 中文标注工具包
- img,
- 深度学习标注工具汇总, 图像领域
工具名 | 开闭源 | 作者 | 体验地址 | 总结 | 备注 |
---|---|---|---|---|---|
IEPY | 开源 | - | 文档, | 工程完整,有用户管理系统。前端略重,对用户不是非常友好 | 安装失败 |
DeepDive | 开源 | stanford | 前端代码,demo,失效, | 前端比较简单,用户界面友好 | 汉化版:DeepDiveChineseApps,DeepDive_Chinese |
BRAT | 开源 | - | demo,git地址, | 英文 | |
SUTDAnnotator | 开源 | - | 论文 | 非web,pythonGUI,但比较轻量 | - |
Snorkel | - | - | demo,论文 | ||
Prodigy | 闭源 | spaCy同家公司Explosion.ai | 示例, | 支持模型加载+主动学习,体验不错,但要收费 | - |
标注精灵 | 闭源 | 国内 | - | 中文环境,收费 | |
标注客户端 | 开源 | - | - | python开发,大而全 | - |
ImageNet的GUI标注工具 | 开源 | - | - | 图像标注 | - |
Universal Data Tool | 开源 | 国外 | - | 通用数据(标注)工具:用简单的网络界面/桌面应用协作标注图像、文本、文档等数据 | 安装失败 |
MarkTool | 开源 | 个人 | 基于web的通用文本标注工具,支持大规模实体标注、关系标注、事件标注、文本分类、基于字典匹配和正则匹配的自动标注以及用于实现归一化的标准名标注,同时也支持文本的迭代标注和实体的嵌套标注 | ||
Chinese-Annotator | 开源 | 仿照Prodigy,主动学习,详情介绍 | 讨论区 | ||
label-studio | 开源 | - | ,后端纯python编写,使用了flask,前端:React + MST | 界面相对美观,部署方便,可以明晰了解任务的完成度,支持图像、文本和音频等多种数据格式和多种任务数据的标注,但速度慢,没有账号体系 | 介绍 |
doccano | 开源 | doccano demo, 代码,一站式文本标注工具, | 中文 | ||
- 【2018-10-4】AI学习曲线,源自算法工程师的危机
- 【2018-12-16】AI领域state-of-art技术汇总,【2019-03-13】各领域效果最佳论文及代码Browse state-of-the-art,【2019-11-14】NeuroHive包含AI领域数据集及sota效果,Top Computer Science Conferences顶会列表及时间线,更好的倒计时形式展示AI Conference Deadlines,【2019-08-22】学术顶会介绍,顶会排名:Conference Ranks,周志华:做研究与写论文,如何收集和整理论文(CS方向)
- 【2020-6-11】阿里员工开发的论文知识图谱
- 【2019-03-20】Tensorflow解决ranking问题
- 【2019-08-12】AI 落地思考集-Shift AI models to real world products
- 【2019-11-12】图灵机器人黄钊的人工智能产品经理的新起点(200页PPT下载)
- 【2020-2-25】Disappearing-People - Person removal from complex backgrounds over time,Demo地址
- 消失的程序员:Google网站工程师Jason Mayes用tensorflow制作了一个插件,可以让系统学习视频背景的构成,然后从场景中实时删除任何人,也就是说,可以从视频中让人“隐形”,vice报道
CNN
- ImageNet 缔造者:如何让冰冷的机器读懂照片背后的故事?, TED视频,网易公开课
- CS231n Convolutional Neural Networks for Visual Recognition,Youtube视频地址,Andrej Karpathy Youtube主页,CS231n官方笔记授权翻译总集篇发布
- 【2019-10-25】一份完全解读:是什么使神经网络变成图神经网络? GNN,【2020-8-1】500 页电子书带你学习 GNN、预训练等四大领域
- 为什么ConvNet有用?ConvNet不太容易过度拟合(训练集的高精度和验证/测试集的低精度),在不同的视觉任务中更精确,并且易于扩展到大型图像和数据集
- 首先,Convnet利用图像中的一种自然先验,在Bronstein等人在2016年发布的论文中有了更正式的描述,例如:
- (1)
平移不变性
,如果我们将上面图像上的汽车平移到左/右/上/下,我们仍然能够认识到它是一辆汽车。这是通过在所有位置共享滤波器来实现的,也就是应用卷积。 - (2)
局域性
,附近的像素是密切相关的,通常表示一些语义概念,如车轮或车窗。这是通过使用相对较大的滤波器来实现的,它可以捕捉到局部空间邻域中的图像特征。 - (3)
组合性
(或层次结构),图像中较大的区域通常都包含了较小区域的语义父级。例如,汽车是车门、车窗、车轮、驾驶员等的母体,而司机则是头部、手臂等的母体。这是通过叠加卷积层和应用池进行的隐含表达。
- (1)
- 其次,卷积层中可训练参数(即滤波器)的数目并不取决于输入维数,因此在技术上我们可以在28×28和512×512图像上训练完全相同的模型。换句话说,模型是参数化的。
- 首先,Convnet利用图像中的一种自然先验,在Bronstein等人在2016年发布的论文中有了更正式的描述,例如:
NLP自然语言处理&RNN
- 【2020-3-7】【李宏毅《深度学习人类语言处理》国语(2020)】《Deep Learning for Human Language Processing (2020,Spring)》by Hung-yi Lee;国立台湾大学:陈蕴侬Applied Deep Learning,讲述表示学习、BERT、Elmo等
- 【2017-8-1】NLP十分钟入门,【2018-7-23】NLP哪里跑: 什么是自然语言处理优质入门文章, 【2018-8-3】追踪NLP最新技术进展的两个好地方 NLP-progress,decaNLP
- 【2019-10-26】面向产品经理的NLP入门指南
- 斯坦福CoreNLP在线Demo演示(含分词WS、POS词性标注、NER命名实体识别、语法树等等),斯坦福NLP相关软件, 斯坦福深度学习与自然语言处理课程CS224d: Deep Learning for Natural Language Processing学习笔记(我爱自然语言处理)
- 国内外自然语言处理(NLP)研究组大全
- 【2017-12-22】。
- Boson NLP波森自然语言处理Web演示
- 【2017-12-21】 深度学习为什么在NLP管用?Deep Learning, NLP, and Representations,深度学习、自然语言处理和表征方法. Deep Learning in NLP (一)词向量和语言模型.如何生成好的词向量?《How to Generate a Good Word Embedding?》导读,,,论文地址,实验代码地址
- 【2018-4-15】机器翻译简史;
- 【2020-6-5】开源书籍:机器翻译:统计建模与深度学习方法,ppt地址
- 【2018-4-16】谷歌发布的自然语言理解(NLU)体验,Semantic Experiences,Talk to Books + Semantris
- 【2018-4-19】11款分词工具大比拼,jieba分词15min入门与进阶,jieba Github地址
- 【2018-5-13】100+ Chinese Word Vectors 上百种预训练中文词向量
- 【2018-7-21】牛津大学DeepNLP 2017课程Deep Learning for Natural Language Processing: 2016-2017,github,网易云课堂
- What’s next for NLP&AI? 来自Richard的twitter,工具包decanlp
- 【2018-7-27】https://medium.com/@ageitgey/natural-language-processing-is-fun-9a0bff37854e
- 【2018-8-12】刘知远:语义表示学习20180726_语义表示学习_CIPS暑期学校,ppt,知识指导的自然语言处理,2019版
- 【2019-04-08】图解word2vec,通俗讲解词嵌入方法的来龙去脉(源自大数据文摘),原文:The Illustrated Word2vec
- 【2019-6-2】免费书籍AutoML-Auto Machine Learning,A Beginner’s Guide to Automated Machine Learning & AI,【2019-08-30】杨强的AutoML综述
- 【2019-07-02】清华九歌诗词自动生成系统-含代码,【2019-12-19】宋词生成器
- 【2019-10-21】100 Must-Read NLP Papers
- 【2019-12-5】联合国库,含中英俄法西阿6中语言的平行语料;OPUS - an open source parallel corpus:众多特定领域的开源平行语料库,比如书籍、新闻、字幕、TED演讲、维基、技术手册等;大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
- 【2020-3-5】TextCNN文本分类原理详解,2014年首次将CNN应用于NLP领域
- 【2020-5-1】NLP模型代码大全
RNN
- 循环神经网络RNN:BiLSTM iMDB影评分类可视化Demo
- 【2018-5-2】可视化LSTM网络:探索「记忆」的形成。【2018-5-8】对LSTM中M(Memory)的再思考,YJango的循环神经网络——实现LSTM,【2020-2-29】LSTM为什么能解决梯度消失-公式层面解释,【2020-4-5】LSTM 为何如此有效?这五个秘密是你要知道的
- ImageNet 缔造者:如何让冰冷的机器读懂照片背后的故事?, TED视频,网易公开课
- [2017-8-17]CS224n: Natural Language Processing with Deep Learning
- Neural Nets for Generating Music
- Word2Vec教程:通俗易懂,Part-1,Skip-Gram模型,原文:word2vec tutorial the skip-gram model;Part-2,Negative Sampling,原文
- The amazing power of word vectors
- 【2017-12-29】Embedding Projector.
- 【2017-12-11】CMU,Neural Network for NLP
- 【2017-12-12】NLP牛人
- 斯坦福李纪为
- 【2018-1-15】李纪为创立的香侬科技获红杉千万投资,金融搜索分析工具
- 香港理工李嫣然
- 【2018-4-2】Google Brain开发者,蔡善清, Github主页, 2005进入清华,2012年MIT博士毕业, tensorflow debugger主要开发者(以后会集成到tensorboard中),Eager动态计算图开发者
- 【2018-4-27】完全图解RNN、RNN变体、Seq2Seq、Attention机制,将各自的关系讲的清清楚楚。【2018-5-12】神经网络机器翻译模型可视化(注意力Seq2seq模型机制)《Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models With Attention)》.
- 【2019-04-15】【NLP】Attention Model(注意力模型)学习总结【2018-7-1】图解机器翻译transforms实现,原文The Illustrated Transformer,非常好的讲解资料!Jay Alammar的其它文章:The Illustrated Word2vec,The Illustrated BERT, ELMo, and co. How NLP Cracked Transfer Learning,The Illustrated Transformer
- 【2020-3-28】美团BERT的探索和实践
- 【2018-5-1】机器阅读理解google QANet的Tensorflow实现
- 【2018-5-18】解密谷歌 Gmail 新功能:结合 BoW 模型和 RNN-LM,帮助用户快速写邮件
- 【2018-7-23】Keras.js实现的web版情感分析
- 【2018-7-25】Google文本分类,官方解读
- 【2018-7-25】Google AutoML Natural Language 官方体验地址,涉及PoS,NER,情感分析,翻译,tts和asr,相关文章:Empowering businesses and developers to do more with AI。
- 【2018-9-7】谷歌大脑出品:注意力与增广RNN,Attention and Augmented Recurrent Neural Networks,
- 【2018-11-12】张俊林的从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史
- 【2020-3-12】GTP-2中文版
- 【2019-10-14】清华整理的预训练语言模型汇总,文字解释:NLP领域预训练模型的现状及分析,【2020-3-9】12个预训练语言模型学习笔记
论文探索
- 【2019-11-18】ResearchGate,论文引用高效关联
语音
- 【2018-5-13】音频样本浏览器,支持音频分析、相似搜索、智能分类等
- 【Google Duplex:通过电话进行自然对话以执行“真实世界”任务】《Google Duplex: An AI System for Accomplishing Real World Tasks Over the Phone | Google AI Blog》
对抗生成学习
VAE和GAN,VAE和GAN
- [2017-7-28]AI专家的忏悔Confession of a so-called AI expert
- 【2017-7-30】Google的AI产品:QuickDraw,类似你画我猜,只是用机器来猜。【2019-05-06】如何利用TensorFlow.js部署简单的AI版「你画我猜」
- Facebook AI实验室最新的实时GAN图片展示
- 集智俱乐部李嫣然:《深入浅出GAN-原理与应用》学习笔记,厉害了,我的GAN
- 【2018-9-11】GAN工作原理演示Demo, GAN Lab详解
- 【2019-05-17】GAN 毕业手册:从零到一构建自己的 GAN 模型,用 MNIST 数据集训练网络,用 Comet.ml 对实验数据和参数进行分析,并生成手写数字
- 【2019-11-14】GAN各类应用:gans-awesome-applications
- 【2020-10-10】PM(Predictability Minimization可预测性最小化)与GAN及变种InfoGAN、对抗自编码器对比,源自:从PM到GAN——LSTM之父Schmidhuber横跨22年的怨念(文字版)
强化学习
- 强化学习、监督学习和无监督学习对比:
- 一文了解强化学习
- 【2017-7-31】David Silver 强化学习公开课中文讲解
- 【2017-8-21】Q-learning算法简明教程,英文原文
- 【2017-8-29】AK的博客Deep Reinforcement Learning: Pong from Pixels
- 【2017-12-19】强化学习领军人物Richard Sutton的经典教材《强化学习》第二版。
- 【2017-12-21】强化学习视频教程分享(从入门到精通)
- 【2017-12-21】【视频】深度强化学习介绍 (John Schulman, OpenAI)
- 【2018-5-1】强化学习用于比特币自动交易
- 【2018-7-1】Hands-On Reinforcement Learning With Python
- 【2018-7-29】深度学习炒股,含github代码
- 【2018-11-11】OpenAI深度强化学习课程教程
- 【2018-11-27】UCL Reinforecement learning 视频地址
- 【2019-1-15】A Free course in Deep Reinforcement Learning from beginner to expert.
- 【2019-10-24】李飞飞博士生“心有麟熙”《强化学习炼金术》系列笔记, 范博士的讲解简单易懂,由浅入深,每一期都有视频和文字内容,非常贴心,大家可以关注公众号学习。另外,本系列还在持续更新中……
- 【2020-3-30】如何用深度强化学习自动炒股
迁移学习
- 【2017-9-3】中科院计算所迁移学习pdf,【2019-12-2】王晋东的迁移学习简明手册
- 【2017-9-3】集智俱乐部,迁移学习资料汇总github知乎
- 【2018-5-1】【主动学习:优化!=改进】《Active Learning: Optimization != Improvement》 by LightTag。注:主动学习是指监督学习中,用较少的训练样本来获得性能较好的分类器
- 【2018-5-12】【无需博士学位的TensorFlow深度强化学习教程】《TensorFlow and deep reinforcement learning, without a PhD (Google I/O ‘18) - YouTube》by Martin Gorner. Youtube地址, Bilibili地址
- 【2018-8-16】《Transfer Learning in NLP | Feedly Blog》by Peter Martigny迁移学习在NLP中的应用
- 【2019-04-18】Multi-Task Learning代码示例
- 【2019-11-26】用于few-shot learning的元学习,参考meta learning学习笔记,基于过往经验快速学习,号称超过multi-task和transfer learning,ICML 2019 Tutorial Meta-Learning: from Few-Shot Learning to Rapid Reinforcement Learning
知识图谱
- 精益知识图谱方法论,文因互联鲍捷组件的北京知识图谱学习班,知识管理和语义搜索的哲学思考,更多资料参考将门创业历届活动嘉宾视频及ppt, 八一八聊天机器人,聊天机器人终极设计指南,一文看懂聊天机器人的所有猫腻,【2018-5-8】自己动手做聊天机器人,【2019-07-04】零基础系列教程-如何开发微信聊天机器人并集成深度人工智能应用,【2019-12-20】对话机器人(聊天机器人)设计思考,含各种开源聊天机器人,KDD 2018 tutorial,End to-end goal-oriented question answering systems,端到端目标导向问答系统
- 【2017-12-22】李文哲知识图谱的应用
- 【2018-4-9】十分钟上手图数据库
- 【2018-4-17】狗尾草CTO王昊奋When KB meets Chatbots,知识图谱Zhishi.me,开放的知识图谱社区OpenKG.cn
- 【2019-03-09】前员工揭内幕: 10年了,为何谷歌还搞不定知识图谱?
- 【2019-10-17】史上最大规模1.4亿中文知识图谱,在线图谱,思知机器人
数据挖掘
- 谁说菜鸟不会数据分析【脑图笔记】
- SQL必知必会【脑图笔记】
- SQL各种join区别:
- 经验总结:以什么姿势进入DataMining会少走弯路?
- 大嘴巴漫谈数据挖掘(易向军),图解各种基础知识和算法概念——五星推荐
- 分分钟带你杀入Kaggle Top 1%, Kaggle求生:亚马逊热带雨林篇
- [2017-8-30]Kaggle 首战拿银总结 | 入门指导 (长文、干货)
- 【2017-12-13】知乎如何快速成为分析师,图表建议-思维指南
- 【2017-12-14】知乎数据分析&数据挖掘书籍推荐
- 【2018-5-2】你费那么大劲做的数据分析,有用吗,左耳朵耗子-陈皓的数据的游戏:冰与火,博主的视频简介,二叉树视频
- 【2020-12-8】蓝鲸商业分析笔记,5种常用的相关分析方法
人脸识别
- 权威书籍Handbook of Face Recognition
- Modern Face Recognition with Deep Learning
- Face Point
- Face Compare
- [2017-9-20]CMU OpenPose姿势识别
- [2017-9-21]自拍照三维重建3D Face Reconstruction from a Single Image
- 【2018-2-25】人脸识别:含年龄性别表情人种
- 【2018-7-15】人脸识别入门大全faceai:含情绪、性别识别,表情替换等
- 【2018-7-15】基于tensorflow的实时目标检测
-
- 【2020-4-14】目标检测最新技术趋势图
- 2018中国AI战事全景图
- 【2019-07-25】AI全景报告State of AI Report 2019,中文解读,含2018年的总结、预测
IT资讯
- 查公司信息:天眼查,IT桔子
- 互联网黑名单
- 股权信息:股权周刊(各种股权纠纷案例,作者邓永权)。【干货】创业公司融资时如何分配股权?融资后一般怎么稀释?
- 程序员跳槽全攻略-读书笔记
- 【2018-1-7】程序员职业生涯蓝图。
- 【2019-08-31】写代码赚钱的路子,awesome-indie
- Gartner:技术成熟度曲线.Gartner2016 年度新兴技术成熟度曲线解读:3 大趋势、16 个新技术
- 互联网大佬的出生地图鉴
- SixSence,The thrilling potential of SixthSense technology,Pranav Mistry
- IT橘子人工智能全产业链图谱
- 【2018-1-8】36Kr,互联网中的少数派-女性开发者(视频),全世界1850w程序员,中国占10%,主人翁司晓静、刘旸(iOS开发,天气旋律闹钟weather tunes)、创业公司castbox CEO王小雨(北大心理学系自学转Android开发,fruit boom杰作,Google)。
- 【2018-1-16】舒适区、恐慌区,参考知乎不断跳出自己的「心理舒适区」真的能够让人们取得更大的成就吗?
- 如何成为一个很厉害的人?
- 【2018-11-24】邓宁-克鲁格心理效应,又称达克效应
- 【2020-1-16】光复互联网
- 【2018-5-2】技术人员的发展之路
- 【2018-9-28】阿里技术参考图册算法篇,研发篇
- 【2018-2-25】纪实:中国人工智能之路,人工智能真的来了
- 【2019-06-03】人类唯一的出路:变成人工智能系列, 全部看完会开心很久,精品原文:waitbutwhy出品,Neuralink and the Brain’s Magical Future
- 【2018-4-25】阿布量化
- 【2018-8-9】How Google works? pdf下载,知乎评价,英文版
- 【2019-03-11】互联网一些事儿,包含最新各行业调查报告,【2019-08-30】当代互联网精英速成指南
- 【2019-08-12】穿越者的噩梦:霍金如何断送了时间旅行的希望?,一个从2060年穿越回来的“未来人”KFK火遍了豆瓣,豆瓣KFK讨论解析
- 【2019-09-21】暗网:比特币被始乱终弃之地,密码朋克的社会实验(一):开灯看暗网
工具
- 【2021-11-25】图片转换网站:改图鸭
- 视频下载工具:流媒体下载的10种方法
- 硕鼠(可以下载流视频,可按专辑下载),硕鼠Mac版下载地址(官网地址有问题)
- 维棠
- twitter 视频下载: 【2023-11-19】twitterxz, 输入链接即可
- YouTube 视频下载:(更多方法参考知乎帖子:如何下载youtube视频),①修改网址:youtube→yout②修改网址:youtube→youtubeme,或者加now③修改网址:youtube→ssyoutube④独立网站,如noTube,Audio, y2mate
- 【2020-3-29】在线下载YouTube视频
- (1)每个视频域名稍作修改即可(youtube.com->kissyoutube.com),SaveMedia提供,在线下载+系列视频自动推荐
- (2)
you-get
python代码下载,pip3 install you-get
- 【2019-04-24】安装annie,可批量下载,windows下:scoop install annie,步骤:Set-ExecutionPolicy RemoteSigned -scope CurrentUser; iex (new-object net.webclient).downloadstring(‘https://get.scoop.sh’)
- (3) clipconverter
- 【2020-5-5】网易云课堂和B站视频下载
- 【2020-2-23】迅雷极速版免广告,但怎么禁止迅雷极速版强制升级到迅雷X
- 【2018-6-21】webrtc peer to peer文件传输工具reep.io失效,send-anywhere全终端覆盖, 基于浏览器,直接选中本地文件,生成下载链接,速度400kb;Snapdrop,免软件免登录的一款工具,只需在同一WIFI环境下打开Snapdrop网页,就能侦测到彼此,并开始传输文件。知乎大文件传输工具有哪些, 示例:mathematica下载,【2019-05-16】mathematica快速入门
- 【2019-06-08】突破百度网盘限速工具Pandownload,Motrix - 清爽开源免费的全能下载工具 (跨平台、支持 BT / 磁力链 / 百度网盘)
- 【2018-12-9】录屏制作成gif工具GifCam,在线OCR工具,如提取图片里的excel表格,白描网页版,限5次免费试用,夸克浏览器可以直接拍照识别,【2018-12-16】在线LaTeX编辑器overleaf,数学公式截图转LaTeX,
- 【2021-4-13】电脑截屏方法
- windows系统:win+shift+s 直接进入截图嘛,或者启动 snipping tool
- mac截屏/录屏,操作: 三个按键:Shift、Command 和 5, 或 打开 QuickTime Player,然后从菜单栏中选取“文件”>“新建屏幕录制”。
- 在线代码着色(高亮):国外:含语言类型自动识别(优),国内:在线代码着色器(需要自己勾选),实时英文拼写检测,插件下载地址,【2018-10-11】pycorrector - 中文错别字纠正工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正,Demo地址,
sudo pip install jieba kenlm pypinyin pycorrector
- 【2019-07-18】编辑器学习曲线:
- 如何使用VIM搭建IDE?,vim键盘图大全,所见即所得,像IDE一样使用vim,
- 台湾人总结的vim命令图解(pdf打印版)
- 【2017-12-14】awk思维导图,sed思维导图,更多linux工具总结
- 【2020-7-11】pacvim,vim学习游戏
- 命令:git clone https://github.com/jmoon018/PacVim.git
- python下的二维码生成与解析,【2019-04-29】二维码识别原理
- 【2018-9-9】哪些相见恨晚的python库
- 【2018-2-17】用PYTHON玩微信(非常详细),通过微信网页版抓包的开源工具itchat,可以分析微信数据,可视化(echart+wordcount),聊天机器人,接入图灵机器人,示例,【2018-7-15】接入微软小冰,把公众号升级为人工智能公众号的攻略,支持文章回复,其它:Python实现微信自动回复机器人,python实现微信接口(itchat)资料全面
- 【2018-4-4】微信小程序开发,官方小程序简易教程,微信小程序开发资源汇总
- 【2017-12-17】如何用github搭建个人博客,【2018-2-19】微信公众号如何接入图灵机器人,【2019-02-23】中文语音对话-悟空机器人wukong-robot
- 【2018-2-16】1997年世界黑客编程大赛冠军作品,视频地址,汇编语言生成3D动画;【2020-10-22】有哪个高手可以解读“世界黑客编程大赛第一名的作品(97年Mekka ’97 4K Intro)”?, Javascript 版本
- 【2018-3-31】文件转换,①pdf转换器,②迅捷pdf转换器,pdf到各种文件格式的转换,③国外的pdf converter,【2019-09-07】pdf密码破解
- 【2023-9-27】ilovepdf, 支持pdf到各种格式之间的转换,包括 ppt、excel、word、图片等,pdf融合、分割、压缩编辑,实测 pdf转ppt完美恢复
- Every tool you need to work with PDFs in one place; Every tool you need to use PDFs, at your fingertips. All are 100% FREE and easy to use! Merge, split, compress, convert, rotate, unlock and watermark PDFs with just a few clicks.
- 【2019-11-14】批量下载论文的工具Scihub, pdf转text的Python包:pdfminer
- 【2018-4-2】Heavens Above, 查看天体运行,如特斯拉实时位置,天宫一号降落过程
- 【2018-5-1】《后端架构师技术图谱》
- 【2020-3-10】都在说“中台”,中台的本质是什么?,中台这个词和架构这个词有异曲同工之妙
- 架构是什么?微服务架构、大数据架构、应用架构、部署架构和组织架构
- 中台是什么?业务中台、数据中台、技术中台和组织中台,中台就是为了业务逻辑复用,节省不必要的重复造轮子操作,整合系统
- 【2018-8-9】正向代理+反向代理总结
- 【2018-5-20】Linux,一生只为寻找欢笑知乎帖子,Linus Torvalds名言:Talk is cheap,show me the code!翻译:①正经版:代码胜于雄辩②俗版:屁话少说,放码过来③文艺版:纸上得来终觉浅,觉知此事需躬行④红色版:空谈误国,实干兴⑤邦隐晦版:北沙滩,亮马桥
- 【2018-12-6】漫画图解linux内核,
- 【2018-5-22】基于HTML5超酷摄像头(HTML5 webcam)拍照功能实现代码,基于WebRTC技术;php webrtc一对一视频聊天源码-基于workerman, Demo, github地址
- 【2018-7-28】世界最大外文电子书搜索引擎B-OK, 鸠摩电子书搜索引擎
- 【2021-10-14】电子书搜索引擎x5v, 直接显示电子书及下载地址,方便快捷
- 【2018-8-7】虫部落快搜搜索大全
- 【2018-10-9】抓包工具:青花瓷charles官网,在线破解. fidder
- 【2018-10-11】一图读懂开源license,
- 【2018-11-3】IP地址详解
- 【2018-11-20】图解浏览器工作原理
- [2017-9-19]视频集合:内存原理解析,CPU缓存原理解析,TCP,UDP协议原理对比,【2019-10-26】动画讲解TCP,再不懂请来打我,IPv4,IPv6原理解析,代理服务器原理解析,集线器-交换机-路由器区别,DNS域名解析,超线程原理解析,磁盘碎片原理解析
- 【2021-3-19】如何跟小白解释路由器和交换机的区别?并且家用路由器充当了路由器和交换机的功能吗?薛定谔不在家的回答
- 总结:交换机适合局域网内互联,路由器实现全网段互联。猫的学名叫调制解调器,作用是将数字信号(电脑想要发送的信息)转换成模拟信号(网线中的电流脉冲)从而使信息在网线中传输。由于计算机的一切信号都要由电流脉冲传送出去,因而猫是必须的。目前的家用路由器一般都是路由猫,即路由器兼顾了猫和简单交换机的功能,因而在选购时,选一款性价比超高的路由猫就可以了。至于物理地址,逻辑地址,交换机与路由器的寻址方式等问题属于更专业的范畴
- 【2018-3-13】松果云科普:动画解释,详解硬盘工作原理,详解显卡工作原理:GPU和CPU的区别
- 【2021-12-16】网吧网咖的电脑配置比家里的低,为什么速度却更快?
- (1)操作系统优化:网吧的电脑系统十分精简,并且系统还是优化过的。很多用户从安装好系统后一直使用的都是系统默认设置。而网吧里的电脑,都开启了最佳性能模式。
- (2)软件少:电脑里面也没有安装过多的软件、没有自启动程序和多余的进程。只留下与游戏、直播、观影有关的软件。后台程序少了很多,减轻不少系统运行占用的资源,自然运行速度就快一些了。
- (3)服务器镜像:网吧系统的“还原功能”, 用户每次开机都是全新的镜像启动,进入的是干干净净的新系统。这就是为什么,出现问题的时候,网管通常会叫你“重启试试”,直接搞一个全新的系统使用,自然也就没有问题了~
- (4)光纤通信:家里装的无线一般只供一台电脑或者是供手机使用就足够了,基本都是100兆左右。但是网吧里的网几乎都是千兆网或者是几万兆的网。
- (5)无硬盘:电脑是必须从硬盘上读取数据的。但网吧电脑大多数不用硬盘,因为它有“无盘服务器”,类似于固态硬盘的作用。电脑由网卡唤醒后,直接加载“无盘服务器”里的镜像系统启动,包括启动软件和游戏时也一样。那么,在网吧的千兆网光纤组成的局域网下,从服务器读取数据的速度肯定是高于硬盘的。虽然网吧电脑配置不一定比得上你的电脑,但是在游戏场所中,还是会备配一些中高性能cpu显卡,比如NVIDIA特供的GTX 1063。
- 【2021-4-12】天线是如何工作的
- 【2019-03-22】HTTP协议详解,【2019-04-11】细说API,重新认识RESTful
- 【2019-05-28】网站用户可视化组件,代码如下:
- 【20191012】免费API大全Github汇总,free-api提供
- 【2019-12-18】CMU:文言文写代码
- 【2020-1-27】中国新型冠状病毒肺炎疫情地级市图,github代码地址
- 【2020-4-1】cookie+session+token的区别
- 【2020-5-8】Photoshop在线版,手机电脑都能用
- 【2020-5-8】项目管理软件[Trello(https://blog.trello.com/advanced-checklists),敏捷开发,任务分配,进度跟进。
- 【2020-7-9】问卷调查工具:腾讯问卷
- 【2020-10-15】为什么我们要从ES迁移到ClickHouse?
- ElasticSearch 是一种基于 Lucene 的分布式全文搜索引擎,携程用 ES 处理日志,目前服务器规模 500+,日均日志接入量大约 200TB。
- 随着日志量不断增加,一些问题逐渐暴露出来:
- 一方面 ES 服务器越来越多,投入的成本越来越高。
- 另一方面用户的满意度不高,日志写入延迟、查询慢甚至查不出来的问题一直困扰着用户。
- 而从运维人员的角度看,ES 的运维成本较高,运维的压力越来越大。
- 为什么选择 ClickHouse
- ClickHouse 是一款高性能列式分布式数据库管理系统,我们对 ClickHouse 进行了测试,发现有下列优势:
- ①ClickHouse 写入吞吐量大,单服务器日志写入量在 50MB 到 200MB/s,每秒写入超过 60w 记录数,是 ES 的 5 倍以上。
- ②在 ES 中比较常见的写 Rejected 导致数据丢失、写入延迟等问题,在 ClickHouse 中不容易发生。
- ③查询速度快,官方宣称数据在 pagecache 中,单服务器查询速率大约在 2-30GB/s;没在 pagecache 的情况下,查询速度取决于磁盘的读取速率和数据的压缩率。经测试 ClickHouse 的查询速度比 ES 快 5-30 倍以上。
- 其他优点见原文
- 【2021-1-1】冰点下载:随意下载百度文库资料;文库下载器, 百度文档下载方法
- pdf编辑
- 在线编辑:① pdf 24 tools,合并,转图像,签名,文件格式转换, PDF 文本识别,通过OCR识别文本,并创建可搜索的PDF文件; ② smallpdf,7天免费
- mac自带:finder里可以直接复制pdf文件,粘贴,实现简易提取功能 文库下载器失效,https://zhuanlan.zhihu.com/p/120295773,https://www.cxyhub.com/all/tool/2894/,软件下载网站:cxyhub.com
- 【2021-2-18】chatroulett ,omegle两个外国随机视频聊天软件
- 【2022-1-6】快闪ppt,模板库,期末考试动员,打开书“马冬梅”,合上书“什么冬梅”?再打开书“啊,马冬梅”,再合上书“呃,马什么梅”?考试时“孙红雷”;B站视频;快闪ppt:救救老师吧-百度文库地址
- 【2022-12-9】下一代ppt工具:gamma powtoon beautiful.ai
实验评估
- 第一种:<font color=#0099ff size=5 face=”黑体”>A/B-Test</font>. 什么是ab-test?
- A/B Test,也称为对比测试,是让两个版本的登陆页面的相互pk测试。看看哪个版本能更好地引导访问者达到你的预设目标,如注册或订阅。
- 工程实施:叫你如何对产品进行AB Test?,包含服务端、客户端如何实施ab-test,及各自的优缺点
- ab-test有什么局限性?
- 首先,A/B测试只有在关键效绩指标(KPI, or Key Performance Indicator)单一,且这个单一明确的目标可以被电脑量化时,适用
- 其次,A/B测试相比起一些别的测试手段,如纸本原型(paper prototyping),需要的工作量大、时间长,对设计的要求也相对较高。
- 另外,A/B测试之所以进行,唯一原因是对结果的追求。但相对应的测试结果通常是短期、即刻的用户行为,比如购买、注册、点击等。
- 此外,A/B测试并不能提供用户行为的具体细节。A/B测试的结果也仅限于被测试的两个选项:如果12号字比16号字为你的网站带来多1%的用户浏览时间,那10号字呢?8号呢?A/B测试并不能帮助你作更多的、长远的决定。
- A/B测试还有别的缺点:需要的用户人数大,可能的影响因素多,可以测试的选项数有很大限制等等。
- 吆喝科技-ab-test最佳实践
- 第二种:<font color=#0099ff size=5 face=”黑体”>interleaving</font>,参考美团分享的文章沈国阳:美团推荐系统整体框架与关键工作.
- abtest的好处是可以对多个策略给出定量评估,坏处是:①策略差异小时,评估结果波动大②需要较长时间反馈,导致迭代速度慢
- 改进:interleaving,所需流量小,灵敏度高(24h内),但只能给出定性结论。基本思想是将两个策略混合,对所有用户统计分析判断哪个好
- 【2018-6-22】优质资源,多图解释Innovating Faster on Personalization Algorithms at Netflix Using Interleaving
- 灰度发布和A/B Test
编程语言
- 命令式编程和声明式编程的区别
- go语言开发者必读的陷阱、技巧、错误
- 【2018-5-2】Python入门神图,参考:Python脚本图解,Python入门思维导图百度云盘下载
- python:python小白笔记,python正则表达式,【2019-03-31】正则表达式在线调试Regulex
- 【2018-5-4】Python代码执行过程可视化
- 【2017-12-11】python面向对象:初级篇,进阶篇
- 【2018-4-28】Dive into Python中文版
- 【2018-6-4】图解深拷贝和浅拷贝
- 【2018-5-30】request发明人的python教程:The Hitchhiker’s Guide to Python!,Python大神,requests库的作者放大招了
- 【2018-6-28】python函数到底是传参还是传引用?
- 【2018-5-6】Machine Learning Plus,包含numpy、pandas、scikit-learn各种工具包的代码实战示例,用python做科学计算-Numpy快速数据处理
- The Zen of Python(Python之禅)
-
Python 之禅
, by Tim Peters
- 优美胜于丑陋(Python 以编写优美的代码为目标)
- 明了胜于晦涩(优美的代码应当是明了的,命名规范,风格相似)
- 简洁胜于复杂(优美的代码应当是简洁的,不要有复杂的内部实现)
- 复杂胜于凌乱(如果复杂不可避免,那代码间也不能有难懂的关系,要保持接口简洁)
- 扁平胜于嵌套(优美的代码应当是扁平的,不能有太多的嵌套)
- 间隔胜于紧凑(优美的代码有适当的间隔,不要奢望一行代码解决问题)
- 可读性很重要(优美的代码是可读的)
- 即便假借特例的实用性之名,也不可违背这些规则(这些规则至高无上)
- 不要包容所有错误,除非你确定需要这样做(精准地捕获异常,不写except:pass风格的代码)
- 当存在多种可能,不要尝试去猜测
- 而是尽量找一种,最好是唯一一种明显的解决方案(如果不确定,就用穷举法)
- 虽然这并不容易,因为你不是 Python 之父(这里的 Dutch 是指 Guido)
- 做也许好过不做,但不假思索就动手还不如不做(动手之前要细思量)
- 如果你无法向人描述你的方案,那肯定不是一个好方案;反之亦然(方案测评标准)
- 命名空间是一种绝妙的理念,我们应当多加利用(倡导与号召)
- 【2017-11-23】python编码规范,目前有google和pep8两种,pylint默认pep8,Google python编码规范,如何用pylint规范代码风格
- 安装方法:sudo pip install -U pep8/pylint
- 【2018-7-13】python性能优化的20条建议,【2019-1-11】Python如何正确使用import?,总结import的各种用法及区别,精华
- 给深度学习入门者的Python快速教程 - 基础篇,numpy和Matplotlib篇.Python超简洁教程,含图示,在线调试
- 【2020-3-11】VS Code可视化调试工具Debug Visualizer,类似的还有Cyberbrain
- 老外的Matplotlib教程,英文原文_,中文译文,Matplotlib官方艺术馆。【2018-6-26】matplotlib的高级接口seaborn官方图例
- Pandas学习笔记,十分钟搞定pandas,pandas cheetsheet,
- pandas读取excel数据示例
[2016-7-30]
- 【2018-5-2】6张python工具包总结图,见python数据分析实用小抄,Top 28 Cheat Sheets for Machine Learning, Data Science, Probability, SQL & Big Data,百度云地址
- 【2018-11-18】1000个python库大全
- 【2018-6-6】python最强思维导图合集,来自数林觅风的github
- 【2018-6-10】【精】数据科学知识图谱,数林觅风,精美的脑图笔记
- 【2019-04-10】Python存在的问题:GitHub中文地址,GitHub英文地址
- 【2017-11-23】史上最全设计模式导学目录
- 【2017-12-14】字符编码详解——彻底理解掌握编码知识,“乱码”不复存在,字符字节和编码
- 【2017-12-16】编码总结
- 【2017-12-23】[译]27 个Jupyter Notebook的小提示与技巧
- 【2018-5-2】scikit-learncheet sheet
- 【2018-5-7】精华:流畅的Python:阅读笔记
- 【2019-03-27】996-ICU,【2019-04-12】程序猿找工作黑名单, 图领奖获得者名单
- 【2019-04-26】Github Page自制个人简历
- 【2019-06-02】一段国产芯片和操作系统往事,中国操作系统往事
- 【2019-06-03】有哪些业余挣钱的途径?
- 【2020-3-31】OKR与KPI
- 【2020-6-29】什么是OKR四象限?
- OKR:存在4个问题:(1)可视化效果差;(2)管理不够便捷;(3)底层逻辑问题;(4)内容不全面。
- OPM:OPM是OKR+PM(Projectization Management,项目化管理)。OKR解决的是要到哪儿去以及对目标实现标准定义的问题,但要达成OKR还是需要通过Task执行层面来实现。
- OKR:存在4个问题:(1)可视化效果差;(2)管理不够便捷;(3)底层逻辑问题;(4)内容不全面。
- 【2020-7-13】可视化软件架构:C4模型,中文翻译,配套画图工具,可视化架构设计C4
- 【2020-7-28】身份证号码解析,用python制作全国身份证号验证及查询系统,含python UI界面。另外一个身份证解析代码,包含合法性检测、性别等信息
- 【2020-11-30】专利查重系统:润桐,佰腾、soopat、Google专利
- 【2021-1-27】小爱触屏音箱破解
【2022-10-8】在线广播
【2022-12-27】影视剧资源
- 茶杯狐
- 大师兄
- 【2021-12-23】github优质项目汇总、更新:hellogithub
- 【2023-1-7】临时邮箱,保护个人隐私,国内外临时邮箱集合
视频资源
公开课
- 哈佛大学《公正》系列公开课:哈佛英文主页,网易中文翻译
- 自律更自由:康德
- 一张图弄明白:从零维到十维空间,11分钟带你进入十次元的世界(video),GuoKr’s explornation
- 懂了这些之后 才知道如何去赚钱(经济学原理)
- 【2017-8-25】宇宙揭秘:电子双缝干涉实验,绝对颠覆你的三观甚至让你怀疑人生
- 几幅图让你真正了解什么是硕士学位、什么是博士学位
- 一部能让小孩喜欢汉字的动画片。【2018-5-19】国产动画小蝌蚪找妈妈
- 【2017-12-24】一个故事告诉你比特币的原理及运作机制,视频:一个故事告诉你比特币的原理。【2018-1-23】如何简单易懂的介绍区块链,【2018-2-19】区块链讲解及Demo,【2018-3-18】比特币在线Demo:coinDemo,blockchainDemo
- 5G技术:一口气了解5G,【2019-05-25】终于有人讲明白5G了,难怪美国破釜沉舟
- 【2018-10-22】银行与货币系统真相,【2018-11-25】万维财经经济学视频系列,覆盖经济规律、通货膨胀、货币等,通俗易懂,如:经济机器是怎样运行的,【2019-03-07】2008年金融危机的电影大空头
- 【2017-12-31】视频短片:时间(工薪族一家三口的作息时间差),皮克斯2016创意动画《鹬》,【2018-11-25】反映社会的短片:Dinner for few,【2019-03-01】承认吧,人生来就是孤独的,【2019-04-14】90分钟看完《知行合一王阳明》观传奇人生是怎样炼成的!,程(红安程颢程颐兄弟)朱(朱熹)理学,陆(陆九渊)王(王阳明)心学
- 【2018-2-25】【电影】暖,白狗秋千架。【2018–3-17】美丽心灵 (博弈论创始人,纳什)+ 万物理论(霍金),【2018-12-16】印度拉马努金传记知无涯者,B站地址,Will Hunting 心灵捕手,霍金,万物理论
- 【2018-11-25】马云励志演讲:最伟大的成功,【2019-07-26】阿里纪录片扬子江大鳄,马云和他永远的少年阿里 Dream Maker
- 【2018-3-1】杭州买房知识大全github
- 【2018-9-25】公积金介绍-视频
- 【2018-10-9】BBC纪录片盘点全球N种最不健康饮食方式
- 【2018-10-13】崔永元-我的抗战
- 【2019-03-28】996公司名单
- 【2019-04-05】扒手表演,【2019-08-15】反赌大师现场戒赌,B站
- 【2019-07-31】CRI News Chinese Theatre
- 【2019-10-20】韦博英语败亡纪实:为了学英语,中国人交了多少智商税?
- 【2020-1-21】丁香园全国新型冠状病毒实时疫情
- 【2020-2-11】中文汉语的历史和类别
- 【2020-5-4】香港科技大学的面向非英语母语人士的商务英语专项课程系列(Business English for Non-Native Speakers Specialization)
- 【2021-2-10】中国第一风水大师于希贤教授的基础风水概论