- 总结
- AI报告
- 2024年度报告
- 2023年度报告
- 2020年全景报告
- 2019年度
- 参考资料
- 人类水平的AI历程
- 美国互联网行业报告
总结
- 【2021-2-10】艾瑞咨询:2020中国知识图谱行业研究报告
- 艾瑞咨询《知识图谱白皮书》(2020)发布
- 艾瑞咨询是解决商业决策问题的专业第三方机构,互联网企业IPO报告里80%的材料引用自艾瑞研究的成果。
- 2020年11月底,艾瑞咨询从善政、惠民、兴业、智融四个部分对知识图谱技术在其他行业中的代表性应用场景进行梳理,发布了《知识图谱白皮书》。深擎科技“乾坤袋”知识图谱引擎与腾讯云、百度云、阿里云等品牌共同作为代表性应用被纳入金融领域产业链与参与者图谱。
- 【2021-3-9】人工智能的认知神经基础白皮书
AIGC
【2022-9-19】红杉发布《Generative AI: A Creative New World》
AIGC下游场景 img
AI报告
2024年度报告
【2024-5-24】斯坦福AI报告
- 斯坦福AI指数报告pdf:AI-Index-Report-2024
- 斯坦福HAI实验室主页
2023年度报告
【2023-10-20】State of AI Report 2023
摘要
- GPT-4 目前是无可匹敌的最强模型,无论是在经典基准测试还是人类评估考试中,GPT-4 击败了其他所有的 LLM,验证了专有架构和 RLHF 的强大能力。
- 通过使用更小的模型、更好的数据集和更长的上下文,人们正在努力克隆或超越专有模型的性能。考虑到人工生成的数据可能只能维持几年的人工智能扩展趋势,这些努力可能变得更加迫切。
- LLM 和扩散模型继续推动现实世界的突破,特别是在生命科学领域,在分子生物学和药物发现方面取得了有意义的进展。
- 算力成为新的石油,NVIDIA 创造了创纪录的收益,初创企业则以其 GPU 为竞争优势。随着美国收紧对中国的贸易限制并动员其盟友参与芯片战争,NVIDIA、英特尔和 AMD 开始大规模销售符合出口管制的芯片。
- GenAI 拯救了 VC,在科技估值下滑的背景下,专注于生成式人工智能应用(包括视频、文本和编码)的人工智能初创企业从风险投资和企业投资者那里筹集了超过 180 亿美元。
- 关于 AI 安全的辩论已经成为主流话题,引发了世界各国政府和监管机构的行动。然而,这波活动掩盖了人工智能社区内的深刻分歧和全球治理方面的实质性进展不足,因为世界各国政府追求着不同的方法。
- 在评估最先进模型的过程中面临的挑战越来越大,标准 LLM 通常很难具备鲁棒性。考虑到利害关系,仅凭「基于感觉」的方法是不够的。
Now in its sixth year, the State of AI Report 2023 is reviewed by leading AI practioners in industry and research. It considers the following key dimensions, including a new Safety section:
- Research: Technology breakthroughs and their capabilities.
- Industry: Areas of commercial application for AI and its business impact.
- Politics: Regulation of AI, its economic implications and the evolving geopolitics of AI.
- Safety: Identifying and mitigating catastrophic risks that highly-capable future AI systems could pose to us.
- Predictions: What we believe will happen and a performance review to keep us honest.
Key themes in the 2023 Report include::
- GPT-4 is the master of all it surveys (for now), beating every other LLM on both classic benchmarks and exams designed to evaluate humans, validating the power of proprietary architectures and reinforcement learning from human feedback.
- Efforts are growing to try to clone or surpass proprietary performance, through smaller models, better datasets, and longer context. These could gain new urgency, amid concerns that human-generated data may only be able to sustain AI scaling trends for a few more years.
- LLMs and diffusion models continue to drive real-world breakthroughs, especially in the life sciences, with meaningful steps forward in both molecular biology and drug discovery.
- Compute is the new oil, with NVIDIA printing record earnings and startups wielding their GPUs as a competitive edge. As the US tightens its restrictions on trade restrictions on China and mobilizes its allies in the chip wars, NVIDIA, Intel, and AMD have started to sell export-control proof chips at scale.
- GenAI saves the VC world, as amid a slump in tech valuations, AI startups focused on generative AI applications (including video, text, and coding), raised over $18 billion from VC and corporate investors.
- The safety debate has exploded into the mainstream, prompting action from governments and regulators around the world. However, this flurry of activity conceals profound divisions within the AI community and a lack of concrete progress towards global governance, as governments around the world pursue conflicting approaches.
- Challenges mount in evaluating state of the art models, as standard LLMs often struggle with robustness. Considering the stakes, as “vibes-based” approach isn’t good enough.
2020年全景报告
- 【2020-10-5】剑桥2020《AI全景报告》出炉,近三成在美顶尖AI人才有中国教育背景
- 英文原版地址
国庆节期间,剑桥大学的两位研究人员Nathan Benaich 和 Ian Hogarth 推出了一年一度的2020 AI 全景报告(State of AI Report)。
和往年相似,本报告依旧从产业、人才、政策、预测等方面对过去一年来AI领域的技术的新进步、产业格局的新变化、政府政策的新特点等方面进行了总结,并作出关于未来的预测。
AI研究与技术:只有15%论文会公开代码,PyTorch比TensorFlow受欢迎
AI研究没有想象中那么开放。只有15%的论文会开源他们的代码。
研究论文代码的发布对于AI相关的问责,可复制性和推动进步至关重要。
自2016年中以来,这一指标几乎没有改善。一般来讲,学术团体比行业团体更可能发布其代码。尚未发布所有代码的著名组织包括OpenAl和DeepMind。对于大型科技公司,其代码通常与其私有的基础结构交织在一起。
Facebook的PyTorch在研究论文中的使用迅速超过Google的TensorFlow。
在提及使用框架的会议论文(占比20-35%)中,有75%引用了PyTorch,但没有提到TensorFIow。同时,作者观察到TensorFlow,Caffe和Caffe2仍然是AI研究的主力军。
在GitHub上的论文实现中,PyTorch也比TensorFlow受欢迎。其中,47%的论文实现基于PyTorch,而TensorFIow为18%。PyTorch提供更大的灵活性和动态计算图,使实验变得更加容易。JAX是个对数学更友好的Google出品框架,通常在卷积模型和transformer之外的工作中受到青睐。
NLP模型:十亿参数俱乐部
报告分析了当今最火的NLP模型的趋势。
对于NLP模型来讲,性能提高显然需要更大的模型,数据集和更高的计算预算。
根据Google公布的数据,每1000个参数平均需要花费1美元。这意味着OpenAI训练1750亿参数的GPT-3可能要花费数千万的训练费用。专家推测可能的预算会超过1000万美元。
报告指出,如果没有重大突破,将ImageNet错误率从11.5%降至1%会需要数千亿美元!许多从业者认为ML成熟领域的进展目前有些停滞不前。
新一代的transformer语言模型正在解锁新的NLP用例。GPT-3,T5,BART正在极大地改善用于文本到文本任务(例如翻译,文本摘要,文本生成,文本到代码)的transformer模型的性能。
此外,2019年,NLP全新基准SuperGLUE正式发布。十多个团队在GLUE基准测试中超过人类。
SuperGLUE之后会是什么?
多任务语言理解挑战测试涵盖57项任务,包括数学,美国历史,法律等,以全面测试世界知识和解决问题的能力。GPT-3仍然存在巨大的知识空白。
生物学的「AI时刻」
生物研究正在经历「AI时刻」:仅2020年,就有超过21,000篇相关论文发表。自2017年以来,涉及AI方法(例如深度学习,NLP,计算机视觉,RL)的出版物同比增长超过50%。
大型标记数据集带来巨大的潜力,丰富了健康和疾病相关的新生物学知识。
从物理对象识别到「细胞绘画」:通过图像解码生物学
联邦学习
联邦学习在2016年由Google发起,目前正在蓬勃发展。从2018年到2019年,提及联邦学习的论文数量几乎增长了5倍。2020年上半年发表的相关论文数量超过了2019年全年的数量。
AI人才:教授从高校流向科技公司,27%在美顶尖AI人才来自中国
近些年来,科技公司对人工智能教授的需求在上涨。
2004年至2018年间,谷歌、DeepMind、亚马逊和微软从美国大学聘请了52名终身教授,相应地,卡内基梅隆大学、华盛顿大学和伯克利大学有38位教授离任。但值得注意的是,2004年的时候还没有一位人工智能教授离开,而仅2018年就有41位人工智能教授选择离开。
当然,老教授的离开可能会为年轻的学术人才腾出晋升的阶梯。而与此同时,也有一些学者并不买账。
教授离开造成学术毕业创作能力下降
包括Facebook在内的一些公司,他们利用学术/行业的双重合作机制挖取人财,这对高校有什么影响?
根据报告,人工智能教授的流失对高校来说很重要,在美国69所大学中,毕业生创业能力下降与教授的离职有关。一般来说,人工智能终身教授离职4-6年后,毕业生创办人工智能公司的可能性降低了4% ;但这种并不适用于教授在学生毕业前1-3年就离开的情况,这表明教授和学生之间的互动很重要;但人工智能教授的离职与同一所大学的毕业生成立非AI公司之间也没有显著的相关性。
2019年度
2019年全景报告
引言
剑桥2019年度《AI全景报告》出炉,全方位总结过去一年来AI领域的:
- Research: 研究成果与突破
- Talent: 人才形势
- Industry: 产业动态
- Politics: 政府政策
- China: 中国专题(今年新增)
- Prediction: 并作出未来预测
今年的报告额外关注中国,专门新设一章China,介绍中国的AI技术、企业和应用的迅猛发展。
2019年即将过去一半,剑桥大学的两位研究人员近日推出了本年度的State AI 2019全景报告。
本报告基本沿袭去年的大体框架,从产业、人才、政策、预测等方面对过去一年来AI领域的技术的新进步、产业格局的新变化、政府政策的新特点等方面进行了总结,并作出关于未来的预测。
值得一提的是,与去年不同的是,2019年的报告为中国单列一章,介绍中国AI技术在日常消费、机器人、半导体等领域的进步。
类似报告
AI研究与技术突破:游戏、NLP、医疗全面开花
强化学习开疆扩土:在多项竞技性游戏中击败人类
目前已经被AI统治的游戏包括《蒙特祖玛的复仇》
、《星际争霸2》
、《雷神之锤3》
,在DOTA2
上游戏水平实现大幅进步。未来的游戏AI可能让人类更加遥不可及了。
未来,研究人员有望利用强化学习训练单个机器人来完成多个复杂任务,无需针对每个任务进行专门的再学习。
基于好奇心机制的探索
:在奖励稀疏或无奖励机制的条件下,智能体可以依赖“好奇心”解决问题。
面向在线计划学习动态模型
:模型可从图像中快速学习环境动态信息,准确预测数个时间段后的奖励。
研究成果逐步进入实际生产环境:在众多机器学习框架和工具的支持下,Facebook发布的开源端对端平台Horizon,推进大规模生产环境下的系统优化,如信息联想、视频流质量、通知服务优化等。
生命科学中的新突破:AlphaFold精准预测蛋白质的折叠结构
NLP大丰收:预训练语言模型大展身手
新的预训练模型
不断涌现,各大数据集新纪录常看常新。Google AI的BERT, 、Transformer,艾伦研究所的ELMo、OpenAI的Transformer、 Ruder和Howard的 ULMFiT、微软的MT-DNN等争奇斗艳。
神经机器翻译
:无需双向文本
自然语言模型学会常识推理
对机器学习领域的数据隐私和保护
越来越重视
医学领域大展身手,诊断堪比人类专家
诊断眼疾
使用两个阶段机器学习方法,AI模型给出了专家级的眼疾诊断和治疗参考建议
利用心电图检测心律不齐,达到人类医生水平
超过60万的X光片数据集已经被分享出来,但远远不够
- 用于成像诊断的深度学习模型可以很好地拟合数据集,但是它们难以推广到新的数据分布。尽管改进了这个新数据集的文档,但标签定义很浅
- 使用医生笔记中的NLP提取标签存在挑战:容易出错且容易受到影响。放射学报告中包含的信息不足,大多数标签类别的错误率为5-15%
- 大量重复扫描,其中70%的扫描来自30%的患者。这减少了数据集的有效大小及其多样性,影响训练模型的普适性
研究人员从听觉皮层的神经活动中重建语音
- 哥伦比亚大学的研究人员使用侵入性脑电图来测量5名接受癫痫治疗的患者在连续收听语音时的神经活动
- 反过来使研究人员能够通过大脑活动的声码器合成语音。通过声码器测试单个数字“口语”时,系统的准确度达到75%。与基线线性回归方法相比,深度方法将语音的可懂度提高了65%
- 该研究表明,大脑计算机界面有可能恢复瘫痪患者的沟通
使用蒙特卡罗树搜索神经网络通过训练1240万个反应来解决逆向合成
一个由三个NN(3N-MCTS)构建的系统:
- 通过提出有限数量的自动提取转换来指导向有希望的方向搜索
- 预测拟议的反应是否实际可行
- 估计位置值并迭代
这种方法比最先进的计算机辅助综合计划快得多。实际上,3N-MCTS解决了超过80%的分子测试集,每个目标分子的时间限制为5秒。
相比之下,一种称为最佳第一搜索的方法,其中通过神经网络学习函数可以解决40%的测试集。使用手动编码启发式功能设计的最佳首次搜索执行最差:它在5秒内解决了0%。
AutoML:神经网络架构和超参数的进化算法
共同优化超参数,最大化网络性能,同时最小化复杂性和大小
- 之前的AutoML工作使用RL单独优化超参数或网络架构。遗憾的是,RL系统要求用户事先为算法定义适当的搜索空间以用作起点,可以针对每个层优化的超参数的数量也是有限的
- 此外,计算非常繁重。为了生成最终的最佳网络,必须对数千个候选架构进行评估和训练,这需要大约100k GPU小时
- 另一种选择(Learning Evolutionary AI Framework:LEAF)是使用进化算法进行超参数和网络架构优化,最终产生更小,更有效的网络
-
例如,LEAF与手工制作的数据集特定网络(CheXNet)的性能相匹配,用于胸部X射线诊断分类,并且优于Google的AutoML
- AutoML:使用真实的设备性能反馈设计资源受限的网络
基于CNN的自动化架构搜索的步伐正在加快:Facebook与谷歌的竞争加剧
- 谷歌展示了一种基于RL的多目标方法(MnasNet),可以在Google Pixel平台上测量具有低实际推理延迟的高精度CNN模型。该系统在Pixel手机上达到74.0%的Top-1精度,延迟为76ms,比MobileNetV2快1.5倍
- Facebook提出了一种可区分的神经架构搜索(DNAS)框架,该框架使用基于梯度的方法在分层搜索空间上优化CNN架构。FBNet-B实现了与MnasNet相同的Top-1精度,但延迟仅为23.1ms,搜索成本降低了420倍
GAN的最新技术水平在不断发展:从颗粒到GANgsta
- 较大的模型和大批量训练进一步提高了使用GAN生成的图像的质量
- GAN中的最新技术水平在不断发展:从面部到全身
- 通过将面部与口语相匹配(左),电影只需设置一次,即可以不同语言生成相同的视频。下一步是从头到脚生成整个身体,目前用于零售目的(右)
在图像和视频操作之后出现逼真的语音合成
从单个图像中学习对象的3D形状
模型输出10个不同类别(如汽车、摩托车、行人、交通锥等)的3D边界框,类特定属性(如汽车是否正在行驶或停车)并提供当前速度矢量。
AI人才:五大国雇佣了72% 专家,论文引用率只有中国增长
人才方面,以研究论文的产出衡量,谷歌是最具生产力的一个组织。上图为在人工智能顶会NeurIPS 2018上,谷歌发表的论文最多,其次是MIT、斯坦福、CMU和加州大学伯克利分校。
在NeurIPS、ICML或ICLR上发表论文的4000名研究人员中,88%是男性。
大型科技公司高级工程师的年薪接近100万美元。
另一方面,数据标注
工作也有了巨大的增长,尤其是在中国。这类工作的最低工资可低至每小时10元人民币。
神经网络的先驱Yann LeCun、Geoffrey Hinton和Yoshua Bengio获得了图灵奖
,这是计算机科学的最高奖项。
欧洲发表的AI论文最多,但在平均引文率这个指标上,只有中国是增长的。
该领域论文的数量整体是增长的,不同地区论文的平均被引量表明,只有来自中国的论文变得更有影响力了。美国作者发表的论文被引用的次数比全球平均水平高出83%
。
MIT在计算与人工智能领域新增10亿美元投资。在3.5亿美元捐赠的支持下,MIT新的计算学院将把MIT重新定位为向所有研究领域注入AI教育,提供了50个新的教职,使MIT在该领域的学术能力翻了一番。
大学里人工智能相关课程的注册人数也在增长,中国的增长尤其快。
与2012年相比,清华大学和斯坦福大学的人工智能课程注册人数分别增加了近16倍和5倍
。
AI研究者
性别失衡
但人工智能课程中教授和学生的性别多样性仍远未达到平等。平均而言,80%教AI的教授是男性,75%的学AI的本科生是男生。
这造成的一个结果是,在美国,申请AI方面职位的人中71%是男性。
Element.AI 2019年进行的一项AI人才调查显示:
- 对22400名个人作者在21个机器学习会议上发表的论文进行调查:只有19%的学术作者和16%的行业作者是女性。
- 44%的作者在美国获得博士学位,11%来自中国,6%来自英国。
- 五大国家——
美国、中国、英国、德国和加拿大
——雇佣了72%的作者。图上的圆圈表示每个国家在会议上发表论文的研究人员数量。
全球分布
同样是Element.AI,从AI人才流入和流出来看,加拿大、英国和瑞士都是“平台国家”,既吸引外国人才,又输出本土培养的人才。美国和中国的生态系统更为成熟——流入和流出都较低
。
但雇佣AI研究人员进入公司的趋势似乎正在放缓。据称,科技巨头冻结或减少了对AI研究人才的招聘。这可能是一个迹象,表明企业现在需要人才来将应用研究投入生产。
中国的AI发展
人脸识别
人脸识别已经成为日常消费付款方式。
经历了现金支付、刷卡支付、扫码支付的变迁后,现如今,“刷脸支付”这种让人耳目一新的便捷支付方式正在逐渐融入人们日常生活之中,而随着人脸识别相关技术不断成熟,2019年有望成为“刷脸支付”的爆发元年。
人脸识别技术是通过面部器官的位置信息。并依据这些信息,进一步提取每个人脸中所蕴涵的身份特征,并将其与已知的人脸进行对比,从而识别每个人脸的身份。人脸识别实际包括构建人脸识别系统的一系列相关技术,例如人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等。随着人脸识别技术的不断成熟以及相关政策法律的不断完善,刷脸支付将为消费者提供更加安全便捷的支付方式。
互联网公司AI技术向农业领域扩张
2018年对于农业来说是颠覆性的一年,尤其是高科技农业,一些互联网巨头纷纷布局农业,并开始扩张农业版图。
-
养鸡业:2016年,京东推出了一项“小鸡快跑(running chicken)”计划,帮助中国农业地区减少贫困。根据该计划,该公司将购买任何自由放养的鸡肉,只要其步数超过100万步,且价格是当前市场价格的三倍。现在,京东已经扩展了该项目,将人工智能工具整合到畜牧工作流程中。这包括自动喂食、浇水和清除废物。人工智能系统还将监测和识别鸡的食物摄入量、排便情况和其他生理状况,如发病情况。如果一只鸡生病了,专家会在网上提供医疗服务和处方药物。
-
养猪业:在Dekon集团、特区集团和阿里巴巴云的合作中,计算机视觉和语音识别系统被用来通过纹在猪腹部的数字来识别个体猪,还可以监测小猪发出的痛苦叫声。到2020年,Dekon计划每年饲养1000万头猪。
-
蟑螂养殖:好医生集团在四川省每年生产60万只蟑螂。他们利用人工智能系统收集和分析多达80种蟑螂的特征,如湿度、温度和食物需求,这些特征可以刺激蟑螂的生长和繁殖速度。
在过去60年里,美国农民数量(占总人口1%)急剧减少。剩余的农民将继续在育种、农作物保护、自动化以及提高农业生产率等方面使用更先进的技术。无论是从近期到中期乃至从长远来看,农业领域AI发展空间非常大,在改善育种、检测虫害、培育产品、农业技术以及供应链等应用场景上,利用AI的机会都是巨大的。
中国企业的研发支出增长迅速但显著落后于市场份额。美国企业仍占全球科技支出的61%。
半导体设备市场的危与机
由于中美贸易战的紧张局势,关键行业的气氛高度紧张,根据《AI全景报告》,中国半导体贸易逆差正(缓慢)上升,下图反映了中国半导体销售和采购的趋势。 中国半导体贸易逆差正(缓慢)上升。下图反映了中国半导体销售和采购的趋势。
在半导体材料领域,由于高端产品技术壁垒高,国内企业长期研发投入和积累不足,我国半导体材料在国际分工中多处于中低端领域,高端产品市场主要被欧美日韩台等少数国际大公司垄断。其结果就是,我们要花大量的外汇去购买美日欧厂商的先进设备,使得贸易逆差和产业安全问题难以避免。如此大的贸易逆差反映出我国半导体市场长期严重供不应求,进口替代的市场空间巨大。
危机背后往往蕴育着机会,长远来看设备国产化是必然选择,紧张局势下倒逼本土企业加大投入力度、加快发展步伐。近年来,随着国家对半导体产业的持续投入,以及民营企业的兴起,国产半导体设备产业链布局逐步走向完善,特别是在硅单晶炉、刻蚀机、封装、测试设备等壁垒相对低的领域,国产设备已经达到或接近国际先进水平,且成本优势明显。此外,一些产线配套设备、自动化设备、洁静设备等也取得了一定的市场占有率。
AI助力工业自动化
在过去的三年里,一些中国的工业企业已经自动化了40%的劳动力。这可能部分归因于自2012年以来,中国每年的机器人安装数量增长了500%(欧洲为112%)。然而,目前尚不清楚AI软件在多大程度上在运行这些已安装的机器人或者是否有助于它们的发展。中国工业自动化水平不断提高,就业岗位不断流失。
中国工业自动化水平不断提高,例如,京东上海配送中心每天使用自动化仓库机器人组织、挑选和运送20万份订单。京东的仓库数量和表面积同比增长45%,但仅需四名工人照管。
2018年,有33家中国企业在美国上市,同比增长2倍,接近2010年的历史最高水平。
发明专利的审批过程充满挑战,一旦获得批准,将获得20年的保护。实用新型和外观设计专利都有10年的使用寿命,不需要经过严格的审查,可以在不到1年内授予。这种双重专利制度使中国在专利方面领先于其他国家。中国企业拥有的专利最多,但2017年“发明专利”仅占23%。
91%的5年设计专利(左)和61%的5年实用新型专利(右)被放弃。相比之下,美国5年历史专利的维护费占85.6%。
中国企业发展迅速,但研发支出不及美国
根据《AI全景报告》,2018年,有33家中国企业在美国上市,同比增长2倍。尽管美中两国之间引人瞩目的贸易战威胁到跨境商品流动并搅动了金融市场,但美国反而迎来了自2010年以来数量最多的中国企业在美首次IPO。
在政策的促进下,在国家的全力扶持下,中国人工智能企业近两年来如同雨后春笋纷纷冒出新芽,更是在中国甚至国际上享誉盛名——全球人工智能企业总数达到2542家,中国人工智能企业数量居第二位,仅次于美国。期间不乏中国三大巨头阿里巴巴、百度、腾讯,更不乏像商汤科技、旷视科技、极链科技等后起之秀的快速崛起,大力发展人工智能,带动中国向世界人工智能大军进发甚至赶超。
同时,在企业关注科技创新的研发支出上,中国增长迅速,同比增幅达到34%,但在市场份额方面明显滞后,全球科技支出占比上仅占17%,而美国企业仍占61%。
导致两国企业研发支出差异的原因主要有以下几点
- 第一,阿里巴巴、腾讯等中国大企业更倾向于通过收购而非自主研发来实现创新;
- 第二研发预算的购买力差异,尤其是在招聘科学家和工程师方面,美国所需成本较高;
- 第三,中国科技企业相对仍较年轻,业务在全球的覆盖和预算都相对较少,硅谷巨头们的收入高于中国大型科技企业,如果以研发支出在销售收入中的占比来衡量的话,这一差距就没有那么大了。
虽然目前在研发支出方面,美国企业遥遥领先于中国,但随着时间发展,两国会逐步缩小差距。
中国专利申请数量领先,但并未转换成质的突破
在中国有三种不同的专利类别:发明,实用新型和外观设计专利。实用新型和外观设计专利都有10年的使用寿命,不需要经过严格的审查,可以在不到1年内授予。而发明专利的审批过程充满挑战,一旦获得批准,相关专利将获得20年的保护。显然,发明专利代表了推进技术“显著进步”的新思路,此类别代表了大多数人对专利的理解,是设计,流程或概念的突破。
根据报告数据显示,这种双重专利制度使中国在专利方面领先于其他国家,自2010年起,中国超越日本成为国内专利的最大囤积者,并自那以来一直保持领先地位。但在2017年,“发明专利”仅占中国专利总数量的23%。这意味着这些专利并没有那么高的含金量。
另外,数据证明,这些专利在申请后并未得到有效保留。尽管国内企业提交了大量专利申请,但是因为专利权人不愿意支付不断增加的专利费用,大多数专利在五年后即被废弃。61%的实用新型专利和高达91%的外观设计专利在5年后被废弃。相比之下,美国5年历史专利的维护费占总额的85.6%。
发明专利的低占比以及其他专利的高废弃率意味着中国仍有很长的路要走,虽然数量领先,但在质量上与美国同行的差距仍很明显。中国的专利质量需要持续提高,直到真正成为技术先进的国家。
中国目前出版的机器学习影响较大的学术研究现状。
机器学习研究已超美国,论文质量差距缩小
中国发表的ML研究已经超过美国。艾伦研究所(Allen Institute)最近的一项分析显示,中国在质量方面的差距也在迅速缩小。
中国发表的顶尖AI论文数量已经超过美国。当然,论文数量多不意味着AI科研水平高,毕竟,海量学术论文里,价值总是集中在少部分的几篇,增加一下分母并没有太高的难度。根据艾伦研究所(Allen Institute)所发布的数据分析显示,中国在质量方面的差距也在迅速缩小。
艾伦AI研究所通过分析所有论文中引用次数前50%的论文中美各自的占比,可以看出到2020年,这一部分论文中美所占比例将持平,各自占到四分之一左右;而后,便是中国大幅度领先。分析全球引用次数前1%的AI论文,也就是真正具有最高影响力、最高学术价值的那一部分。美国几乎是停滞不前的,中国则高速前进。根据图中预测,按照如今速度发展,2025年,在TOP 1%的AI论文中,中国占比也将超越美国,双方各占半壁江山,而其后,中国产出的更多AI论文势必将中国推上AI第一大国的宝座。
总结来说,从剑桥发布的《AI全景报告》中可以看出,全世界范围AI都已经开始提速,中国AI崛起的速度相当惊人,从垂直企业发展、行业应用落地、学术研究水平上都领先一筹,但在核心技术研发、高质量专利等方面上发展仍不均衡。中国离“AI全球第一”,还需要继续突破,才有可能赢得新一轮全球科技竞争的主动权。
参考资料
以上仅是报告的一小部分,原版报告内容更丰富,建议亲自阅读
- 2018年度报告
- 2019年度报告
参考来源:
- State of AI Report 2020
- State of AI Report 2019
- State of AI Report 2018
- 报告地址
- 剑桥2019年度《AI全景报告》聚焦中国,盘点全球AI大势
- 剑桥2019年度AI全景报告出炉,深度解读中国AI力量
人类水平的AI历程
【2019-08-21】 人工智能达到人类水平的里程碑
- 在 2017 年的起始人工智能指数报告中,我们列出了 AI 达到或超越人类水平的事件时间线。这份列表列出了游戏博弈方面的成果、准确的医疗诊断和 AI 能以人类水平或超人类水平执行的常见却不复杂的其它人类任务。今年,我们为该列表增添了 4 项新成就。需要重点指出,我们不应该过度解读这些结果。下面的任务都是高度特定的,这些成就虽然很亮眼,但并不代表这些系统能将这样的能力泛化到其它任务上。
时间 | 成果 | 详情 |
---|---|---|
1980 | 奥赛罗棋(Othello) | 在 1980 年代,李开复和 Sanjoy Mahajan 设计了一款基于贝叶斯学习的系统 BILL,它可以玩一个叫奥塞罗的棋牌游戏。1989 年,该系统在所有计算机玩家中获得了美国全国锦标赛冠军,并以 56-8 击败了当时位列得分榜首的美国玩家 Brain Rose。1997 年,一个名为 Logistello 的程序在与奥赛罗世界冠军保持者的对战中以 6 场全胜的战绩完胜对手。 |
1995 | 西洋跳棋 | 1952 年,Arthur Samuels 设计了一系列玩跳棋游戏的程序,并通过自我博弈来改进程序本身。但直到 1995 年,一个名为 Chinook 的跳棋程序才击败了当时的世界冠军。 |
1997 | 国际象棋 | 一些计算机科学家在 1950 年代预测计算机在 1967 年之前便可以击败人类国际象棋冠军,但直到 1997 年,IBM 公司的深蓝系统才击败了世界冠军卡斯帕罗夫。现在,即使是在手机上运行的国际象棋程序都可以达到大师水平。 |
2011 | Jeopardy! | 2011 年,IBM 公司研发的 Watson 计算机系统在著名电视智力游戏 Jeopardy! 上击败了卫冕冠军 Brad Rutter 和 Ken Jenning 并获得了一百万美元的冠军奖金。 |
2015 | Atari 游戏 | 2015 年,谷歌 DeepMind 的一个团队利用强化学习系统来学习玩 49 款 Atari 游戏。系统在大部分 游戏中达到了人类水平(比如“打砖块”),然而在如“蒙特祖玛的复仇”游戏中,系统的水平还远不及人类。 |
2016 | ImageNet 目标检测 | 从 2010 年到 2016 年,人工智能系统对 ImageNet 数据集图像的自动标注错误率从28% 降到了 3%。相比之下,人类的错误率为 5%。 |
2016 | 围棋 | 2016 年 3 月,由谷歌 DeepMind 团队研发的 AlphaGo 系统 4-1 击败了世界围棋冠军、韩国棋手李世石。随后在 2017 年 3 月,DeepMind 发布了 AlphaGo Master,它战胜了排名第一的棋手柯洁。 2017 年 10 月,《自然》杂志的一篇论文详细描述了迄今为止的另一款新一代围棋程序 AlphaGo Zero,它以 100-0 完胜先前的 AlphaGo 系统。 |
2017 | 皮肤癌分类 | Esteva 等人在《自然》杂志 2017 年发表的一篇论文中描述了一款人工智能系统,研究者训练该系统学习识别一个包含 2032 种不同疾病的 129 450 张临床图像的数据集,并比较该系统和 21 位执业皮肤科医生的诊断能力。结果显示,人工智能系统在皮肤癌诊断上的能力与专业医生不相上下。 |
2017 | Switchboard 语音识别 | 2017 年,微软和IBM两家公司均在语音识别开发上取得进展,其语音识别系统性能非常接近在有限 Switchboard 上的人类语音识别水平。 |
2017 | 吃豆人小姐 | 微软收购的深度学习团队 Maluuba 创造的 AI 系统学会了在 Atari 2600 上获得《吃豆人小姐》的最高分数值 999 900。 |
2018 | 汉英翻译 | 微软的一个机器翻译系统在将汉语新闻翻译成英语的任务上达到了人类水平的质量和准确度。该测试是在 newstest2017 上执行的,这是一个常用于机器翻译竞赛的数据集。 |
2018 | 夺旗 | DeepMind 的智能体在修改版的《雷神之锤III竞技场:夺旗 》(一款流行的 3D 多玩家第一人称视频游戏)中达到了人类水平。这些智能体表现出了类人的行为,比如导航、跟随和防守。不管是作为队友还是敌人,训练后的智能体的胜率都超过较强的人类玩家,并超过了多个已有的之前最佳系统。 |
2018 | Dota2 | OpenAI Five(OpenAI 用五个神经网络构成的战队)在有限制的 Dota 2 比赛中击败了业余人类玩家战队。OpenAI Five 通过自我对抗训练了相当于 180 年的游戏时长。(OpenAI Five 尚未超越人类,因为它被职业人类战队击败了。) |
2018 | 前列腺分级 | 谷歌开发的一款深度学习系统在基于前列腺切除标本的前列腺癌分级上达到了 70% 的总体准确率。美国执业的普通病理医生的平均准确率为 61%。此外,在验证集上分级,每个样本表现最好的 10 位普通病理医生中,该深度学习系统比其中 8 位更准确。 |
参考:
美国互联网行业报告
互联网协会(Internet Association)发布了2019年美国互联网行业最新数据,并评估了美国互联网行业的规模和范围。目前,互联网已经成为美国第四大行业,2018年创造了600万个岗位,GDP超过2万亿美元。
IA首席经济官Christopher Hooton表示:
“互联网行业是美国的成功典范,正在为各个经济部门创造就业机会。在过去十年,它的规模翻了两番,在短短几年内从第20位跃升至第4位。无论在就业还是产出方面,它仍然是美国经济的主要动力。”
该报告的主要发现包括:
- 互联网行业为美国GDP贡献了2.1万亿美元,使其成为美国第四大行业。互联网行业占GDP的10.1%,仅排在“房地产和租赁”、“公共管理(政府)”和“制造”业之后。
- 超过600万美国人在互联网行业工作,是2014年的两倍,相当于美国就业的4%。
- 互联网行业还为其他行业提供了1310万个间接就业机会。其产生的积极下游影响为每个互联网就业岗位提供了两个间接工作机会。
- 2012-2018年,互联网行业的增长速度是整个美国经济的9倍。2007-2018年间,GDP总量增长了41.8%,从14.5万亿美元增长至20.5万亿美元。互联网行业增长了约372%,从4388亿美元增长到大约2.1万亿美元,是同一时期整体经济的9倍。为了进一步比较,同期的信息行业和制造业分别增长了59.3%和26.6%。
- 2018年,互联网行业对经济的投资超过600亿美元。美国互联网公司通过资本支出在美国投资640亿美元。仅IA的成员就投资超过420亿美元。