新年来临之际,我们特意盘点了 2020 年 “智谱?AI” 联合清华大学 - 中国工程院知识智能联合研究中心、清华大学人工智能研究院、北京智源人工智能研究院重磅发布的人工智能技术发展 AI TR 系列报告,为您奉上这份干货满满心意十足的 “新年大礼包”!2020 是一个不平凡的年份。尽管全球遭遇新冠疫情,但是人工智能技术发展和学术研究依旧稳步向前、技术与产业融合也进一步扩大和深入。《智谱?AI 2020 年度人工智能技术发展报告集(AI TR)》汇集了本年度发布的针对人工智能领域的全部 TR 系列报告。AI TR 系列报告主要从基本概念、发展历史、人才概况、代表性论文解读和前沿技术进展等维度对人工智能相关子领域进行了系统详细的分析。报告所用的论文数据、国家自然科学基金、趋势数据等均来自于清华大学计算机系唐杰教授主持研发的 “科技情报大数据挖掘与服务系统平台”(简称 AMiner),通过人工智能、大数据分析与挖掘、知识图谱、自然语言处理等技术,并结合文献计量学等情报学方法制作生成。科技情报大数据挖掘与服务平台(AMiner)于 2006 年上线,经过十多年的建设发展,已收录 2.3 亿篇论文与 1.3 亿位学者,吸引了全球 220 个国家 / 地区、800 多万独立 IP 的访问,年度访问量 1100 万次。AMiner 平台曾获得 2017 年北京市科学技术奖一等奖,2013 年中国人工智能学会科学技术进步一等奖。AMiner 平台已经服务于科技部、中国科协、自然科学基金委、北京科委等政府机构,以及腾讯、华为、阿里巴巴、搜狗等企业机构。报告主题特色2020 年,智谱 AI 共计发布了 10 份、涵盖以下三个主题类别的 TR 报告。截至 2020 年 12 月,智谱 AI TR 系列报告总计下载量共计 50635 次。其中,《人工智能之认知图谱》下载量最高,为 11766 次。《区块链发展研究报告 2020》和《人工智能之机器学习》报告的下载量位居第二、三位,下载量分别为 7240 次、5570 次。一、AI 核心技术类报告AI 核心类报告包括了《人工智能之机器学习》(简版和完整版)、《人工智能之表示学习》和《人工智能之认知图谱》报告。《人工智能之机器学习》报告对机器学习发展历程、代表性专业技术、学者概况、发展趋势及应用现状等内容进行了深入梳理和概括;《人工智能之认知图谱》报告围绕认知图谱及其涵盖的知识图谱、认知推理、逻辑表达 三个技术领域,从概念、发展历程、关键技术、问题与挑战、未来研究方向等方面进行介绍和分析;《人工智能之表示学习》报告主要从概念、理论模型、领域人才、技术趋势分析等四个方面,介绍知识表示学习的技术发展和研究最新进展,并展望该技术的未来发展方向与前景。二、技术应用类报告包括《人工智能之学术搜索》、《人工智能之人机交互》、《人工智能之图数据库》、《区块链发展研究报告 2020》和《人工智能之计算机视觉》。《人工智能之学术搜索》报告,以 AI 赋能的学术搜索为核心,在梳理概念特征、发展历程、工作原理以及系统架构的基础上,重点分析了人工智能技术在学术搜索中的具体应用情况、领域专家人才现状、典型产品的资源覆盖和功能特色,以及未来发展趋势;《人工智能之人机交互》报告以人机交互技术为核心,在梳理其概念定义和发展历程的基础上,重点研究了人机交互主要技术的发展情况、领域专家现状和应用领域,列举了必读论文,并探讨了人机交互未来发展趋势;《人工智能之图数据库》报告围绕图数据库的基本概念、技术发展、产业应用、人才概况和热点趋势五大方面进行深入挖掘;《区块链发展研究报告 2020》报告系统梳理了区块链技术的发展历程、基础理论,挖掘展现了区块链研究的人才现状、技术发展趋势、最新应用场景、最新国内外政策,以及未来发展面临的技术和监管挑战等内容;《人工智能之计算机视觉》报告选取计算机视觉作为报告的主题,围绕计算机视觉的基本概念、技术发展、产业应用、人才概和热点趋势五大方面进行了深入挖掘。三、AI2000 影响力学者榜单类报告包括《人工智能全球 2000 位最具影响力学者》和《人工智能全球女性榜单》。AI 2000 是通过 AMiner 学术数据、经技术专家委员会商议,参考相关领域顶级期刊发布的论文,在全球范围内遴选 2000 位人工智能学科最有影响力的顶级学者。《人工智能全球 2000 位最具影响力学者》报告主要分析了 AI 2000 学者成就和研究领域、学者入选论文情况、领域技术分析、国家研究热度趋势、科研跨国合作情况、学者性别和年龄特征等。《人工智能全球女性榜单》则在全球范围内遴选人工智能学科最有影响力、最具活力的 179 位女性顶级学者进行重点分析。报告内容特色智谱 AI TR 系列报告具有三大特点。1. 报告对 AI 相关技术的基本概念、发展历史、人才概况、代表性论文和前沿技术进展进行了总结和解读。2. 报告对 AI 相关各领域人才概况进行分析,描述了各领域学者的水平、国家分布、机构分布、合作情况、跨境流动情况,并对代表性学者进行了专项介绍。3. 报告综合运用了文献分析、大数据分析和挖掘技术、特征抽取、人才画像等研究方法,依托 AMiner 平台数据进行了领域热点的趋势分析,跟踪并研究各领域技术动态,各国研究趋势,提供技术预见,为学界的研究方向提供咨询意见。智谱 AI TR 系列报告得到了清华大学计算机系李涓子教授、唐杰教授、朱军教授、陈文光教授、陈康副教授、喻纯副教授、刘知远助理教授、自动化系黄高助理教授的悉心指导和大力支持,在此表示衷心感谢!敬请收藏我们的智谱 AI TR 系列报告。让我们一起回顾精彩纷呈的 2020,迎接充满期望的 2021!关注同名公众号对话框回复关键词“报告大礼包”,即可获取智谱 AI TR 系列报告新年大礼包!
近期,清华大学-中国工程院知识智能联合研究中心、中国人工智能学会吴文俊人工智能科学技术奖评选基地联合发布了《2019人工智能发展报告》,遴选了13个人工智能的重点领域,包括深度学习、计算机视觉、语音识别、机器人等热点前沿技术的基础及应用研究、发展动向等。深度学习让图像、语音等感知类问题取得突破机器学习是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能。1950年,阿兰·图灵创造了图灵测试来判定计算机是否智能。图灵测试认为,如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么称这台机器具有智能。这一简化使得图灵能够令人信服地说明“思考的机器”是可能的。后来,IBM科学家亚瑟·塞缪尔开发的跳棋程序,驳倒了普罗维登斯提出的机器无法超越人类的论断,像人类一样写代码和学习的模式,他创造了“机器学习”这一术语。然而,从20世纪60年代中期到70年代末期,机器学习的发展步伐几乎停滞。无论是理论研究还是计算机硬件限制,整个人工智能领域的发展都遇到了很大的瓶颈,神经网络学习机因理论缺陷也未能达到预期效果而转入低潮。直到伟博斯在神经网络反向传播(BP)算法中具体提出了多层感知机模型,机器学习得以重振,并且直到今天BP算法仍然是神经网络架构的关键因素。神经网络研究人员相继提出了使用BP算法训练的多参数线性规划的理念,成为后来深度学习的基石。在另一个谱系中,昆兰提出了一种非常出名的机器学习算法,具体地说是ID3算法,这种算法至今仍然活跃在机器学习领域中。机器学习迎来爆发期是神经网络研究领域领军者Hinton在2006年提出了神经网络Deep Learning算法,使神经网络的能力大 大提高。Hinton和他的学生 Salakhutdinov在《科学》上发表了一篇文章,开启了深度学习在学术界和工业界的浪潮。2015年,为纪念人工智能概念提出60周年,LeCun、Bengio和Hinton推出了深度学习的联合综述。深度学习可以让那些拥有多个处理层的计算模型来学习具有多层次抽象的数据的表示,这些方法在许多方面都带来了显著的改善。深度学习的出现,让图像、语音等感知类问题取得了真正意义上的突破,离实际应用已如此之近,将人工智能推进到一个新时代。计算机视觉催生出人脸识别、智能视频监控等应用计算机视觉,顾名思义,是分析、研究让计算机智能化地达到类似人类的双眼“看”的一门研究科学,即对于客观存在的三维立体化的世界的理解以及识别依靠智能化的计算机去实现。计算机视觉技术就是利用了摄像机以及电脑替代人眼使得计算机拥有人类的双眼所具有的分割、分类、识别、跟踪、判别、决策等功能。马尔(David Marr)《视觉》一书的问世,标志着计算机视觉成为了一门独立学科。计算机视觉40多年的发展中,尽管人们提出了大量的理论和方法,但总体上说,计算机视觉经历了三个主要历程:马尔计算视觉、多视几何与分层三维重建和基于学习的视觉。目前,在计算机上调“深度网络”来提高物体识别的精度似乎就等于从事“视觉研究”。马尔的计算视觉分为三个层次:计算理论、表达和算法以及算法实现。由于马尔认为算法实现并不影响算法的功能和效果,所以马尔计算视觉理论主要讨论“计算理论”和“表达与算法”二部分内容。马尔认为,大脑的神经计算和计算机的数值计算没有本质区别,所以马尔没有对“算法实现”进行任何探讨。从现在神经科学的进展看,“神经计算”与数值计算在有些情况下会产生本质区别,如目前兴起的神经形态计算,但总体上说,“数值计算”可以“模拟神经计算”。至少从现在看,“算法的不同实现途径”,并不影响马尔计算视觉理论的本质属性。20世纪90年代初,计算机视觉从“萧条”走向“繁荣”,主要得益于以下二方面的因素:一方面,瞄准的应用领域从精度和鲁棒性要求太高的“工业应用”转到要求不太高,特别是仅仅需要“视觉效果”的应用领域,如远程视频会议、考古、虚拟现实、视频监控等;另一方面,人们发现,多视几何理论下的分层三维重建能有效提高三维重建的鲁棒性和精度。多视几何的代表性人物首数法国INRIA的O.Faugeras,美国 GE研究院的R.Hartely和英国牛津大学的A.Zisserman。2000年Hartely和Zisserman合著的书对这方面的内容给出了比较系统的总结。大数据需要全自动重建,而全自动重建需要反复优化,而反复优化需要花费大量计算资源。举一个简单例子,假如要三维重建北京中关村地区,为了保证重建的完整性,需要获取大量的地面和无人机图像。假如获取了1万幅地面高分辨率图像(4000×3000)、5千幅高分辨率无人机图像(8000×7000),三维重建要匹配这些图像,从中选取合适的图像集,然后对相机位置信息进行标定并重建出场景的三维结构,如此大的数据量,人工干预是不可能的,所以整个三维重建流程必须全自动进行。基于学习的视觉,则是指以机器学习为主要技术手段的计算机视觉研究。基于学习的视觉研究,文献中大体上分为二个阶段:21世纪初的以流形学习为代表的子空间法和目前以深度学习为代表的视觉方法。近年来,巨量数据的不断涌现与计算能力的快速提升,给以非结构化视觉数据为研究对象的计算机视觉带来了巨大的发展机遇与挑战性难题,计算机视觉也因此成为学术界和工业界公认的前瞻性研究领域,部分研究成果已实际应用,催生出人脸识别、智能视频监控等多个极具显示度的商业化应用。语音识别被应用于工业、通信、医疗等行业语音识别是让机器识别和理解说话人语音信号内容的新兴学科,目的是将语音信号转变为文本字符或者命令的智能技术,利用计算机理解讲话人的语义内容,使其听懂人类的语音,从而判断说话人的意图,是一种非常自然和有效的人机交流方式。语音识别的研究工作可以追溯到20世纪50年代。在1952年,AT&T贝尔研究所研究成功了世界上第一个语音识别系统Audry 系统,可以识别10个英文数字发音。这个系统识别的是一个人说出的孤立数字,并且很大程度上依赖于每个数字中的元音的共振峰的测量。计算机的应用推动了语音识别技术的发展,使用了电子计算机进行语音识别,提出了一系列语音识别技术的新理论——动态规划线性预测分析技术,较好地解决了语音信号产生的模型问题。在20世纪70年代,语音识别研究取得了重大的具有里程碑意义的成果,伴随着自然语言理解的研究以及微电子技术的发展,语音识别领域取得了突破性进展。这一时期的语音识别方法基本上是采用传统的模式识别策略。后来,语音识别研究进一步走向深入。这一时期所取得的重大进展有:隐马尔科夫模型(HMM)技术的成熟和不断完善,并最终成为语音识别的主流方法;以知识为基础的语音识别的研究日益受到重视。在进行连续语音识别的时候,除了识别声学信息外,更多地利用各种语言知识,诸如构词、句法、语义、对话背景等方面的知识来帮助进一步对语音识别和理解。同时在语音识别研究领域,还产生了基于统计概率的语言模型;人工神经网络在语音识别中的应用研究兴起。ANN具有较好的区分复杂分类边界的能力,显然它十分有助于模式识别。在这些研究中,大部分采用基于反向传播算法(BP算法)的多层感知网络。语音识别技术逐渐走向实用化,在建立模型、提取和优化特征参数方面取得了突破性的进展,使系统具有更好的自适应性。许多发达国家和著名公司都投入大量资金用以开发和研究实用化的语音识别产品,从而许多具有代表性的产品问世。比如IBM公司研发的汉语ViaVoice系统,以及Dragon公司研发的DragonDictate系统,都具有说话人自适应能力,能在用户使用过程中不断提高识别率。21世纪之后,深度学习技术极大地促进了语音识别技术的进步,使其识别精度大 大提高,应用得到广泛发展。2009年,Hinton将深度神经网络(DNN)应用于语音的声学建模,在TIMIT上获得了当时最好的结果。2011年底,微软研究院的俞栋、邓力又把DNN技术应用在了大词汇量连续语音识别任务上,大 大降低了语音识别错误率。从此语音识别进入DNN-HMM时代。DNN带来的好处是不再需要对语音数据分布进行假设,将相邻的语音帧拼接又包含了语音的时序结构信息,使得对于状态的分类概率有了明显提升。同时DNN还具有强大环境学习能力,可以提升对噪声和口音的鲁棒性。目前,语音识别技术已逐渐被应用于工业、通信、商务、家电、医疗、汽车电子以及家庭服务等各个领域。例如,现今流行的手机语音助手,就是将语音识别技术应用到智能手机中,能够实现人与手机的智能对话,其中包括美国苹果公司的Siri语音助手、智能360语音助手、百度语音助手等。机器人与有机生命越来越接近机器人广义上包括一切模拟人类行为或思想以及模拟其他生物的机械(如机器狗、机器猫等)。目前,智能机器人已成为世界各国的研究热点之一,成为衡量一国工业化水平的重要标志。机器人技术最早应用于工业领域,但随着机器人技术的发展和各行业需求的提升,在计算机技术、网络技术、MEMS技术等新技术发展的推动下,近年来,机器人技术正从传统的工业制造领域向医疗服务、教育娱乐、勘探勘测、生物工程、救灾救援等领域迅速扩展,适应不同领域需求的机器人系统被深入研究和开发。过去几十年,机器人技术的研究与应用,大 大推动了人类的工业化和现代化进程,并逐步形成了机器人的产业链,使机器人的应用范围也日趋广泛。在机器人崭露头角于工业生产的同时,机器人技术研究不断深入。1961年,美国麻省理工学院Lincoln实验室把一个配有接触传感器的遥控操纵器的从动部分与一台计算机联结在一起,这样形成的机器人可以凭触觉决定物体的状态。随后,用电视摄像头作为输入的计算机图像处理、物体辨识的研究工作也陆续取得成果。1968年,美国斯坦福人工智能实验室的J.McCarthy等人研究了新颖的课题——研制带有手、眼、耳的计算机系统。于是,智能机器人的研究形象逐渐丰满起来。20世纪70年代以来,机器人产业蓬勃兴起,机器人技术发展为专门的学科。工业机器人首先在汽车制造业的流水线生产中开始大规模应用,随后,诸如日本、德国、美国这样的制造业发达国家开始在其他工业生产中也大量采用机器人作业。后来,机器人朝着越来越智能化的方向发展,这种机器人带有多种传感器,能够将多种传感器得到的信息进行融合,能够有效地适应变化的环境,具有很强的自适应能力、学习能力和自治功能。智能机器人的发展主要经历了三个阶段,分别是可编程试教、再现型机器人,有感知能力和自适应能力的机器人,智能机器人。其中所涉及到的关键技术有多传感器信息融合、导航与定位、路径规划、机器人视觉智能控制和人机接口技术等。进入21世纪,随着劳动力成本的不断提高、技术的不断进步,各国陆续进行制造业的转型与升级,出现了机器人替代人的热潮。同时,人工智能发展日新月异,服务机器人也开始走进普通家庭的生活。世界上许多机器人科技公司都在大力发展机器人技术,机器人的特质与有机生命越来越接近。最近,波士顿动力公司在机器人领域的成就已经成为人们的焦点,其产品机器狗Spot和双足人形机器人Atlas都让人大为惊叹。Spot的功能十分先进,可以前往你告诉它要去的目的地,避开障碍,并在极端情况下保持平衡。Spot还可以背负多达四个硬件模块,为公司提供其他多款机器人完成特定工作所需的任何技能;Atlas已经掌握了倒立、360度翻转、旋转等多项技能,继表演跑酷、后空翻等绝技之后,Atlas又掌握了一项新技能——体操,再次让人们大开眼界。
斯坦福大学发布了“2019年人工智能指数报告”。欧洲一直是最大的AI论文出版源,2018年Scopus追踪的人工智能出版物中,欧洲的论文比例上升到27%以上。中国发表的论文占全球人工智能文章的比例从2000年的10%增长到2018年的28%。不包括学术界,在中国和欧洲,政府附属机构贡献的人工智能出版物数量最多;而在美国,企业则是人工智能论文发布的主要主体。2018年,中国政府机构发表的人工智能论文几乎是中国企业的三倍。自1998年以来,中国政府发布的人工智能论文也增长了300倍,而同期企业人工智能论文增长了66倍。2018年,美国企业发布的人工智能论文的数量是中国企业人的7倍多,几乎是欧洲的两倍。在所有三个地区,学术论文远远超过政府、企业和医学论文,占中国人工智能论文的92%,欧洲为90%,美国为85%。近年来,专注于人工智能的公司与学术界合作进行研究的情况越来越常见。机器学习(ML)是人工智能领域最活跃的研究领域之一。其中,深度学习(DL)方法近年来变得越来越流行。在arxiv上发表的深度学习(DL)论文的数量在所有地区都在增加。调查发现,2018年北美发表的DL论文数量最多,其次是欧洲。来自东亚的DL论文数量在2018年达到了与欧洲相同的水平。新加坡、瑞士、澳大利亚、以色列、荷兰和卢森堡在arxiv上发表的人均DL论文相对较高。支持199IT发展,可加入付费高端知识交流群,感谢!199IT热门报告重点推荐,可直接点击查阅2020年科技、媒体和电信预测银行业应用人工智能技术的报告2019年电子邮件营销报告报告:管理的终结2019-2020年首席营销官CMO支出年度报告2019年公平估值定价报告2019年第三季度网络营销报告2019年第三季度网络服务报告解决品牌广告适用性调查报告广告业多样性报告2019年欧洲消费者支付报告客户成功薪资调查报告2019中国首席营销官(CMO)调查白皮书2019年并购交易趋势报告2019国民出行绿皮书2019年欧洲科技报告(224页)2019年美国假期购物报告报告:解决人工智能道德问题有利于企业意见领袖营销报告:信任、交易和引领潮流的人2019年第三季度全球风险投资报告金融服务营销报告2019长三角区域创新机构发展研究报告2019年全球汽车行业颠覆报告2000-2025年第三版全球烟草使用流行趋势全球报告2020中国消费者调查报告21世纪20年代改变世界的十大趋势2019中东欧市场战略手册报告2019年全球金融科技调查报告2019年二手转售市场报告2019年数字支付调查报告2020年全球性别差距报告理解航班和旅游预定趋势报告2019年第三季度金融科技报告2019年亚太地区银行业报告2019科技趋势:超越数字前沿报告:中国电商行业日系商品观察2019国际研究生成果报告2019年社会虚假信息报告了解全球内容营销的未来2019年Q3全球应用内广告报告2019年营销组织调查报告2019年感恩节报告2019年食品和农业科技投资报告2019年中国数字乡村发展报告2019年全球零食状况调查报告2020年营销工具报告2019年欧洲广告程序化购买报告2019年媒体景观报告全球女性参与旅游业报告报告:解决B2B电子商务难题2019年营销技术报告2020年度全球时尚业态报告2019年碳排放差距报告2020年B2B内容营销报告2020年世界移民报告2019年11月移动报告2019年工程师报告移动大数据解决方案报告隐私悖论:客户行为和态度的变化报告2019年全球创新指数(GII)报告(451页)2020年世界纳税报告2019年全球移动报告亚洲美妆趋势报告2019年全球保险科技报告2019年假日购物零售报告2019年α世代消费者报告2019年首席营销官(CMO)调查报告2020年世界发展报告(中英文版)2019年网络媒体使用调查报告2019年亚太地区消费者洞察报告2019年金融科技100强2019年英国新闻消费报告2020年全球营销趋势报告2019年最佳全球品牌报告2019美国门户开放报告2019年全球超级富豪报告2019年全球城市实力指数(GPCI)报告2019移动金融报告2019年传统电视、网络视频和流视频报告2019年全球卫生保健概览报告2019年秋季播客报告2019年日本动画制作者实态调查报告(81页)Z世代和千禧一代意见领袖营销报告2019年年中音乐报告2019年假日购物趋势2019年世界知识产权报告(130页)报告:美国工作的未来(124页)2019全球音频消费者调研报告赢在人工智能:战略、组织行为与技术三位一体商务部:2018-2019年中国零售行业发展报告欧洲晴雨表报告:假新闻和虚假网络消息2019年应用和社交媒体使用报告(88页)2019年全球电池技术发展报告决胜95后:品牌如何搞定这一代年轻人2020年娱乐、媒体和科技趋势报告报告:数字时代的竞争2019上半年美国网络广告支出报告2019年第13个年度假日购物调查报告赢得2019年假日购物竞争2019全球最有价值高档和奢侈品牌Top50排行榜2019年SEO报告2019年中国进口消费市场研究报告2019年北美移动经济报告2019国家品牌价值100强2019年第二季度视频收视趋势报告第一方营销数据调查报告2019年第二季度优质视频广告报告2019年第二季度视频报告2019年第三版联网消费者报告2019年亚太地区电子商务报告| NOTICE |
德国公司IPlytics发布了一项关于人工智能技术专利的研究报告,报告分析了2008-2019年间的448684项专利,结果显示,截止2019年1月,微软共拥有18365项AI相关专利,是目前全球人工智能领域相关专利最多的公司。除2015年稍有下滑外,2008-2018年每年的AI专利数量均为增长,2018年已达到78085项,是10年前的3.4倍。从单个专利数量来看,微软以18365的专利数拔得头筹,IBM专利数15046项紧随其后,三星专利数11245项位列第三。后面依次是高通、谷歌、飞利浦、西门子、索尼、英特尔和佳能。按照同族专利数量来看,IBM位列第一,微软、三星紧随其后。在AI专利Top 10公司里,美国公司占了一半。如果按照国家来看,全球平均每年提交的AI专利中,大多数来自美国,为 279145项,中国位列第二,为66508项,欧盟紧随其后,为60346项。从专利提交的数量上看,美国占有绝对优势,是中国的4.2倍。对于这样的差距,有些朋友表示质疑,我们不妨再参考一下另一份报告。PDF版本将会分享到199IT高端交流群,感谢您的支持!199IT热门报告重点推荐,可直接点击查阅:2019年全球最具价值品牌100强2019年奢侈品全球市场研究-春季版中国电子商务发展指数报告(2018)2019年美国B2B电子商务报告商务部:中国电子商务报告20182019越南网民社交网络行为调查报告2019年内部创意管理报告2019年内容管理和策略报告2019年科技趋势之人工智能报告2018年网络攻击成本报告2019年世界投资报告报告:增强现实(AR)在营销中的应用2019年移动市场报告:零售2019年全球广告支出预测报告2019年全球最有价值的75个零售品牌2019年互联网趋势报告-原版完整版2019年个性化营销趋势报告拥抱5G新世界2019年视频广告支出报告电子商务形势报告2019-2023年中国娱乐及媒体行业展望2018年全球简单化品牌排行榜报告电视和视频的未来2023报告:在美国想要成功 学习好不如生得好报告:视频观众的一天2019年全球保险报告2019中国私人财富报告2019消费体验变革报告2019年香港数字支付报告2019年商务休闲风向标2019年电子音乐行业报告2019年全球儿童年度报告2019社交媒体指数报告2019年全球品牌足迹报告2019年全球5G竞争报告(172页)消除障碍:金融科技的新路报告期待和现实:营销自动化报告2019年现代手机游戏报告2019年全球企业人工智能发展现状分析报告2018年新能源汽车独角兽报告报告:与下一代共创世界2019亿万富豪人口普查报告2019年全球媒体行业报告报告:运动中的品牌2019年全球数字化转型现状推荐阅读:印度搜索洞察报告欧洲汽车行业2050愿景报告报告:品牌内容调查之印度报告:5G将推动视频消费进一步增长2018年营销数据报告报告:年轻人社交媒体上的社会活动2019年亚马逊消费者行为报告2019年亚太地区身份和欺诈报告2019年千禧一代调查报告2019年全球生活成本和生活质量报告2019年千禧一代调查报告2019年全球生活成本和生活质量报告广告业的信任报告2018年美国网络广告收入报告报告:弥补消费体验的鸿沟2018年全球移动支付行业报告2019年品牌忠诚报告2019年意见领袖营销报告2018-2037空客市场预测报告2019年营销受众数据概览中东跨境电商市场白皮书Z世代报告:无界限的一代2019年第一季度网络广告报告2019年直销品牌报告2019年Q1电视流媒体行业报告各世代消费者购物习惯调查2019年意见领袖营销趋势报告自动化驾驶汽车报告:消费者视角2019全球粮食政策报告(166页)2019年新闻内容发布行业前沿报告报告:2019时尚产业脉搏2019年云计算普及和风险报告2019年度非凡意义品牌调研报告 – 中国版2018年Sprout社交指数2019各国旅游业对经济的影响和趋势2018年网络防卫报告2019年网络广告欺诈流量报告报告:AR/VR给移动游戏带来新机遇2019年数字经济指南(230页)2019年大湾区金融科技报告2019年视频报告2022年资本市场愿景| NOTICE |
每天了解一点创投圈来源:德勤要点1. 人工智能正全方位商业化,在各个行业引发深刻变革;2. AI 全面进入机器学习时代,未来人工智能的发展将是关键技术与产业的结合;3. 政策与资本推动京津冀、长三角、珠三角成为人工智能企业分布最多的地区,北京、上海领跑全国;4. 人工智能重塑各行业,金融、教育、数字政务、无人驾驶、生产制造、零售、医疗等诸多行业将实现快速变革。近日,德勤科技、传媒和电信行业联合推出《全球人工智能发展白皮书》。《全球人工智能发展白皮书》深入研究人工智能技术步入商业化阶段后,在全球各主要城市的创新融合应用概况,以及其将对金融、教育、数字政务、医疗、无人驾驶、零售、制造业、智慧城市等各行业带来的深刻变革。以下为报告精彩节选:本报告不代表本号观点。如有侵权,请于留言板联系删除。
核心观点中国步入技术驱动增长的高质量发展阶段,政策将持续加码推动芯片全面国产化中国数字经济产业已经成为驱动经济增长的新动能,2019年数字经济规模占GDP的比重达36.2%;作为数字经济产业底层基础的集成电路,却严重依赖进口,2020年前八个月,中国集成电路进口金额超过万亿元;未来政策将持续加码发展集成电路产业,实现芯片全面国产化。中国AI芯片有望引领国产芯片实现弯道超车,预计2023年中国AI芯片市场规模将突破千亿元5G基站、大数据中心、人工智能等新型基础建设的完善,促使AI芯片成为引领芯片行业未来发展的重要方向;政策、资本、技术、市场等多重因素将驱动AI芯片这一新赛道快速发展,中国芯片有望实现弯道超车;预计2023年中国AI芯片市场规模将超过千亿元。存算一体化AI芯片是未来主流方向,受益于下游需求的强劲驱动力而快速发展人工智能产业的成熟化发展驱动AI芯片由通用型向专用型发展,急剧增长的数据量对AI芯片的性能以及能耗提出了更高要求;能够兼具性能和成本的存算一体化AI芯片符合未来发展趋势,在下游需求的推动下有望快速发展。以下为报告节选内容AI芯片行业相关概念介绍芯片是集成电路(Integrated circuit)的简称,由半导体材料以及电容、电阻等器件集成并封装得到,是半导体元件产品的主要构成部分。AI芯片是用于人工智能应用领域的专用集成电路。人工智能技术落地驱动AI芯片行业发展人工智能(Artificial Intelligence,AI),作为计算机科学最前沿的发展方向,同时也是新一轮产业变革的核心驱动力,具有巨大的市场前景。面向人工智能应用的AI算法,除具有传统算法一般的性能特征,还具备处理大量非结构化数据、处理过程计算量大、参数量大等新特质,亟须强大的运算能力和高效的访存能力支撑。AI芯片行业仍处在发展起步阶段AI芯片技术架构分类继“软件定义芯片”的定制化AI芯片被愈发重视后,“存算一体化”架构成为AI芯片技术架构的新发展方向。中国数字经济比重持续上升,新型基础设施是引擎随着数字化转型不断深入,中国数字经济规模持续增加。2019年中国数字经济规模达35.8万亿元,占GDP比重为36.2%。艾媒咨询分析师认为,数字经济蓬勃发展是大势所趋,人工智能、云计算、5G 等新型基础设施构成推动数字经济发展新引擎。AI芯片作为人工智能的核心关键,受益于数字经济发展浪潮,拥有广阔前景。国家大力扶植集成电路产业,政策资金多重利好持续落地面对芯片产业核心技术受限于外国的现状,近几年中央出台多项重大产业政策扶持集成电路、人工智能等产业发展,各省市同时积极跟进,利好政策全方面密集落地,从税收减免、创新鼓励、基础设施建设到资金支持等多角度为AI芯片行业发展营造良好政策环境。中国集成电路企业积极研发,夯实AI芯片行业发展基础数据显示,2020上半年,中国集成电路企业登记申请的集成电路布图设计数量达5176件,同比增长78.2%,其中广东、江苏、上海为数量排名靠前的三大地区,贡献了六成以上的总数。艾媒咨询分析师认为,中国集成电路企业积极研发,一方面是国内下游市场需求广阔,另一方面是受中美贸易影响。企业主动或被动式研发都将夯实AI芯片行业发展基础,推动中国集成电路行业实现赶超。全球集成电路市场规模波动上升,AI芯片是新方向数据显示,2019年全球集成电路市场规模达3304亿美元,较2018年出现回落。艾媒咨询分析师认为,随着产业信息化、智能化的深入,集成电路市场规模将迎来新一轮上升趋势,其中AI芯片将成为引领产业增长的主流技术方向。未来五年全球AI芯片市场将保持高速增长态势数据显示,2019年全球人工智能芯片市场规模为110亿美元。随着人工智能技术日趋成熟,数字化基础设施不断完善,人工智能商业化应用将加速落地,推动AI芯片市场高速增长,预计2025年全球人工智能芯片市场规模将达726亿美元。半导体产业向中国转移,国产AI芯片迎来新机遇AI芯片产业链图谱芯片制造资金技术壁垒高,技术变革助力国产芯片赶超芯片设计由IDM企业和Fabless企业负责,其中分工模式(Fabless-Foundry)的出现主要由于芯片制程工艺的发展,研发费用和生产线投资费用大幅上涨。芯片设计和制造环节,均涉及大量的技术和资金投入,资金壁垒和技术壁垒高,产业链条长。芯片产业链技术迭代快速,人工智能的发展加速了芯片行业技术变革。产业链转移叠加万物智联时代的到来,为基础相对薄弱的国产芯片,提供了换道超车的机会。中国AI芯片发展机遇(一):制程工艺演进,驱动芯片迭代制程工艺升级可以提升芯片集成密度,随之而来的是芯片性能的提升和功耗的降低,这也使得工艺升级成为芯片制造巨头比拼的关键。当集成密度逼近物理架构的上限,芯片性能升级效用变弱,开辟新路径、新方法升级芯片性能将成为必要之举,进而为AI 芯片行业发展注入新动能。中国AI芯片发展机遇(二):应用场景广,产品需求多元目前AI技术及应用场景大多体现在图像识别、语音识别等弱AI上,随着场景的广泛覆盖以及AI技术的进一步发展,AI芯片产品也将更加细分多元。艾媒咨询分析师认为,AI芯片商用前景广阔,但落地困难的局面导致行业并未形成稳定的市场格局,对于行业新老玩家而言是挑战,更是机遇。 中国AI芯片发展机遇(三):突破存储瓶颈,下游强力驱动AI芯片主要运用在云端和终端(包括边缘端),不同场景的应用对AI芯片的性能提出了不同要求。在以传统冯诺依曼架构方式为主的AI芯片市场中,当运算能力发展到一定程度,存储部件就决定了AI芯片的性能上限,同等条件下,“存算一体”架构能够有效降低AI芯片能耗和成本,突破“存储墙”难题,是AI芯片未来发展主流方向。 中国AI芯片行业市场规模有望持续快速增长iiMedia Research(艾媒咨询)数据显示,2019年中国AI芯片市场规模约为115.5亿元。艾媒咨询分析师认为,5G商用的普及将催生AI芯片在军用、民用等多个领域的应用需求,中国政府也有望趁5G的领先优势,倾注大量资源发展AI芯片,抢占科技战略制高点。在政策、市场、技术等合力作用下,中国AI芯片行业将快速发展,在国际上的话语权也将持续加强,预计2023年市场规模将突破千亿元。中国AI芯片需求场景发展不平衡特征明显AI芯片作为人工智能产业的发展核心,需求场景分布广泛,但发展速度并不均衡。云计算、消费电子、智能家居、智能安防是目前市场渗透度较高、发展速度相对领先的场景,而机器人、自动驾驶、智能制造和智慧医疗等应用领域发展相对缓慢,具有较大潜力。中国AI芯片主要需求场景(一):云计算iiMedia Research(艾媒咨询)数据显示,2019年全球云计算市场规模近2000亿美元,随着全球数字化的深入发展,云计算市场规模将持续增长,预计2023年全球云计算市场规模将超过3000亿美元。艾媒咨询分析师认为,一方面传统数据中心能耗高、运算效率低的特点亟需改善,另一方面新增的云计算需求催生了多元化的AI芯片产品,吸引不少新玩家进入云端芯片领域,推动了AI芯片行业的发展。 中国AI芯片主要需求场景(二):智能安防安防领域是终端AI芯片典型的应用场景,因图像识别技术以及大数据技术发展较为成熟,智能安防的发展和普及相对较快。iiMedia Research(艾媒咨询)数据显示,2019年中国安防行业市场规模达到8260亿元,并且在过去五年保持不低于10%的增长速度。艾媒咨询分析师认为,在一系列政府项目如“平安城市”、“雪亮工程”的推动下,智能安防将成为中短期内AI芯片落地的最佳场景。中国AI芯片主要需求场景(四):机器人iiMedia Research(艾媒咨询)数据显示,全球机器人出货量逐年走高,预计2023年将突破2000万个。目前的AI技术仍是弱AI阶段,不具备自主推理能力,与市场期待存在一定距离。艾媒咨询分析师认为,机器人的智能化程度将在技术和市场的双向驱动下逐步增强,AI芯片需求爆发性增长还需时日,但市场潜力巨大。寒武纪:企业介绍寒武纪成立于2016年,目前已在A股科创板上市。公司以云服务器、智能边缘设备、智能终端设备的核心处理器芯片的研发、设计、销售为主营业务。凭借过硬的技术和产品,公司得到了市场和资本的广泛认可。寒武纪:产品情况公司自研的AI芯片产品已经实现了云、边、端三大领域的全覆盖,部分产品已经实现量产出货。艾媒咨询分析师认为,寒武纪的AI芯片产品群,拥有研发的协同优势,在国产替代日趋强烈的背景下,技术和产品的商用进程将会提升,有助于巩固和强化公司的先发优势。寒武纪:经营情况过去三年,寒武纪收入增长快速,至2019年总收入达4.44亿元,2020年上半年总收入为0.87亿元,同比下降11.01%,主要系终端智能处理器IP授权业务收入大幅下降造成。艾媒咨询分析师认为,寒武纪技术及产品商业化能力虽已处国内芯片行业前列,但对大客户的严重依赖以及巨大研发投入导致的盈利问题尚未得到有效解决,未来仍需进一步优化业务及产品结构,以降低经营风险。寒武纪:舆情表现艾媒商情舆情数据监测系统显示,系统监测期间“寒武纪”网络口碑数值为47.4,整体舆论偏正向;网络关注度地域分布较广。艾媒咨询分析师认为,寒武纪作为中国AI芯片行业龙头,受到广泛关注,虽然面临股价波动与亏损的争议,但基于公司较强的科研实力以及民众对国产芯片崛起的殷切期待,市场普遍看好其发展前景。 知存科技:企业介绍知存科技成立于2017年,专注于模拟存算一体的终端智能芯片设计,主要运用于智能物联网终端应用场景。公司的模拟存算一体芯片能够有效提升AI运算效率,降低成本,2019年已推出国际首个存算一体的AI芯片。艾媒咨询分析师认为,知存科技的技术和产品,能够满足下游应用场景对芯片效率和算力日益提升的要求,符合行业未来发展方向,拥有极大的商业化价值。持续的融资进一步验证了资本市场看好其发展前景。知存科技:产品情况知存科技创新地使用eFlash存储器完成神经网络存储和运算一体化,突破了AI的存储墙问题。其存算一体芯片产品,相比于基于冯诺依曼架构的AI芯片,更契合终端应用场景对高算力、低功耗、低成本、低时延的要求。艾媒咨询分析师认为,5G、大数据、云计算等新型基础设施建设的进一步完善,将加速万物智联时代的到来,对高运算力、低功耗的存算一体AI芯片产品需求将日益强烈。知存科技自主研发的产品不仅在技术上实现了引领,还有望走在量产商用的前列。知存科技:核心竞争力艾媒咨询分析师认为,知存科技具有领先的技术优势和轻量化运营特点,集中资源深耕智能终端,有利于强化其技术和价格优势,进而巩固和提升产品竞争力,未来发展潜力巨大。知存科技:舆情表现艾媒商情舆情数据监测系统显示,系统监测期间“知存科技”网络口碑数值为52.9;网络关注度主要集中在中部和东部。艾媒咨询分析师认为,由于存算一体芯片领域在全球范围内仍处于发展初期,因知存科技是国际上首个推出存算一体芯片产品的企业,网络口碑表现较佳。随着产品应用落地加速,其品牌影响力将进一步提升。中国AI芯片行业发展趋势分析芯片行业政策利好不断,芯片全面国产化进程提速芯片是信息化时代、数字化时代的基石。中国作为全球最大的半导体消费市场,芯片自给率不足,严重依赖进口。为发展国产芯片,实现进口替代,近年来政府出台了一系列政策支持国产芯片行业发展。今年7月份,利好政策再度加码,国务院发文表示将从财税、投融资、研究开发、进出口、人才、知识产权、市场应用、国际合作等8个方面进行扶持,以加快集成电路和软件产业发展。艾媒咨询分析师认为,国家重磅利好政策的陆续出台,将推动芯片国产化进程提速,芯片行业将获得广阔的国产替代空间。数字经济时代加速到来,芯片行业迎来新一轮高速增长数字经济正在成为全球经济增长的新动能,为抢占数字经济制高点,中国加速推进5G基站、大数据中心、人工智能、工业互联网等新型基础设施建设。艾媒咨询分析师认为,数字经济时代的到来将催生大量高端芯片、专用芯片的需求,驱动国产芯片行业创新发展。受益于存量需求替代以及增量需求释放,芯片行业将迎来新一轮的高速增长阶段。半导体产业与人工智能产业融合驱动,AI芯片行业进入发展“快车道”芯片行业具有较高的技术、资金、人才等进入壁垒,半导体垂直分工模式降低了芯片行业的准入门槛,此外,以AI芯片为代表的高端芯片前景广阔。细分环节较低的准入门槛以及全新的芯片赛道,吸引了人工智能领域的新玩家入局,传统芯片企业也在加速研发适用于AI应用场景的芯片。艾媒咨询分析师认为,在半导体产业和人工智能产业的融合驱动作用下,AI芯片行业将进入发展“快车道”。AI芯片架构由通用向专用发展,存算一体AI芯片是未来趋势新型基数设施的完善,推动了人工智能技术在消费领域以及工业生产领域的应用,落地场景趋向细分化、垂直化。艾媒咨询分析师认为,下游应用驱动AI芯片由通用架构向专用架构变革,急剧增长的数据量对AI芯片的算力和功耗提出了更高要求。存算一体技术不仅能够使AI设备性能得到提升,还能降低成本。在下游应用的强驱动下,存算一体AI芯片将成为未来主流发展方向。本文部分数据及图片内容节选自艾媒研究院发布的《2020上半年中国人工智能芯片行业研究报告》。
编者按:关心AI的人一定希望了解这个行业的最新发展趋势,最近行业分析机构CBInsights最近发布了2019年AI趋势报告正好能满足这个需求。这份84页的报告识别了25种AI趋势,运用CBInsights的NExTT分析框架,从行业采用度和市场优势两个维度对其进行归类,可以为不同参与角色提供决策参考。其关键发现是对电子商务搜索词的上下文理解正在摆脱“试验”阶段,不过距离广泛采用还有很长一段路要走;深度学习是当前绝大部分AI应用的引擎。不过因为胶囊网络,这种技术可能需要改进一下了;先进医疗保健与生物测定领域的研究人员正在开始利用神经网络研究和测定此前难以量化的非典型风险因素;能访问大型标签化的数据是训练AI算法的必需,而逼真的仿造数据也许能解决这一瓶颈。为了方便各位了解,36氪对这25种趋势进行摘要编译介绍。必需开源框架AI的进入门槛变得空前的低,这要感谢开源软件。以2015年Google开源TensorFlow机器学习库为开端,现在AI(尤其是深度学习)的开源框架已经形成百花齐放的局面,其中有Facebook的PyTorch、特利尔学习算法研究所(MILA)的Theano、Keras、Microsoft Cognitive Toolkit以及Apache MXNet等等。开源AI框架是双赢的局面:一方面令人人都能用上AI;反过来,贡献者社区也为加速Google等公司的AI研究提供了帮助。知名AI专家Yoshua Bengio表示:支持深度学习研究的软件生态体系发展得很快,现在已经达到了一种健康的状态:开源软件成为规范;各种框架出现,满足了从探索新颖想法到生产部署的各种需求。而且不同的软件堆栈也在刺激的竞争氛围下得到了有力的行业玩家的支持。边缘AI对实时决策的需求正在将AI推向靠近边缘的地方。在智能手机、汽车甚至可穿戴设备等边缘设备上运行AI算法,而不是跟中心云平台或服务器通信,使得边缘设备具备了在本地处理信息的能力,并且可以更快速地对情况做出响应。Nvidia、高通、苹果及若干初创企业均在开发用于边缘的AI专用芯片。边缘AI对消费者电子、电信、医疗影像等主流行业均有应用意义。比方说监控摄像头的人脸识别、华为、苹果等智能手机的人脸与对象识别、Tesla AI芯片的即时驾驶决策、婴儿监视器、无人机、机器人视觉能力(无互联网连接)等。在2018年各大公司的财报会上,提到边缘计算的次数已经明显增多。不过尽管边缘AI具有减少延时的优势,但也存在局限。那就是存储和处理能力受到限制。预计会有更多混合模式出现,使得智能边缘设备能够相互沟通以及与中心服务器通信。脸部识别从手机解锁到登机手续,人脸识别正在进入主流。人脸识别在中国的媒体热度从2016年开始就不断升温。中国对人脸识别技术的需求也与之同步。在这方面中国已经冒出了商汤科技、Face++、CloudWalk等独角兽。美国这方面的的专利申请也呈现相似的趋势。人脸识别的早期商业应用正在安保、零售及消费者电子领域出现,并且迅速成为生物特征识别的主流形式。尽管人脸识别应用日益广泛,但这种技术并不是没有瑕疵。曾有报道称Amazon将一位国会议员认成了犯罪份子。华尔街日报记者用一张校长照片作为面具就轻易骗过了西雅图一所学校的智能摄像头。医疗影像与诊断美国FDA正在给AI即医疗设备开绿灯。2018年4月,FDA批准了无需专家补充意见进行筛查糖尿病视网膜病变病人的AI软件。该软件叫做IDx-DR,其识别率达到了87.4%,对没有此病的识别率也达到了89.5%。此外,FDA批准了初创企业Via.ai的CT扫描与潜在中风症状通知软件Viz LVO,以及初创企业Arterys的Oncology AI软件包,后者可以识别肺部与肝脏损伤。监管的放松给商业化开辟了新的道路。自2014年以来,共有80家AI影像与诊断公司完成了149项融资交易。初创企业Healthy.io的第一款产品Dip.io利用率了传统的尿液分析试纸来监控若干尿路感染:用户用智能手机拍摄试纸照片,计算机视觉算法就能根据不同的光照情况和相机品质对结果进行校正。产品可检测感染及怀孕相关的并发症。已在欧洲、以色列商用的Dip.io也已获得FDA放行。预测性维护AI工业物联网可为从制造商到设备保险商的既有者节省数百万美元的意外故障损失。预测性维护利用传感器及智能摄像头不断采集机器数据(如温度、压力等)。生成的实时数据的规模以及格式的多样使得机器学习成为工业物联网不可或缺的组件。假以时日,算法就能够提前预测故障。工业传感器成本的下降,机器学习算法的进展,以及边缘计算的推进,这些均使得预测性维护的应用变得更加广泛。从下图可以看出,对领域的投资正在逐年递增。其中活跃的投资者包括GE Ventures、西门子、SAP等。甚至微软等大公司也对自己的云与边缘分析解决方案进行扩展,提供预测性维护能力。电子商务搜索对搜索词的上下文理解已经走出“试验”阶段,但是大规模采用仍有很长一段路要走。自2002年以来,Amazon已经申请了35项与“搜索结果”有关的美国专利。其中包括利用卷积神经网络“确定一组图像与查询图像类似的物品”,利用机器学习分析图像的视觉特征,并基于此建立搜索查询等。eBay则利用机器学习来分析卖家的产品描述,然后借此寻找同类产品。但是很多买家都是使用自然语言来进行查询,这对电子商务搜索构成了挑战。新兴初创企业于是开始为零售商提供搜索技术。图像搜索初创企业ViSenze的客户包括Uniqlo、Myntra、乐天等。它可以让进店客户拍摄喜欢的东西的照片,然后上传,在网上找到同样的产品。获得阿里投资的以色列初创企业Twiggle正在基于电子商务搜索引擎开发语义API,对买家的特定搜索做出响应。试验胶囊网络深度学习是当今绝大部分AI应用的引擎。但由于胶囊网络,这种技术现在可能需要改进一下了。胶囊网络(CapsNet)是深度学习先驱Geoffrey Hinton 2017-18年时提出的概念,旨在克服当前图像识别方法(主要是卷积神经网络CNN)的缺陷。这种缺陷主要有2个。一是难以识别精确空间关系。比方说右图中尽管嘴巴的相对位置发生了改变,CNN仍会将其识别成人脸。二是无法从新的视角去理解对象。比方说下图中胶囊网络在识别1、2行为同一玩具的不同视角中表现要比CNN出色得多。CNN则需要更大的训练数据集才能认出每个方向的对象。已经有黑客通过引入少量噪音就能让CNN把目标误认成其他对象。尽管目前对胶囊网络的研究仍处在初期阶段,但有可能对目前最先进的图像识别方法构成挑战。下一代修复术非常早期的研究正在出现,通过生物、物理、机器学习的结合来解决修复术最困难的问题之一:灵敏性。从2006年开始,DARPA就投入了数百万美元跟约翰霍普金斯大学合作先进修复术计划来帮助受伤的老兵。但是这个问题解决起来并不容易。比方说让截肢者活动假肢的手指,对自发运动背后的大脑和肌肉信号进行解析,然后再转换为自动控制均需要跨学科的知识。最近,研究人员已经开始利用机器学习对植入人体的传感器的信号进行解码,然后将之翻译为移动假肢设备的指令。约翰霍普金斯大学的应用物理实验室一个进行中的项目就是利用“神经解码算法通过”神经接口来控制假肢的。去年6月,德国及帝国理工学院的研究人员利用机器学习解码截肢者残肢的信号,并让计算机来控制机械臂。另一个思路是利用中介解决方案,比如利用肌电信号来激活摄像头,然后再用计算机视觉算法估计抓手类型以及面前物体的大小。临床试验登记临床试验的最大瓶颈在于登记合适的病人库。苹果有可能可以解决这个问题。互操作性——也就是跨机构和软件系统分享信息的能力——是医疗保健的最大问题之一,尽管有了病历数字化的努力。临床试验在这方面问题尤其严重,将合适的试验与适当的病人进行匹配是很耗时且充满挑战的过程。而光美国目前就有18000项临床研究正在招募病人。理想的AI解决方案是由人工智能软件析取病人病历的相关信息,将之与进行中的试验进行对比,然后给出匹配的研究建议。在病人与医疗保健计划匹配方面,苹果等技术巨头已经取得了一定的成功。从2015年开始,苹果就推出了2个开源框架——ResearchKit与CareKit——来帮助临床试验招募病人,并且远程监控病人的健康状况。这些框架使得研究人员和开发者得以创建医疗app来监控人们的日常生活,化解了登记的地理障碍。苹果还在跟热门的电子病历供应商合作解决互操作性问题。2018年6月,苹果面向开发者推出了Health Records API。用户现在可以选择向第三方应用和医疗研究人员分享数据,为疾病管理与生活方式监控打开新的机会。生成对抗网络(GAN)两个互相比聪明的神经网络正在变得非常擅长创作出逼真的图像。你能认出下面哪些图像是假的吗?答案是全都是。这些全都是GAN创造出来的。生成对抗网络是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。该方法由Google研究人员Ian Goodfellow于2014年提出。生成对抗网络由一个生成网络与一个判别网络组成。生成网络从潜在空间(latent space)中随机采样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。扩充GAN式的大规模项目的主要挑战是计算能力。Google研究人员在创建“BigGAN”用了512块TPU来创建512像素的图像,一次试验的电耗大概就要2450到4915千瓦时之间。这已经相当于普通美国家庭半年的电耗。而且GAN要想扩充,AI硬件也的并行扩充。除了有趣的试验以外,GAN也有其他严肃的用途,比如假冒政治视频和色情作品的换脸等。随着GAN研究的扩大,这种技术势必会对新闻、媒体、艺术及网络安全构成挑战。GAN已经改变了我们训练AI算法的方式。联邦学习这种新方法旨在用敏感用户数据训练AI的同时保护隐私。我们跟智能设备的日常互动可以产生丰富的数据,这些数据用于训练AI算法的话可以极大地改善其表现,比如可以更加精确地预测你接下来要输入的字是什么。但是这些用户数据也会涉及到个人隐私问题。Google于是提出了联邦学习的方案,旨在利用这一丰富数据集的同时保护敏感数据。简而言之,你的数据依然留在你的手机里,不会发送或存储到云服务器上。而是由云服务器将最新版的算法(算法的“全局状态”)发往随机选择的用户设备上。你的手机做出改进然后基于本地化的数据对模型进行更新。之后只有这种更新(以及来自其他用户的更新)会回传给云服务器以改善该“全局状态”,然后再不断重复这一过程。把单个更新聚合起来的做法其实并不新鲜,其他算法早就这样做了。联邦学习的不同在于它考虑了数据集的两个重要特征:Non-IID:其他分布式算法均假设数据是独立同分布(Independent and identically distributed,IID)的,但其实每一部手机生成的数据都是独特的,因为不同的人使用习惯不同,联邦学习考虑到了这种不同。不平衡:某些用户使用app更加活跃,自然也会产生更多的数据。因此每一部手机的训练数据量也不一样。Firefox自称是在重要软件项目中首个实现联邦学习的用例之一。当用户在浏览器输入URL时,Firefox会利用联邦学习进行URL推荐排名。AI初创企业OWKIN则利用联邦学习来保护敏感的病人数据。其方案可以让不同的癌症治疗中心在病人数据不离开本地的情况下进行协作。先进医疗保健生物测定研究人员正在开始利用神经网络来研究和测定此前难以量化的非典型风险因素。Google的研究人员利用视网膜图像训练神经网络,然后再用该神经网络去寻找心血管风险因素。其研究发现,通过视网膜不仅可以识别年龄、性别、抽烟习惯等风险因素,还可以对这些因素量化到一定的精确程度。类似地,梅奥诊所也跟以色列初创企业Beyond Verbal合作,通过分析声音的声学特征来寻找冠心病人独特的声音特性。研究发现,当受试者描述一段情感经历时,有两个声音特性跟冠心病存在强关联。初创企业Cardiogram最近的研究发现,利用深度学习,糖尿病引起的心率变异性改变可通过现成的可穿戴心率传感器检测出来。其检测精确率可达85%。AI寻找模式的能力将会继续为新的诊断方法和识别此前未知的风险因素开辟新的道路。自动索赔处理保险公司和初创企业正开始用AI计算车主的“风险评分”,对事故场景图片进行分析,并监控司机行为。蚂蚁金服在“事故处理系统”中利用了深度学习算法来进行图片处理。过去需要理算员现场处理的事情现在可以由先进图像处理承担了。车主只需上传车辆照片给蚂蚁金服,神经网络就会分析图片,自动进行损失评估。蚂蚁金服还建立了司机的风险档案来影响车险的定价模型。他们引入了所谓的“车险分”,基于信用记录、消费习惯、驾驶习惯等利用机器学习计算车主的风险评分。初创企业Nexar鼓励司机把自己的智能手机当成行车记录仪使用,并且将记录上传给Nexar app。车主的好处是可以有车险的折扣。拿到视频的app会利用计算机视觉算法监控路况、司机行为以及事故。App还提供了“事故重现”功能,并与保险客户合作处理索赔。初创企业Tractable可以让保险公司将受损车辆图片及车损估价上传到其索赔管理平台。“AI Review”功能就可以将这些资料与库中的几千图片对比,然后进行相应的定价调整。防伪/打假假货越来越难以识别,而在线购物又让卖假货变得空前的便利。为此,品牌商正在开始利用AI来打假。拼多多在18年Q3财报会上提了11次“假货”,称“打击假货和不诚信商家非常困难。”品牌正在两条战线上对抗假货的冲击:在线上,需要识别并让侵权商品下架。在线下,需要识别宰客的假货(如高级手包)。阿里巴巴正在利用深度学习持续扫描自家平台以发现IP侵权的情况。它利用了图像识别来确认图片的特征,再加上语义识别,从而监控上架商品图片中是否有品牌名称或者口号。造假者会利用跟品牌十分类似的关键字和图片来销售假货。而且他们就像牛皮藓一样,一旦假货下架之后,他们又会换一组关键词重新发布同样的假货。初创企业Red Points正在利用机器学习扫描网站潜在的侵权情况,并且找出造假者使用的关键字选择模式。线下打假就更加棘手了,而且需要更大的人力。卖家卖或者典当二手奢侈品手包时,验证过程通常需要鉴定专家亲自检查手包的工艺、材料及缝线模式。但是一些A货已经逼真到肉眼无法辨别的地步。初创企业Entrupy 跟鉴定专家合作建立真品、赝品数据库来训练算法已有2年时间。他们利用一种可以连接智能手机的便携式显微镜让用户拍照上传物件图片,算法再分析是否具备真品独有的微观特征。不过这种办法也有局限性。因为大多数按照标准规定制造的产品都有类似的特征(造假者也运用了这些工艺)。而且像芯片、纳米材料这样的东西并不适用。Cypheme采用的是另一种办法。基于人工智能的防伪溯源技术,通过使用特种纸张作为媒介制作标签,并可进行产品溯源。公司宣称这种标签使用了独家技术,是无法仿造的。而且即便标签是原件,如果不在数据库中有记录,产品也会被识别为假货。免收银零售进店、拿货、出门,这几乎给人感觉就是入店行窃。AI可以让过去被视为盗窃的事情及免收银零售变得更加常见。Amazon Go就彻底取消了收银流程,让顾客进店取货即走。但是Amazon并没有详细介绍过未来的运营和商业计划,只是说实现利用了传感器、摄像头、计算机视觉及深度学习算法但否认使用了人脸识别技术。像Standard Cognition和AiFi这样的初创企业则抓住了机会,将Amazon Go的方案普及到零售商。免收银商店的一大挑战是如何向适当的顾客收取正确的费用。迄今为止Amazon Go是唯一成功的商业案例,但是这个案例有很多因素是受控的。只有Prime会员才能进店。其他人要想效仿,必须先建立起自己的会员制。AiFi的方案是如果下载其app就可以拿货走人,不愿意下载的可以单独开辟收银台。但是商店的基础设施应如何支持这两种方案尚不清楚。另一大问题是销售点存货损耗问题,比如算错钱或者偷盗。依图与东芝的智能收银摄像头是其中一些解决方案。但是防偷盗问题与运营范围和规模相关。Amazon Go只有1800到3000平方英尺,但使用的摄像头就达到了数百个。几乎把每一寸地方都覆盖到了。但传统的超市一般都有40000平方英尺或以上,需要解决摄像头如何布局才能高效的问题。此外,由于商品种类繁多,如何才能识别哪位购物者取走了哪件商品呢?这些需要重量传感器、摄像头以及计算机视觉算法足够强大。Standard Cognition跟日本最大的CPG批发商百陆达合作,宣称要在2020年东京奥运会前改造3000家店铺。AiFi据报道已有20个零售商客户。近期而言,这项技术的发展要取决于部署成本及存货损失成本,以及零售商能否承担这些成本和风险。后端办公自动化AI正在对事务性工作进行自动化,但是数据的不同属性和格式会对这项工作构成挑战。不同的行业和应用都有其独特的挑战。比方说临床试验里面很多试验都是手写记录然后数字化的。但是这种格式往往难以搜索,而手写的临床记录又会对自然语言处理构成独特挑战。车险索赔自动处理中评估损伤和追溯事故根源时也会遇到麻烦。不过不同的板块都在开始不同程度地采用基于机器学习的工作流解决方案。机器人流程自动化(Robotic Process Automation ,RPA)泛指任何重复性的后端事务性工作的自动化,最近是炒作的主题之一。但就像AI一样,这个词涉及内容也是包罗万象,从数据录入到合规性检查、交易处理、客户培训不等。很多ML解决方案已经开始将图像识别与语言处理整合到一起。比如WorkFusion就把了解客户与反洗钱这样的后端运营工作自动化了。独角兽UiPath的服务已拥有700多家企业客户,包括DHL、NASA、HP等。Automation Anywhere是另一家独角兽。该公司有一个案例是跟一家全球银行合作,用机器学习进行自动化人力资源管理。“IQ机器人”会从多个国家多种语言提交的表格中提取信息、清洗数据,然后自动录入到人力资源管理系统内。不过RPA在很多行业尚处在起步阶段,有的在叠加预测性分析曾之前还得闲解决数字化的问题。语言翻译语言翻译的NLP既是挑战也是有待发掘的市场机遇。大公司正在挑战极限。机器翻译在后端办公自动化存在着巨大商机,在跨国组织、客户支持、新闻&媒体等领域均有应用机会。百度的耳机翻译器跟Google Pixel buds类似,据称能完成40种语言的实时互译。有的初创企业比如Unbabel则引入了人参与到记忆翻译系统当中,目标是用反馈回环来训练算法改进。1年前,Yoshua Bengio提出了用神经网络架构来取代传统统计法的翻译方案,后来Google就升级了Google Translate Tool的算法。Google原先采用的是基于短语的机器翻译(PBMT),其新的工具采用了神经机器翻译(GNMT)方案,并且提出了解决训练模型时遇到的时间和计算资源问题的解决方案。不过最近的突破却是来自Facebook的。据称其突破在于过去的方法只有在资源丰富的语种互译时比较有效,但对少数语种的翻译就比较有局限性。Facebook提出了一种可学习 93 种语言的联合多语言句子表征架构。该架构仅使用一个编码器,且可在不做任何修改的情况下实现跨语言迁移。随着大公司不断投入资源到改进翻译框架之中,翻译效率和语言能力也将得到改善,预计机器翻译将会在更多行业得到采用。合成训练数据训练AI算法离不开大规模的标签数据集。而逼真的仿造数据有望解决这个瓶颈问题。AI算法的表现取决于获得的数据,但是为不同应用获取数据并给数据打上标签却是耗时耗钱的活儿,甚至没有可行性(不妨设想无人车需要的危险情况数据)。合成数据集可以解决这个问题。2018年3月,英伟达推出了NVIDIA推出DRIVE Constellation仿真系统,称可以在虚拟现实环境中测试自动驾驶汽车安全行驶数十亿英里。比方说设想无人车行驶过程中遇到雷暴。英伟达的解决方案会模拟这种情况下车载传感器(摄像头或LiDAR)会生成什么样的数据。合成的传感器数据再提供给计算机进行决策,就好像自己真的在开车一样,然后把命令回传给虚拟汽车。一个有趣的新兴趋势是利用AI本身帮助生成更“逼真”的合成图像来训练AI。比方说英伟达就用GAN来生成假的脑瘤MRI图像。GAN可用来“增强”现实世界数据,意味着AI可以用混合现实世界和模拟数据来进行训练,从而形成更大规模更多样化的数据集。机器人是另一个极大受益于高精度合成数据的领域之一。类似AI.Reverie这样的早期阶段初创企业正在开发仿真平台为不同行业和场景生成数据集。随着技术的发展以及合成数据能够更精确地模拟现实场景,预计这会成为无法获取大规模数据集的小公司的催化剂。威胁强化学习从训练算法击败棋类游戏的世界冠军,到教AI耍杂技,研究人员正在用强化学习挑战极限。但对大规模数据集的需求目前限制了实际应用。强化学习因为DeepMind的AlphaGo而引起了媒体的大量关注。简而言之,强化学习的要点就是为了实现目标获得最大回报你需要干什么?也正因为此,强化学习在游戏和机器人仿真方面的发展最好。DeepMind的AlphaGo一开始是利用率有监督学习(用其他人类玩家数据训练算法)和强化学习(AI跟自己下)的。不过后来的AlphaGo Zero就完全是用强化学习来实现超人的表现了。最近加州大学伯克利分校的研究人员开始用计算机视觉和强化学习教算法学习YouTube视频上的杂耍视频。在无需人工标记姿势的情况下,计算机仿真角色就能重复视频里面的动作。而且还能在新环境中应用学到的技能。不过强化学习的采用情况跟目前最普遍的有监督学习完全不能同日而语。但强化学习的专利申请情况却是在不断增长的。网络优化从促进频谱共享到资产监控乃至于天线的优化设计,AI正在开始改变电信。电信网络优化是一组改进延时、贷款、设计或者架构的技术,任何以有利的方式增强数据流的东西都算。对通信服务提供商来说,优化会直接转化为更好的客户体验。除了带宽限制之外,通信面临的最大挑战之一是网络时延。类似手机AR/VR这样的应用只有在时延极低的情况下才好用。苹果最近被授予了一项专利,就是用机器学习来组建“预期网络”,预计像智能手机这样的无线设备在未来可能会执行什么样的操作,从而提前下载数据包以降低时延。机器学习的另一项新兴应用是频谱共享。频谱共享是解决频率资源短缺的必然之道。FCC(美国联邦通信委员会)要求,3.5到3.7GHz频段必须由不同用户共享。也就是说运营商可基于可用性动态访问共享的频谱,从而可以根据网络需求对带宽进行调整。而没有获得专用频谱许可的较小商业用户也可以访问。像Federated Wireless这样的公司提供了Secure Spectrum Access(SAS,安全频谱访问)来动态分配频谱给不同等级的用户,确保不会造成干扰。2018年,Federated Wireless被授予了一项专利,该专利运用了机器学习技术来对无线信号进行分类,同时又隐藏了联邦信号的特征,从而避免被黑客利用。DARPA则希望最终能从SAS转到完全基于ML的自动化系统。为此它在2016年推出了鼓励参赛者想出自主协作动态分配频谱办法的Spectrum Collaboration Challenge。并在2017年推出了Radio Frequency Machine Learning Systems,跟Federated Wireless的方案类似,DARPA也是希望用ML区分不同类型的信号。电信玩家也准备将基于AI的解决方案整合进下一代无线通信技术,也就是5G当中。三星为了应对5G时代的到来而收购了基于AI的网络与服务分析初创企业Zhilabs,称其软件将用于分析用户流量,对应用进行分类,改善整体服务质量。高通则把AI边缘计算看作其5G计划的关键部分。还有一些研究论文开始探索用神经网络来设计最优化的天线。无人车尽管无人车市场商机无限,但何时实现全自动尚不明朗。大量技术巨头和初创企业正在这个领域拼得头破血流。这个领域最富盛名的是Google。其Waymo已经在率先部署了无人车商业车队。投资者的投资热度依然没有消退。去年GM的Cruise Automation就拿到了10多亿美元的融资,Zoox也融了5亿美元。其他的初创企业还包括Drive.ai、Pony.ai与Nuro等。中国在无人车方面尤其加大了投入。2017年,百度发布了无人驾驶开放平台阿波罗,旨在将全球合作伙伴捆绑到一起,通过生态体系其他玩家的贡献来加速AI和无人驾驶的研究。阿里巴巴也改变了怀疑态度,最近也对其无人车进行了试驾。而尽管对这项技术的未来仍有怀疑,车企还是开足了马力。预计到2025年该市场将达到800亿美元。一些行业有望成为无人车的第一个吃螃蟹者,比如物流和履约中心。自动化物流——尤其是最后一公里的送货——是零售商和履约公司的头号关切,也是有望率先实现全自动的领域。无人车可以帮助应对费钱费力的最后一公里送货问题(成本将近配送成本的1/3)。像美国亚利桑那州这样的地方对无人车部署比较友好,从而成为了热门的试验场。2018年6月,机器人初创企业Nuro开始跟美国最大百货商Kroger合作配送百货。跟其他配送机器人不同,它的配送机器不仅在人行道行走,而且还会在社区道路行驶。在饭店业,Domino’s和必胜客是试验无人车的先驱。福特正在迈阿密试验配送比萨、百货等商品。包括Domino’s在内,其合作伙伴已经超过了70家企业。作物监控三种类型的作物监控正在农业领域取得发展:地面、空中及地理空间。精准农业无人机市场到2021年预计将达到29亿美元。无人机可以进行土地映射、利用热成像监控含水量,识别虫患以及喷洒农药。初创企业则关注于在第三方无人机捕捉到的数据之上增加一个分析层。比方说Taranis就用第三方的Cessna飞机来做这件事情。去年aranis还收购了农业AI技术初创企业Mavrx Imaging,后者开发了超高清影像技术来巡视和监控土地。Taranis还利用AI技术来拼接土地成像,并且来帮助识别潜在的作物问题。农机设备制造商John Deere也在利用AI来重塑自己。它收购了农机设备公司Blue River Technology。后者有利用计算机视觉来进行智能除草与喷洒解决方案。此类个体作物监控有望成为精准农业的主要颠覆者。如果地面农机设备靠计算机视觉而变得更加智能,并且只喷洒有需求的作物的话,就可以减少对消灭附近一切的除草剂的需求。精准喷洒也意味着除草剂、杀虫剂使用量的减少。除了田地以外,计算机视觉还可以对卫星影像进行分析,从而为农业耕作提供宏观层面的理解。比如嘉吉公司就投资了Descartes Labs,后者利用卫星数据为大豆、玉米等作物建立了一个预测模型。DARPA也在跟Descartes合作来预测作物安全。暂时网络威胁追捕对网络攻击做出反应已经不够了。利用机器学习主动“搜寻”威胁正在网络安全取得良好的发展势头。计算能力与算法的进步正在把以前只有理论上可行的破解变成了真正的安全问题。2018年全球共有4.5PB的数据被盗用。相比之下,2017年为2.6PB。跟AI的其他行业应用不一样,网络防御是黑客与安全人士之间的一场猫捉老鼠的游戏,双方均利用机器学习的进步来获取优势。威胁搜寻是主动寻找恶意活动而不是对告警或者破坏情况发生后再被动反应。搜寻从假设网络存在潜在缺陷开始,然后利用手工或者自动化工具来测试该假设,这是一个持续的、不断迭代的过程。不过网络安全所涉及的数据量使得机器学习成为该过程不可或缺的一部分。不过尽管不同业务对威胁捕捉均有需求,但目前仍属于较为小众化的方向。拥有大量数据资源的大型企业会更加关切这个东西。比方说,Amazon就收购了威胁追捕初创企业Sqrrl来开发产品,抓捕AWS客户账号上的黑客。另一家AI初创企业Cylance的关注点也是威胁追捕,去年也已被黑莓收购。网络的覆盖面越广就越容易受到攻击。威胁追捕有可能会有更大的发展势头,但是这个东西本身也有挑战性,比如如何应对不断变化的动态环境以及减少误报问题。对话式AI对于很多企业来说,聊天机器人已成AI的同义词——但是希望跟不上现实。Google的会话式AI功能Duplex遇到了麻烦。Duplex可以替用户打电话和进行预订,而且沟通方式就像人一样。但是这引发了道德担忧,大家质疑Duplex跟人对话时是否应该表明自己的身份。Google还把Duplex集成到了自己的新手机Pixel 3里面。这让这部智能手机成为了AI的动力室,里面还有一个“来电筛选”的选项,可以让Google Assistant筛选掉垃圾来电。美国的FAMGA和中国的BAT均在该领域投入了大量资源,但会话式AI暂时只在某些应用领域具备一定的可行性。其中最广泛的应用之一是客户服务。聊天机器人(注:并非所有机器人都采用自然语言处理)形成了跟用户交互的第一层,然后根据复杂性程度再把查询交给人处理。但是医疗保健和保险的应用就比较有挑战性,因为这些领域的分类(测定情况的紧急程度)很复杂。类似地,基于语音的对话式购物者没有视觉线索的情况下也很有挑战。尽管分析师和CPG品牌均谈到了语音购物可能是零售的下一个大事物,但这个东西还是没有做起来。除了记录特别物品外,它未能提供可带动在线贸易的关键客户体验。心理保健是聊天机器人有望成为颠覆性力量的另一个领域。心理保健的高成本与全天候服务的吸引力导致了基于AI的心理保健机器人新时代的崛起。早期阶段初创企业的关注点是利用认知行为疗法来作为许多情绪跟踪和数字健康日记app的会话式扩展。但是心理健康的范围也很大,不同心理疾病在症状、分析主观性上各异,而且需要高级的情绪认知和人际互动。所以尽管会话式AI具备成本和便利性的优势,但在像心理保健这样的领域应用会面临很大的困难。药物发现随着AI生物技术初创企业的出现,传统制药公司正在寻求通过AI SaaS初创企业来获得长周期的药物发现的创新性解决方案。2018年,辉瑞跟AI初创企业XtalPi达成了一项战略合作关系,双方一起合作来预测小分子的制药属性,并开发“基于计算的合理药物设计”。顶级制药公司像诺华、赛诺菲、葛兰素史克、安进以及默克等均在最近宣布了跟AI初创企业的合作关系,以便为从肿瘤到心脏病等疾病发现新的候选药物。对本领域的兴趣也推动了AI药物发现初创企业股权交易的发展,2018年Q2的交易数达到了20桩,相当于2017年全年。像Recursion Pharmaceuticals这样的生物技术AI公司在AI与药物研发方面均有投入,而传统制药公司主要是跟AI SaaS初创企业合作。尽管许多这样的初创企业仍然处在融资的早期阶段,但是均声称已有制药公司客户。虽然药物配方阶段的成功指标寥寥无几,但制药公司正在押注数百万美元到AI算法身上,希望能发现新颖的治疗候选方案,并且改变冗长的药物发现流程。原文链接:https://www.cbinsights.com/research/report/ai-trends-2019/编译组出品。编辑:郝鹏程。
文/亿欧智库今年双11,阿里的AI鲁班系统完成了4亿张海报的制作,人工智能用于内容生产的高效震惊了很多人。除了阿里的鲁班,实际上近来在文章、图片、影视、游戏等内容领域,已经陆续有了AI在应用于内容生产。这一过去一直被认为需要很强的创造性,完全依赖人的产业,正在受到AI的冲击。记者、设计师、剪辑师、作曲等一众内容工作者,他们的饭碗会因此受到影响么?为了弄清AI+内容生产进行到何种程度,对内容生产可能产生何种影响,亿欧智库撰写了这份《2017 人工智能+内容生产研究报告》,对目前AI在内容生产领域的应用进行了研究,分析了AI在文本、音频、图像、视频、互动内容五大领域的具体应用情况,展望了AI在内容生产中应用的发展趋势,供相关人士参考。报告完整版详见亿欧智库。Chapter1:AI+内容生产概念界定技术进步和产业内生需求,是推动AI开始在内容生产领域应用的两个主要动力。机器生成内容的研究很早就在持续进行,随着人工智能技术的应用,开始取得突破性进展。近两年,无监督学习、深度强化学习、迁移学习、生成对抗网络等算法的研究深入,使得AI在本文处理、音频处理和图像处理方面持续取得突破。内容产业庞大而复杂,其中一部分内容已经高度模板化和套路化,从业者大量时间花在了重复劳动上,机器的引入可以减轻这部分人力劳动。一些过去很复杂的内容处理,有了AI变得简单很多,大幅降低使用者门槛。一些需要天马星空想象力的内容创作,机器反而能生成一些人想不到的奇特内容。这些原因也使得AI在内容生产领域应用有必要性。具体到内容,报告主要研究的是常见的文本类、音频类、图像类、视频类和交互内容类5个大类的内容,主要研究AI在内容生产的三个环节:前期准备阶段、中期生产阶段和后期结果检查阶段中的应用,在这些环节,AI要么替代人,要么与人协作,进行内容的生产。报告不涉及内容的分发和运营环节。Chapter2:AI+各类型内容生产文本内容:AI写新闻稿已经在头部媒体投入实际应用,由媒体自研或与技术供应商合作,用在个别领域的新闻生产。AI生产的内容在全部媒体内容中的占比还很小。大量专业内容AI还难以替代人。AI在剧本结果预测、前期素材搜集、文本纠错等方面已经得到应用,未来应用范围或许将会逐步扩展,甚至整合到各种文本编辑器和工具中。AI在作诗、编程、编剧等方面都取得了一些进展,但都属于尝试性研究,暂无太多实际商业价值。音频内容:AI已经能够自动作出一些乐曲,可用于其它内容的背景音乐或节奏,已经有多家公司凭借AI,切入了乐曲作曲领域,推出了相关产品和服务。在专业歌曲制作领域,AI还只是参与到整个作曲过程中的一环,协助人完成一些专业歌曲的创作。AI合成声音效率比起之前已经有了很大的提升,效果离人还有距离,但在虚拟歌姬界引起了波澜。图像内容:AI已经能自动生成海报、logo等。要求不高的图像内容可以直接使用AI生产的结果。更专业的内容可以在AI生成的内容上由人二次修改。鲁班制作双11海报是AI最成功的应用之一。AI的高效也使得网络海报的大规模个性化定制,千人千面成为可能。AI在图像处理方面很多研究成果惊人,但并不指向特定的商业应用。如果成功商用,将降低部分图像处理的门槛。部分研究以滤镜应用的方式商业化,偏向大众娱乐产品,不构成内容生产环节的生产力提升。视频内容:AI预测影视作品效果指导创作已经有了成功案例,作为人决策的一个补充。AI代替人拍摄录像还难以到达专业摄像水平,只能用于偏娱乐的领域。AI剪辑视频多处于研究,目前只能生成资讯类的视频框架,由人再编辑。专业视频编辑领域还没有实际应用。互动内容:AI用于游戏素材制作的方向很多,基本都还在研究开发阶段,还没实际成果产出。潜在的想象空间很大。完全由AI制作游戏短期看还不现实,已经有公司从自动生成素材的工具开始入手。Chapter3:AI+内容生产趋势AI+内容生产整体还处于非常早期的阶段,体现在数量少、阶段早、领域窄、效果差。数量少:相关公司和实际商业应用数量少,还未到商业阶段的研究项目占到了2/3以上。阶段早:大部分都还是研究项目,商业项目也刚刚开始应用,相关公司都还在天使轮和Pre-A轮阶段。领域窄:内容生产涉及众多领域,产业上下游多个环节,目前的案例和项目多集中在一些常见内容领域。效果差:很多AI生成的内容仅业余娱乐可用,达不到专业要求。 AI当前能最高水平为人类的初级工种水平。相当长一段时期内,AI在小部分领域能够实现自动生产内容,在大部分领域,AI更适合于与人协作。在于人协作的过程中,机器可能会完成大部分机械重复工作,人完成小部分创造性工作。AI能否应用,是机器换人还是人机协作,与内容适用度和技术成熟度两个关键因素相关,技术成熟度高、内容适用度高的领域,AI将先得到应用,且自动化程度高。技术成熟度低、内容适用度低的领域,AI较晚应用,自动化程度低,人的参与程度高。总体来看,未来随着AI各方面要素的持续进步,AI+内容生产还将持续取得应用,应用范围也有望逐步扩大,尤其是在黑色产业方面有着很好的应用前景。但整体毕竟还很早期,重点需要关注的还是AI生产内容能够达到何种效果。谈论后续AI以何种产品形态商业化、如何商业落地、应用后如何影响内容产业,还为时过早。总的来说,就像是机器能画出龙的身躯,但要让龙栩栩如生,还是需要人来点睛,机器能够替代人完成内容创作的大量工作,但内容创作的核心理念、思路、精髓,仍需要人来把控。毕竟,内容以人为本,最终是给人看的。文章版权属北京亿欧网盟科技有限公司所有。文章内容系作者个人观点,不代表亿欧对观点赞同或支持。
在2019年世界智能大会上,中国新一代人工智能发展战略研究院发布了《中国新一代人工智能科技产业发展报告(2019)》和《中国新一代人工智能科技产业区域竞争力评价指数(2019)》两个重量级报告。两份报告在摸清家底的基础上,揭示了中国智能经济发展的背后的“隐秩序”,系统评价了人工智能科技产业区域竞争力水平。截至2019年2月28日,报告共检测到745家中国人工智能企业,大约占世界人工智能企业总数21.67%,排名第二。企业创建时间主要集中在2010年至2016年期间。北京市、广东省、上海市和浙江省是人工智能企业最为集中的地区。中国的应用层企业占比高达75.2%,广泛分布在18个应用领域。在企业核心技术中,大数据和云计算占比最高,为21.3%,其次是机器学习和推荐、语言识别和自然语言处理、人脸和步态及表情识别,占比分别为17.2%、9.4%、8.6%。中国以28万多项专利申请位居全球首位,中国、美国和日本三国专利累计占比超过全球80%。在基础层拥有专利控制力的是美国,技术层则呈现中美双寡头局面,应用层领域中国专利占比领先。2018年,能够检测到发生融资事件的企业为577家,融资总额为3832.22亿元,是2017年的2.04倍,排名全球第一。本报告共检测到94所中国AI大学和75家非大学科研机构、人工智能产业联盟117家、163家人工智能产业园和地方政府出台的259项政策。2018年在中国境内共召开的人工智能会议823场,远高于2017年的138场。基于745家人工智能企业关系数据的价值网络分析表明,中国人工智能科技产业的创新生态系统不仅是高度开放的,而且具有强大的辐射带动作用。24.22%的企业核心人力资本拥有在国外学习经历,19.8%拥有在国外企业工作经历。企业的技术输入和技术赋能关系数占比分别为31%和69%,融资关系和投资关系数占比分别为44.11%和55.78%。包括腾讯、百度、阿里巴巴、科大讯飞和商汤科技在内的平台企业,不仅是是主要技术赋能者和人力资本供应方而且是关键投资者。从中国人工智能科技产业区域竞争力指数综合排名看,北京市、广东省、上海市、浙江省和江苏省在人工智能科技产业的发展上排在第一梯队,分值分别为90.1、42.8、28.5、25.9和18.1。排在第二梯队的省市自治区包括四川省、湖北省、辽宁省、山东省、天津市、陕西省、安徽省、湖南省、吉林省和重庆市,分值分别为9.6、8.9、8.3、8.3、8.1、7.9、7.8、6.8、6.7、6.6。在四大经济圈中,京津冀以总评分97.7分,位列四大经济圈首位。
人工智能已经成为新一轮科技革命和产业变革的核心驱动力,正在对世界经济、社会进步和人类生活产生极其深刻的影响。其中,普罗大众对人工智能感知最为深切的当属人机交互。语音交互、人脸识别等人工智能技术已经化为应用产品走进了我们的生活。近日,百度人工智能交互设计院发布了一份聚焦于未来3年内的AI人机交互趋势研究报告(以下简称“《报告》”)。该报告是百度人工智能交互设计院基于过去一年多对AI领域前沿技术、产品和设计的深入研究和洞察,结合产业界和学术界的经验探析而来。AI赋能的人机交互革新了大众的生活形态,未来,AI加持的人机交互模式又会呈现出什么样的态势呢?《报告》从“人机交互介质”、“交互对象”、“AI应用场景”、“人机关系”等方面总结了AI人机交互的八大趋势。趋势一:语音交互技术进步,更趋向人类自然对话体验研究公司Ovum预测称,到2021年,地球上的语音助手的数量会和人类一样多,人们会越来越倾向于向语音助手寻求情感上的帮助。在AI人机交互中,语音交互技术在用户终端上的覆盖最为广泛。以智能音箱为例,有数据显示,2018年全球智能音箱市场同比增长200%。其中,中国智能音箱市场增速达到罕见的5370%。谷歌、亚马逊、苹果等全球巨头企业均加速了用语音交互技术开启大众智能生活的步伐。截止2018年12月31日,搭载百度对话式人工智能操作系统DuerOS的智能设备激活量也已超2亿。目前,语音交互技术已经加速在智能家居、手机、车载、智能穿戴、机器人等行业的渗透和落地。《报告》指出,未来随着语音技术的不断完善,语音交互的自然度将进一步提升,并愈加趋向人类自然对话的体验。具体表现为:语音交互将从机械的单轮对话进阶到更流畅的多轮对话;合成语音更自然、真实,接近真人水平;语音交互具备听觉选择能力,提升多人对话体验;语音交互将支持多种方言,并针对细分群体进行差异化设计。趋势二:人脸、手势等通道更多出现在产品中,多通道融合交互成为主流交互形式媒介学家雷吉斯·德布雷(Régis Debray)曾提出:“技术能实现不同区域里不同文化的人之间的连接”。随着技术的发展,人与人之间的连接早已不成问题。当前,AI技术更是拓展了人与智能体交互的通道。除语音交互外,计算机视觉技术的发展已使得智能体实现了通过识别人脸、指纹、面部表情、肢体动作等人体信息,而更加快捷多元地与人类进行交互。但是不同的交互通道在有其独特优势和场景适用性外,也有一定的局限性。《报告》认为,未来,人与智能体的交互将融合语音、人脸、手势、生理信号等多种方式,为人类打开更多的交互空间和应用场景。具体表现为:人脸检测及识别聚集更细维度的面部特征,拓展更多的交互空间和场景;空中手势交互将成为新热点;触控、语音、手势、人脸最有可能成为多通道融合的主流通道;生理信号、触觉、嗅觉等也将成为辅助通道融入多通道交互中。趋势三:智能体开始拥有明确的人设近期,明星“人设”崩塌已成大家茶余饭后的热门话题。但是你想过,智能体也将拥有明确的“人设”么?《报告》认为,未来,用户可以更加明显地感知到智能体鲜活的“人设”。所谓智能体的“人设”是指,用户在与智能体的互动过程中,根据感知到的综合特征推断出一种具有一致性的角色形象,一般由性格(如外向、善良等)、关系(如助手、朋友等)和基本属性(如性别、年龄等)构成。《报告》指出,目前,智能体人设的设计和表达主要聚焦在语音(如音色、语调等)和语言层面(如表达方式),并且通常局限在部分场景、部分话术上,缺少一致性和全局感。《报告》提出,未来,智能体人设将从语音、产品外观、虚拟形象等多维度进行设计,甚至聘用编剧设计具有统一形象特点的话术,利用混合现实(MR)、全息投影等技术将人设具象化,让用户在不同场景下均感受到智能体一致、明显的人设特征。换句话说,未来,智能体的人设会具有很明显的特征,但不会轻易崩塌。此外,《报告》还认为,打造用户喜爱的人设也将成为企业在市场竞争中形成差异化、吸引更多用户的重要方式。趋势四:智能体在被动交互外,开始出现主动交互行为技术的发展虽然革新了我们的生活方式,但是长久以来,人机交互一直延续着人类“输入”,机器“反馈”的循环模式,人类始终是主动的,机器始终是被动的。《报告》认为,人工智能赋予了机器情境感知和自主认知能力,使我们有机会构建机器主动服务于人的交互模型。智能体出现主动交互行为的具体表现为:主动交互越来越“贴心”;主动交互在“家”和“车”的场景下率先商用落地;主动交互将提升公共场景下人机协同的效率。趋势五:智能体开始拥有情感判断及反馈智能2014年在北美上映的动画片《超能陆战队》中的机器人大白,以对主人公关怀备至的暖萌形象收获了大批影迷的喜爱。观影后的每个人都希望自己能够拥有一台如大白一样忠心耿耿又温柔体贴的机器人。令人欣喜的是,具有情感判断和应对能力的智能体正逐渐成为现实。过去20年,在人机交互中,机器基于表情、文本等方式的的情感识别能力已有很大的提升。目前市面上出现的如情感陪护机器人、智能音箱、智能汽车等已经初步具备一些情感识别能力,可以根据不同的场景、对象,进行适当的情感交互。《报告》指出,未来,情感计算技术的提升及硬件升级将赋予智能体在“视”“听”等方面更强的情感识别能力;同时智能体对于人类思维理解、情景理解能力也将更加完善,情感交互能力将更智能、更体贴。趋势六:AI对特定人群的关怀得到快速发展和应用人机交互的发展为儿童、老人、残障人士等群体更便捷地利用机器获得服务,提供了充分可能。当前市面上已经出现大量针对儿童教育的AI产品。搭载DuerOS的小度智能音箱也针对以儿童为中心的家庭语音互动需求,特别开发了儿童语音识别引擎,并定制儿童语音播报音色及对话逻辑,陪伴儿童一起成长。在养老领域,为老人提供陪聊、提醒等陪护服务的智能产品也被AI企业提上了日程。此外,少数AI产品也开始专注残障、病患等更加细分的人群,如2018年11月,百度推出了AI眼底筛查一体机,帮助患者快速筛查眼底疾病,为基层医疗带去了极大的便利。《报告》提出,未来,AI对人类的关怀将得到快速发展和应用,覆盖更加细分的人群和更深入的场景。为儿童,AI将从易于交互到提供心智陪伴的服务;为老人,AI将缩小他们与科技的鸿沟,助推他们开启品质生活;为感官残障人士,AI将帮助他们重获对世界的立体感知;为特殊疾病人群,AI将提供预测、诊断和康复服务。趋势七:智能设备互联互通,多场景衔接以BAT为首的互联网企业,在2018年纷纷调整组织架构,转向To B。巨头重提产业互联网战略成为当前市场新现象。此现象背后,正是AI、5G、云计算等新兴技术的发展与升级。2018年的政府工作报告,进一步强调了“产业升级的人工智能应用”。“产业化”和“应用化”成为未来几年人工智能的两大发展方向。《报告》指出,随着AI技术的进一步成熟和落地,及其与大数据、IoT的结合,AI将从单品智能、独立场景到互联智能,场景融合进阶。智能设备将互联互通,场景将进一步融合,实现多场景衔接;VR/AR将促进线上和线下、虚拟和现实的联结,未来,VR会加速拓展到更多的产业和实体,AR中的现实与虚拟将从简单叠加到有机融合,实现用户可以源自自然意识进行人机互动。趋势八:人机开始走向深度协同,信任构建成为首要突破点2018年6月,百度研究院发布并开源“神经条件随机场”的AI算法。该算法拥有强大的肿瘤病理切片检测能力,可以大幅提升医生阅读病理切皮的效率和准确率。人机协同即,通过人工智能增强人类智能,让人工智能成为人类智能的自然延伸和扩展。目前,人机协同已在工业领域初步实现,而随着智能体从工业生产领域向商业服务、社会服务和家居服务领域拓展,人机将走向深度协同。《报告》认为,人机深度协同可以最大化发挥双方优势,实现合作共赢。而人们对AI的信任,是智能体全面进入人类工作和生活,实现真正人机协同的前提。即,信任构建成为了实现人机深度协同的首要突破点。与此同时,AI伦理道德将更加细化,成为所有从业者需遵守的行业准绳。AI行业的发展在带给大众便利生活之时,避免算法歧视、保护人类隐私、尊重人类价值等也变成了从业者们亟需重视的问题。最后,《报告》指出,AI时代的人因工程是一个真正的系统工程。而每个人机交互行业的从业者都需要拥有AI思维。最重要的是,中国的人机交互设计和研究者们将首次和发达国家站在同一起跑线上,我们有机会去定义这些体验标准,而不再是追随或遵守。AI时代大门缓缓开启,属于中国和中国企业引领世界前沿的新时机已到来。