转载本文需注明出处:微信公众号EAWorld,违者必究。江湖上一直流传着这样的传闻:“程序员们很快就要失业了,因为人工智能马上就能写出完美的代码了”。人工智能是以软件形式存在的,编写了这些强大软件的码农们,如果被自己编写的代码所取代,来写出新一代的代码,那会是一个神奇而又悲伤的故事。我们今天就来看看人工智能在软件开发领域里的现状,我们距离传奇还有多远?有人说软件开发是一种艺术,有人说软件开发需要工匠精神,不管是哪一种说法,软件开发都是一个创造性的工作,而机器曾被认为是缺乏创造力的,但是随着深度学习的发展,人工智能在一些创造性的领域也得到了飞跃的发展。现在的人工智能可以画画:Trippy Artworks Created by Artificial Neural Networks可以作曲:musical.ai可以写作:2017年5月,机器人微软小冰出版了诗集《阳光失了玻璃窗》。 2017年,韩国某通讯社也测试使用人工智能进行足球比赛报道,几秒钟就可以稿件上线。 2018年,阿里妈妈推出的AI智能文案。下图是我用最近世界足坛最出色的球星梅西(蹭一下煤老板转会风波的热度)的名字为种子让AI创作的诗:感觉这个诗做的不错呀,把煤老板的转会风波又推进了一个意境,你觉得呢?同为创作,AI离写代码还有多远?上面提到的这些例子,大多是使用深度学习为基础来进行创作,而用深度学习技术来进行软件开发,主要面临着以下的一些挑战:1. 很难判断深度学习是一种监督学习算法,需要大量标注的数据,也就是说对数据的正确和错误打标签。但是代码很难用正确或者错误的标签来标记。也很难用数值来量化。而可用于训练的已标注的代码也非常少。2. 容错率低对于谷歌的猫狗判别算法,能有个90%可能就算是不错了,但是软件代码有99%都是对的,那可还是编译不通过,软件要求不能有任何错误。不同于自然语言,代码对于噪声非常敏感。3. 复杂的上下文开发软件需要大量的上下文知识,需求的分析,系统的非功能性要求等等,如何把这些知识融入到代码,对于AI来说,挑战颇高。尽管如此,人工智能在软件开发领域已经开始有所突破,那么我们就看看AI现阶段都能做些什么?代码辅助代码辅助指的是辅助写代码的一些功能和过程。例如代码自动补全,代码搜索推荐,代码转换等。人工智能在这个领域大有可为,想想我写代码的时候,一大半的时间在查文档,还有一大半的时间在搜google和stackoverflow,人工智能可以很好充当码农的好助手。在这个领域里,已经有了不少的创业公司和相应的产品。TabNineTabNine是加拿大一位大四学霸开发的智能代码补全工具,作者Jacob Jackson目前在滑铁卢大学主修计算机科学与组合优化专业。该工具支持23种语言,支持VS Code、Sublime Text、Atom、Emacs、Vim五种代码编辑器。在VS Code的扩展商店里,TabNine已经被下载超过万次,获得全5星好评。2019年12月,被Codota收购。KiteKite是硅谷创业公司,成立于2014年,A轮融资1700万美元。Kite提供智能代码补全,支持Python和JavaScript。Kite目前支持以下的IDE:Codata以色列的创业公司,成立于2013年,融资260万美元。Codota是一家以色列AI编程助手,专注于用AI帮程序员写代码,基于从网上学习到的编程模式,它能实时地为程序员推荐最合适的代码。它能无缝地接入程序员的集成开发环境中,帮助他们节约时间,减少人为错误。除了代码补全,它提供了聚合搜索功能,覆盖了包含github,stackoverflow等码农喜闻乐见的代码源。AromaFacebook的Aroma是一款代码到代码型搜索与推荐工具。其采用机器学习(简称 ML)技术进行代码推荐,旨在降低从大型代码库当中获取洞察见解的难度。在Aroma出现之前,各类原有工具一直无法彻底解决这个问题。文档工具往往可用性较差且严重过时,代码搜索工具通常会返回无数个匹配结果,而用户却很难立即从其中找到自己习惯的使用模式。通过 Aroma,工程师们现在能够轻松发现常见的编码模式,而不再需要手动浏览数十个代码段,这将显著节约日常开发工作所耗费的时间与精力。Stage1:基于特征的搜索,将代码语料库索引为稀疏矩阵Aroma分析代码语料库给每种method并为其创建解析树; 从解析树中提取相关变量的用法、method调用等关键的结构特征; 根据每种method的特征创建一个稀疏向量,成为索引矩阵,用于搜索检索。Stage2:重排和聚类以相似性对候选代码进行重排,相似性比较仅考虑与查询代码匹配的部分; 对重排候选代码进行迭代聚类,查找用于生成推荐代码的关键clusters。Stage3:Intersecting生成代码推荐以cluster中某一代码为基准,与其他代码进行比较迭代,得到最大公约数。与传统代码搜索工具相比,Aroma代码推荐具有如下优势:在语法树上执行搜索,可以查找语法上与查询代码相似的实例,而不是简单的字符串/令牌匹配。修剪无关语法结构突显匹配代码。 自动将相似的搜索结果聚类,生成代码建议。这些建议反映了常用的编码模式,比未聚类的搜索结果更易使用。 足够快,可以实时使用。即使对于非常大的代码库,也可以在几秒钟内生成推荐,并且不需要提前进行模式挖掘。 核心算法与语言无关。已经在Hack,JavaScript,Python和Java的内部代码库中部署了Aroma。详情可参考:https://ai.facebook.com/blog/aroma-ml-for-code-recommendation/CodeBERT微软、哈工大在arxiv上联合发表了一篇论文,标题为《CodeBERT: A Pre-Trained Model for Programming and Natural Languages》,再次拓宽了BERT的应用,将BERT应用到了Python、PHP、Java、JavaScript、Go、Ruby等编程语言的代码搜索和生成任务当中。整体方案仍然是传统的预训练+微调框架,模型规模不大。BERT作为一种双向Transformer的编码器,其对预训练方法的创新深受业界和学术界的喜爱,虽然其他大规模的预训练模型例如ELMo、GPT等已经能够在各种NLP任务中提升SOTA。但是上述提到的模型基本上都是面向自然语言处理,例如掩蔽语言建模、从未标记文本学习上下文表示。相比以往的Bert的应用场景,作者另辟蹊径,推出双模态预训练模型,即兼顾NLP任务和Python、Java等编程语言。具体来说,CodeBERT抓住了自然语言和编程语言之间的语义联系,能够支持自然语言代码搜索等NL-PL理解任务以及一系列像代码生成这样的生成任务。整体方案:预训练语言模型+下游任务微调预训练语言模型:结合NL-PL双模态Masked Language Modeling和PL单模态Replaced Token Detection训练目标的1.25亿参数预训练模型;训练损失函数为min(LMLM+LRTD)。下游任务自然语言代码搜索 :给定NL-PL对,检测模型预测masked token的能力。被作者简化为max, min, less, greater四选一问题,用NL-PL Probing方法评估。代码文档生成:从代码生成自然语言文档,用smoothed BLEU方法评估。预训练数据:210万双模态数据,640万单模态数据。六种编程语言-Python,Java,JavaScript,PHP,Ruby,Go。简单总结,CodeBERT想解决从自然语言到编程语言的映射关系。有了这样的映射关系,我们就可以用自然语言来查找对应的代码,或者直接把自然语言翻译为代码。最终(当然这个还要等很久)码农就不需要了,产品经理直接说要啥就好了。详情参考 https://arxiv.org/pdf/2002.08155.pdf代码翻译转换记得我在德国某BI企业的时候,当时产品开发做了一件事,就是把一个之前用C++写的产品用Java重写了一遍,大公司就是这么任性,虽然功能完全没有变化,但是我就是喜欢Java,因为Java代表着更先进的生产力。后来Java被竞争对手O记给收了,估计做此决策的人想死的心都有了。这个时候你需要的是一款代码自动翻译转换工具。Facebook Transcoderhttps://github.com/facebookresearch/TransCoder代码翻译的问题是,手工重新改写不仅耗时,还很难找到懂多种编程语言的程序员,基于规则等方法转换质量非常差,最新的无监督神经转换器能在某些特定范围上很好的完成代码翻译任务。Facebook最近开发的神经转换编译器TransCoder让代码转换越过了新的篇章。该系统可以将代码从一个高级语言转换成另一个,比如 c + + 、 Java 和 Python。这个系统是弱监督的,可以在没有标签的数据集中寻找以前未检测到的模式,只需要少量的人工监督。研究人员称,这比基于规则数据集的模型要高效得多。从Java到C++,TransCoder转换准确率超九成!TransCoder是基于跨语言模型预训练去做的模型初始化,这样的训练不着眼于编程语言的类型,而仅仅将表示相同指令的代码段映射为相同的表示形式。之所以TransCoder能进行跨语言模型的训练,是因为系统的标记原理着眼于跨语言之间的共同关键字,如「if」,「for」等,以及数字、数学运算符和出现在源代码中的英语字符串。这样反向翻译之后通过源-目标模型和并行训练的目标-源模型耦合,从而提高了训练的质量。代码生成代码生成聚焦在特定领域或特定任务的自动编程,即Domain-Specific Automated Programming(DAP)和Task-Specific Automated Programming(TAP)。目标是让机器完成简单的编程任务,解放开发者繁重的编程工作。这个可能是目前最接近于取代码农工作的AI。DeepCoderDeepCoder是微软和剑桥大学联合开发的一种计算机算法,可以用于自行编写代码并解决简单的数学问题。该系统分成两个组成部分:代码编写算法,以及搜索潜在代码的机制。该算法发表于2016年11月的论文中。DeepCoder所用的技术叫程序合成( program synthesis),通过截取已有软件的代码行来组成新的程序。通过学习一系列代码片(code fragment)的输入(inputs)和输出(outputs)数据,DeepCoder能自动摘取出对目标任务有用的代码片。DeepCoder 使用被称作“程序组合”(program synthesis)的方法,只要给定系统输入值和需要的输出结果,DeepCoder 便可透过搜寻其他程序的程序代码,挑出适合的程序代码片段,再组合成可运作的程序,让程序顺利生成需要的结果。事实上,这个步骤就像许多工程师常做的事:在程序问答网站 Stack Overflow 上搜寻适合的程序代码,再“复制贴上”他们认为可行的程序代码片段。所以这个跟我们之前提到的代码辅助很像。SketchCodeAirbnb研发出了一种工具可以把下面的草图直接转换为HTML5的代码。但是Airbnb没有开源,有位大神自己开源了sketch-code,可以完成类似的工作。https://github.com/ashnkumar/sketch-code经网友亲测有效,当然还不是很完美。手稿生成图可能会有小伙伴站出来挑战,html也算编程语言么?写网页能算写代码么?不急,看看最新的自然语言模型的威力吧!GPT-3OpenAI发布最新的NLP模型GPT-3使用的数据集容量达到45TB,参数个数1750亿,一个训练好的模型就要 700G的硬盘空间来存储。充分反映了“大力出奇迹”的特点。GPT-3通过对大量文本进行预训练,针对特定任务进行微调,模型的性能可以在许多 NLP 任务以及基准测试中获得显著提升。近日有开发者根据GPT-3模型上线了一个能够自动生成代码的网站debuid(https://debuild.co/)。在这网站注册后,用户只要用英语描述需求,前端代码会自动生成。GPT3正成为新的AI基础设施,巨大的新型图数据库,可以生成大段有意义的篇章,代码可通过自监督学习;以前代码生成很难超过50-60行,现在有望得到突破;以前自动生成代码很难通过测试,现在也有望突破。代码审查代码审查是现代软件开发过程中的必要流程,代码审查面临着很多挑战软件系统正变得越来越复杂:更多模块,更多执行路径,更大状态空间,逐渐超过手工检测的能力范围 资源有限,时间和人力都不够用,码农们需要996和007 团队中的专家不够用面临这些挑战,利用人工智能来提高代码审查的效率,是一个不错的途径。AWS CodeGuru ReviewerCodeGuru Reviewer 是AWS提供的代码检视服务,可发现九大类别的代码质量问题:AWS 最佳实践:正确使用 AWS API(如:轮询、分页) Java 最佳实践:正确使用常用的 Java 语言和库功能 并发:检测导致功能不正确的缺少的同步,或导致性能问题的多余的同步。 死锁:检查并发线程之间的协调 资源泄露:正确处理资源(如,释放数据库连接) 敏感信息泄露:个人身份信息泄露(如,记录信用卡详细信息) 常见的代码错误:难以发现的缺陷,例如,没有为每次 Lambda 调用创建客户端 代码克隆:识别可以整合的重复代码,以提高代码可维护性 输入验证:检查来自不受信任来源的格式错误的数据或恶意数据DeepCodeDeepCode是静态代码监视工具(和前面提到的DeepCoder不要搞混),使用机器学习分析代码库中的安全缺陷和潜在错误,领会代码背后真实意图。DeepCode是一家瑞士startup,成员主要来自ETH。与其他Code Review AI相比,它不仅能够发现语法错误,而且能够确定代码的意图,因此能够识别更多潜在的重要错误和漏洞。DeepCode实现了一种方法,可以在达到临界安全级别之前分析用户输入处理。因此,当任何数据在没有安全验证或清除的情况下从一个点移动到另一个点时,该工具会将其标记为受污染的,并向您发出警告。该工具可以标记的问题包括跨网站脚本、SQL注入威胁、远程代码执行以及路径遍历攻击等。快速精准理解代码背后真实意图,准确定位语法错误和漏洞训练流程:DeepCode的模型训练分三步进行:Step1:将各类编程语言写成的代码进行解析,生成解析树;Step2:通过线性复杂度数据求解器可在几秒内完成代码库分析;Step3:语义事实表示方法用于ML模型理解代码结构及其背后意图。战略简要,覆盖面广和技术优势是DeepCode的制胜法宝:战略重点简明扼要:让机器code review可以提供尽可能多的、更广泛且深入的代码建议;缺陷检测覆盖范围广:其他现有静态分析工具的缺陷检测范围仅为DeepCode的十分之一;可以快速兼容来自其他工具的checkers/rules/patterns;可与GitHub,GitLab集成。程序分析、AI算法、特征工程和大数据多种能力互补,形成独特技术优势:持续从开源项目在线学习的能力;独立于编程语言的平台,可以在几周内完成新语言添加;无需编译,大型代码库平均分析时间仅5秒(其他方案一般要通宵)。代码测试人工智能在代码测试的市场空间最大,通过大量规则和AI结合定制,解决测试领域的难题。AI正在改变软件测试:差异性、可视性、说明性、自动化…计算机图形学协助UI测试:AI保证UI元素有正确的颜色、位置、尺寸等,传统手工或基于规则的方法很难检测差异性,难以自动化; API测试自动化:通过人工智能算法,让API测试自动进行 自动创建测试用例:AI可以学习应用程序,了解文档模型的关系以及变化,自动生成用例。 测试用例相关性检测:任何代码小改动,不需要重测整个代码,通过AI分析,只运行相关的测试。这个相当于是推荐系统,推荐需要运行的测试用例。人工智能正在逐步改变整个软件测试领域,可以大量节省测试时间,增加代码质量,软件测试正在从DevOps向AI过渡,由简单的发现问题转到根据上下文找到根因,从人工测试走向全自动化测。2019软件测试市场126亿美元,2024年288亿美元。利用人工智能辅助软件测试的工具很多,下面列出几个比较有特点的:Mabl首款基于机器学习的商用智能软件测试工具,使用机器学习技术,开创了智能化软件测试的先河。开发mabl的是一家位于波士顿的创业公司。共同创始人是Dan Belcher和Izzy Azeri。这两位哥们是连续创业者。他们于2014年创办了Stack Driver。这家公司为云平台(例如谷歌GCP,亚马逊AWS)上的应用程序提供监测和诊断服务。后来这家公司被谷歌收购,这两位就进入了谷歌工作。2017年初,他们又出来创业,创办了mabl。公司一经成立,便获得了来自Charles River Ventures和Amplify Partners和1000万美元首轮投资。不到一年,便发布了面向商业市场的mabl产品(https://www.mabl.com/)。mabl以SaaS(software-as-a-service)方式,为用户提供智能软件测试服务。软件测试的全过程自动化,不再需要人工参与。自动创建和执行测试,自动分析测试结果,同时还能根据需求的变化自动适配和维护测试。mabl的口号非常响亮:You write code, mabl tests (你写代码,mabl来测试)。mabl使用机器学习技术,自动创建和执行测试(Tests),自动分析测试结果,同时还能根据需求的变化自动适配和维护测试。也就是说,mabl将软件测试的全过程均自动化了。有了mabl,软件测试将不再需要人工参与。mabl已经脱离了自动化软件测试的范畴,开创了智能化软件测试(intelligent testing)的先河。机器学习为软件测试自动化的用户体验带来质的飞跃,它提供:无脚本测试:测试人员无需创建和维护测试用例。测试工作由机器学习算法在没有测试用例的情况下自主完成。 无基础设施:mabl以SaaS的方式提供服务,用户无需安装和维护任何本地基础设施。 自动维护测试:当产品发生改变时,机器学习算法自动适配这种变化。 自动分析结果:mabl自动分析结果、定位问题原因。 第三方集成:mabl与Jenkins,Slack,Jira等第三方工具均能很好的集成。test.aiTest.AI(前身为Appdiff)被视为一种将AI大脑添加到Selenium和Appium的工具,以一种类似于Cucumber的BDD语法的简单格式定义测试。Test.AI在任何应用程序中动态识别屏幕和元素,并自动驱动应用程序执行测试用例。它由Justin Liu和Jason Arbon创建。这家初创公司刚刚在Gradient Ventures领投的A轮融资中获得了1100万美元的投资,Gradient Ventures是谷歌专注于人工智能的风险基金。参与此次投资的还有e.ventures、Uncork Capital和Zetta Venture Partners。成立于2015年Test.ai迄今为止已经融资1760万美元。该公司的技术不仅仅是利用人工智能来缩短应用测试所需的时间;当开发人员准备要测试的场景列表时,它有助于消除更加冗长的过程。Test.ai已经对他们的机器人进行了“成千上万个应用”的训练,以帮助它了解一个应用的样子以及它们通常diffblueDiffBlue是一种非常有用而又简单的用于代码自动化的平台。DiffBlue有几个核心目的——测试编写、bug定位、重构代码以及发现和替换弱点的能力——这些都是通过使用自动化实现的。Diffblue专注于用AI技术为代码提供数字模型,Diffblue正在研发三款产品,分别是用于发现bug,编写测试代码的测试产品;能够自动标记bug并对其进行测试的安全产品;以及自动修改不合理代码或过时代码的重构产品。在AI辅助自动化测试领域,还有很多产品,这里就不一一细说,它们有: apptest.aiAI辅助的移动应用自动化测试 Appvance IQ根据应用程序的映射和实际用户活动分析,使用机器学习和认知自动生成自动化测试脚本 Eggplant AI使用AI和深度学习来从界面上寻找缺陷,能够自动生成测试用例,大幅度提高测试效率和覆盖率。 Sauce Labs利用机器学习来针对测试数据进行分析,更好地理解测试行为,主动改进测试自动化。 Sealights利用机器学习技术分析SUT的代码以及与之对应的测试,不局限于单元测试,还包括系统级的业务测试和性能测试。它还基于机器学习呈现完整的质量Dashboard,帮助我们进行“质量风险”的评估。 Testim专注于减少不稳定的测试(flaky tests)和测试维护,试图利用机器学习来加快开发、执行和维护自动化测试。总之软件测试的自动化正在向着越来越智能的方向前进。总结机器会取代人类么?人工智能会抢走码农的饭碗么?AI有想象力么?这些问题,我没有答案,当马斯克推出他的脑机接口的时候,我在想,未来AI和人类的交互会变得更容易,AI可能不会取代人类,但是它会和人类融为一体,我和我的AI结对编程,那样应该也不错!
中国人工智能的研究起步晚且发展道路曲折,直至改革开放发以后,才逐步走向正轨。进入新世纪后,国际人工智能领域接连取得重大突破,这使得国内各界产生了强烈的“时不我待”之感。2017年3月,“人工智能”首次被写入政府报告,7月,国务院印发《新一代人工智能发展规划》,从国家层面对人工智能发展进行了统筹规划和顶层设计。与此同时,市场上人工智能领域融资迅速突破千亿大关,几十所高校成立了人工智能学院,一大批人工智能创业公司如雨后春笋般迅速涌现。长期的积累,加上适时的刺激,使得中国的人工智能产业在近几年内获得了井喷式的发展,论文总数稳居世界首位,人工智能芯片研究方面后来居上、连战连捷。对现有技术的应用方面,中国具备人工智能技术理想的试验场,在实践的刺激下,数据得以迅速反馈,云计算的迭代计算得以大展身手,智能支付、智慧医疗、智能驾驶、语音识别、人脸识别等领域的技术日新月异、进展神速。
人工智能通常是指执行在人类决策领域内的计算系统。这些软件驱动的系统和智能代理包含高级数据分析和大数据应用程序。AI系统利用这个知识库来制定决策并采取近似认知功能的行动,包括学习和解决问题。人工智能是在20世纪50年代中期作为科学领域引入的,近年来发展迅速。它已成为编排数字技术和管理业务运营的宝贵而重要的工具。特别有用的是机器学习和深度学习。认识到人工智能是一个不断移动的目标是很重要的。曾经被认为属于人工智能领域的东西,例如光学字符识别和计算机象棋,现在被认为是常规计算。如今,机器人、图像识别、自然语言处理、实时分析工具和物联网中的各种连接系统都利用人工智能来提供更先进的功能。帮助开发AI的是许多云计算公司,提供基于云的AI服务。行业专家预计,到2025年,人工智能将以每年超过127%的速度增长。到那个时候,人工智能系统的市场将超过48亿美元。咨询公司报告称,到2035年,人工智能可能通过“改变工作性质,在人与机器之间创造一种新的关系”,将年度经济增长率提高一倍。不出所料,随着这项技术渗透到商业和日常生活中,观察家们对它既表示欢迎,也表示嘲笑。人工智能的历史:复制人的心灵开发能够模仿人类认知的机器的梦想可以追溯到几百年前。在19世纪90年代,像威尔斯这样的科幻作家开始探索机器人和其他机器像人类一样思考和行动的概念。然而,直到20世纪40年代初,人工智能的概念才真正成形。在艾伦·图灵介绍了计算理论之后,其他研究人员开始探索创建人工智能框架的方法。1956年,达特茅斯学院的研究人员开始了人工智能的实际应用。这包括教电脑玩跳棋,其水平可以打败大多数人。在接下来的几十年里,人们对人工智能的热情时高时低。1997年,IBM公司开发的国际象棋计算机“深蓝”击败了当时的国际象棋世界冠军加里·卡斯帕罗夫。2011年,IBM推出了沃森,它使用了更复杂的技术,包括深度学习和机器学习,打败了《危险边缘》冠军。尽管人工智能在未来几年继续发展,观察家们经常将2015年作为人工智能的里程碑。谷歌云、亚马逊网络服务和微软Azure等公司开始加大研究力度,提高自然语言处理能力、计算机视觉和分析工具。今天,人工智能被嵌入到越来越多的应用程序和工具中。从企业分析程序到Siri和Alexa等数字助手,再到自动驾驶汽车和人脸识别,这些都有。AI采用不同的形式人工智能是一个涵盖所有机器智能的术语。然而,人工智能研究和应用有几个不同的领域——尽管它们有时会重叠。这些包括:一般的人工智能。这些系统常常从周围环境中学习,并以跨领域的方式应用数据。例如,现在归谷歌所有的DeepMind,利用神经网络学习如何玩类似于人类玩的视频游戏。自然语言处理(NLP)。该技术允许机器阅读、理解和解释人类语言。NLP使用统计方法和语义编程来理解语法和语法,在某些情况下,还可以理解作者或聊天机器人之类的系统与之交互的情感。机器感知。在过去的几年里,传感器——相机、麦克风、加速度计、GPS、雷达等等——在驱动机器感知方面取得了巨大的进步。机器感知包括语音识别和计算机视觉,用于人脸和物体识别。机器人技术。机器人设备广泛应用于工厂、医院等场所。近年来,无人机也开始飞行。这些依赖复杂映射和复杂编程的系统还使用机器感知来导航任务。社会智能。自动驾驶汽车、机器人以及Siri和Alexa等数字助手需要进行协调和编排。因此,这些系统必须理解人类行为并认识到社会规范。人工智能方法论有许多方法用于开发和构建人工智能系统。这些包括:机器学习(ML)。人工智能的这一分支使用统计方法和算法来发现模式,并“训练”系统在没有显式编程的情况下做出预测或决策。它可能由监督和半监督ML(包括分类和标签)和非监督ML(仅使用数据输入,不使用人工应用的标签)组成。深度学习。这种方法依赖于人工神经网络(ANNs)来近似人脑的神经通路。深度学习系统对于开发计算机视觉、语音识别、机器翻译、社交网络过滤、视频游戏和医学诊断尤其有价值。贝叶斯网络。这些系统依赖于使用随机变量和条件独立性的概率图形模型,以便更好地理解和处理事物之间的关系,比如药物和副作用或黑暗和打开电灯开关。遗传算法。这些搜索算法采用了一种模仿自然选择的启发式方法。他们使用突变模型和交叉技术来解决复杂的生物挑战和其他问题。人工智能在现实世界中人工智能并不缺乏令人信服的用例。以下是一些主要的例子:医疗保健人工智能在医疗保健领域可以发挥主导作用。它使卫生专业人员能够更深入地了解危险因素和疾病。它可以帮助诊断和洞察风险。人工智能还为智能设备、手术机器人和物联网(IoT)系统提供动力,这些系统支持患者跟踪或警报。农业人工智能现在广泛应用于农作物监测。它帮助农民以最佳水平施用水、肥料和其他物质。它还有助于对农业设备进行预防性维护,并正在生产采摘作物的自主机器人。金融人工智能改变的行业很少能超过金融业。今天,定量投资者(算法)在没有人为干预的情况下交易股票,银行立即做出自动信贷决策,金融机构使用算法来发现欺诈。人工智能还允许消费者使用智能手机扫描纸质支票和存款。零售越来越多面向消费者的应用程序和工具支持图像识别、语音和自然语言处理以及增强现实(AR)功能,这些功能允许消费者在房间或办公室里预览一件家具,或者不用去实体店就能看到妆容。零售商也在使用人工智能进行个性化营销、供应链管理和网络安全。旅游,交通和酒店航空公司、酒店和租车公司使用人工智能来预测需求并动态调整定价。航空公司也依赖人工智能来优化航线对飞机的使用,考虑到天气条件、乘客负荷和其他变量。他们也能理解飞机何时需要维修。酒店正在使用包括图像识别在内的人工智能部署机器人和安全监控。自动驾驶汽车和智能交通网络也依赖人工智能。AI的好处和风险对于企业来说,这不是是否使用人工智能的问题,而是如何最大化收益和最小化风险的问题。作为起点,了解人工智能如何以及在哪里可以改进业务流程,并构建一支理解人工智能是什么、它在哪里适用以及它提供了什么机会的劳动力队伍,是至关重要的。这可能需要员工具备新的知识和技能,人工智能的薪资具有竞争力,同时重新考虑服务提供商、工作流和内部流程。人工智能还带来了其他挑战。人工智能最大的绊脚石之一,包括机器学习和深度学习,是构造糟糕的框架。当用户用错误的数据训练模型或构建有缺陷的统计模型时,往往会出现不正确甚至危险的结果。人工智能工具虽然越来越容易使用,但需要数据科学专业知识。其他重要因素包括:确保有足够的计算能力和适当的基于云的基础设施,以及减轻对失业的担忧。无论如何,人工智能正带来创造更智能、更强大机器的大胆机遇。未来几年,人工智能必将进一步改变商业和生活。
高层速读关键信息:本报告对19个行业的400多个案例进行了分析,强调了人工智能技术的广泛使用和巨大的经济潜力。介绍了主流的机器学习技术与神经网络,分析了深度学习在企业中的应用目的与效果,阐明了训练AI所需的各种数据与资源。关键数据:2/3的企业表明使用深度学习是为了提高现有性能;69%的案例表明深度神经网络可以提高技术无法达到的性能;15%的案例完全应用了深度神经网络。关键意义:深度学习的价值并不在于模型和算法有多优秀,而是在于公司如何运用它。借鉴麦肯锡全球研究所的研究成果和麦肯锡分析公司的应用经验,本报告评估了人工智能技术在各个行业和业务功能中的实际应用和经济潜力。通过报告发现了深度学习技术在整个经济中的巨大潜力,同时也存在限制和障碍,随着技术的继续发展,未来的机会也会出现。以及,深度学习的价值并不在于模型和算法有多优秀,而是在于公司如何运用它们。需要强调的是,即使我们看到了使用人工智能技术的经济潜力,也必须考虑数据的使用涉及到的数据安全、隐私和偏见等问题。三种学习技术&四大神经网络最为流行随着人工智能技术的发展,人工智能技术的定义也在不断拓展。除了深度学习之外,报告还研究了其他机器学习技术和传统分析技术,但迁移学习、强化学习和深度学习是人工智能中应用最多的技术。▲人工智能中各种技术的应用热度神经网络是机器学习技术的一个子集。从本质上讲,它们是基于模拟连接“神经单元”的人工智能系统,大致模拟了神经元在大脑中相互作用的方式。自20世纪40年代以来,人们一直在研究由神经连接的计算模型,随着计算机处理能力的增加,以及大量的训练数据集被用于成功分析图像、视频和语音等输入数据,这些模型又重新流行起来。人工智能研究者们便将这些技术称为“深度学习”,因为神经网络有许多深层的模拟神经元层。报告分析了三种最流行的神经网络技术的应用和价值:前馈神经网络(Feed forward neural networks):最简单的人工神经网络。在这个体系结构中,信息只从一个方向移动,从输入层通过隐藏的层,到达输出层,网络中没有循环。第一个单神经元网络是由人工智能先驱Frank Rosenblatt于1958年提出的。循环神经网络(RNNs):这种人工神经网络之间的连接包含循环,非常适合用于序列输入。卷积神经网络(CNNs):这种神经网络的神经层连接较为特殊,它们之间的连接是受动物视觉皮层组织的启发而来,而动物视觉皮层是负责处理图像的大脑的一部分,非常适合于感知任务。此外,针对调查案例,报告还考虑了生成对抗网络(GANs)和强化学习。生成对抗网络(GANs):通过生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生好的输出。 GANs可以学习模拟各种数据的分布(例如文本、语音和图像),因此在生成测试数据集时,它们是很有价值的。强化学习是机器学习的一个子领域,在这个领域中,系统通过接受虚拟的“奖励”或“惩罚”来训练,本质上是通过不断的尝试和错误来学习。谷歌旗下的DeepMind利用强化学习开发了AlphaGo以及视频游戏。在商业环境中,这些分析技术可用于解决实际问题。报告整理和分析了19个行业的400多个案例,通过对特定领域内的调查发现,在这些领域中,深度神经网络的运用可以使企业价值最大化,与传统分析方法相比,这些神经网络可以产生的增量提升,但要在容量、多样性和速度方面追求,需要大量的数据。深度学习可以用来提高现有性能预测机器维修:机器学习可用来检测异常。深度学习能够分析大量的高维数据,可以将现有的预防性维护系统提升到一个新的水平。通过分析麦克风和摄像头等的数据,神经网络可以增强并可能取代传统的预测维护方法。深度学习预测故障和允许计划干预的能力可以用来减少停机时间和运营成本,同时提高产量。例如,深度学习可以通过结合平面模型数据、维护历史、发动机振动数据异常检测等物联网传感器数据,以及发动机状况的图像和视频,来延长一架货机的寿命。人工智能驱动的物流优化可以通过检测车辆性能和指导司机行为降低运输成本。例如,一家欧洲卡车运输公司使用监测车辆性能和驾驶员行为的传感器,将燃料成本降低了15%,司机可以获得包括何时加速或减速等实时的指导,进而优化燃料消耗和降低维护成本。人工智能是客服和商品个性化推荐的重要工具。例如,对音频的深度学习分析可以让系统评估客户的情绪基调;如果客户对系统做出了糟糕的反应,那么就可以自动呼叫到操作员和管理人员。在营销和销售的其他领域,人工智能技术也会产生重大影响。将客户统计数据和交易数据与以及社交媒体数据相结合,可以帮助生成个性化的产品推荐。亚马逊已经开始使用了,可使销售转化率提高两倍。2/3的企业使用人工智能提高现有性能在报告调查的69%的案例中,深度神经网络可以用来提高其他分析技术所提供不了的性能。只使用神经网络的情况,我们称之为“绿地”案例,但它只占总数的16%;在15%的案例中,深度神经网络在其他分析技术基础上提供了额外性能;还有一些案例,因为数据限制使他们不适合深度学习。▲与传统分析方法相比,深度学习在各行业提升性能的百分百绿地案例在客服领域非常普遍,在该行业中,数据丰富而大量,有时还会整合人类的反应。在所有行业中,医疗领域的绿地案例最多,其中一些病例涉及疾病诊断和改善护理,并依赖于包含图像和视频输入的丰富数据集,包括来自MRIs的数据。平均而言,报告的案例表明,现代深度学习有能力在传统分析技术的基础上再提供价值,价值大小从30%到128%不等,这取决于行业的接受度和开放程度。深度学习是最需要数据的在大多数应用程序中有效地使用神经网络需要大量标记的训练数据集,并且能够充分计算基础权限。此外,深度学习技术擅长从复杂的多维数据类型中提取模型,比如图像、视频、音频或语音。实现人工智能全部潜力需各种数据,包括图像、视频和音频深度神经网络擅长分析图像、视频和音频数据类型,因为它们复杂、多维,被从业者称为“高维度”。神经网络擅长处理高维度,因为网络中的多个层可以学习数据中存在的许多不同的特性。因此,对于面部识别,神经网络的第一个层可以聚焦于原始像素,第二层聚焦在轮廓和线条上,另第三层是识别在一般的面部特征,最后一层才识别出人脸。除了数据的数量和种类之外,速度也是一个要求:人工智能技术需要不断训练新的模型,来适应不断变化的场景,因此必须经常刷新训练数据。在1/3的案例中,模型需要至少每月更新一次;几乎每4个案例中就有1个案例需要每天更新。这种需求在市场营销、供应链管理和制造方面尤其突出。
2017年7月,国务院印发了《新一代人工智能发展规划》,人工智能作为新一轮产业变革的核心驱动力,必须与各行各业融合才能发挥作用,形成真正有效的行业智能,以此来助力传统行业转型升级,加快人工智能应用落地。一、制造智能制造,是在基于互联网的物联网意义上实现的包括企业与社会在内的全过程的制造,把工业4.0的“智能工厂”、“智能生产”、“智能物流”进一步扩展到“智能消费”、“智能服务”等全过程的智能化中去,只在这些意义上,才能真正地认识到我们所面临的前所未有的形势。人工智能在制造业的应用主要有三个方面:首先是智能装备,包括自动识别设备、人机交互系统、工业机器人以及数控机床等具体设备。其次是智能工厂,包括智能设计、智能生产、智能管理以及集成优化等具体内容。最后是智能服务,包括大规模个性化定制、远程运维以及预测性维护等具体服务模式。虽然目前人工智能的解决方案尚不能完全满足制造业的要求,但作为一项通用性技术,人工智能与制造业融合是大势所趋。二、家居智能家居主要是基于物联网技术,通过智能硬件、软件系统、云计算平台构成一套完整的家居生态圈。用户可以进行远程控制设备,设备间可以互联互通,并进行自我学习等,来整体优化家居环境的安全性、节能性、便捷性等。值得一提的是,近两年随着智能语音技术的发展,智能音箱成为一个爆发点。智能音箱不仅是音响产品,同时是涵盖了内容服务、互联网服务及语音交互功能的智能化产品,不仅具备WiFi连接功能,提供音乐、有声读物等内容服务及信息查询、网购等互联网服务,还能与智能家居连接,实现场景化智能家居控制。二、金融人工智能的产生和发展,不仅促进金融机构服务主动性、智慧性,有效提升了金融服务效率,而且提高了金融机构风险管控能力,对金融产业的创新发展带来积极影响。人工智能在金融领域的应用主要包括:智能获客、身份识别、大数据风控、智能投顾、智能客服、金融云等,该行业也是人工智能渗透最早、最全面的行业。未来人工智能将持续带动金融行业的智能应用升级和效率提升。四、零售人工智能在零售领域的应用已十分广泛,正在改变人们购物的方式。无人便利店、智慧供应链、客流统计、无人仓/无人车等等都是的热门方向。通过大数据与业务流程的密切配合,人工智能可以优化整个零售产业链的资源配置,为企业创造更多效益,让消费者体验更好。在设计环节中,机器可以提供设计方案;在生产制造环节中,机器可以进行全自动制造;在供应链环节中,由计算机管理的无人仓库可以对销量以及库存需求进行预测,合理进行补货、调货;在终端零售环节中,机器可以智能选址,优化商品陈列位置,并分析消费者购物行为。五、交通大数据和人工智能可以让交通更智慧,智能交通系统是通信、信息和控制技术在交通系统中集成应用的产物。通过对交通中的车辆流量、行车速度进行采集和分析,可以对交通进行实施监控和调度,有效提高通行能力、简化交通管理、降低环境污染等。人工智能还可为我们的安全保驾护航。人长时间开车会感觉到疲劳,容易出交通事故,而无人驾驶则很好地解决了这些问题。无人驾驶系统还能对交通信号灯、汽车导航地图和道路汽车数量进行整合分析,规划出最优交通线路,提高道路利用率,减少堵车情况,节约交通出行时间。六、安防安防领域涉及到的范围较广,小到关系个人、家庭,大到跟社区、城市、国家安全息息相关。目前智能安防类产品主要有四类:人体分析、车辆分析、行为分析、图像分析;在安防领域的应用主要通过图像识别、大数据及视频结构化等技术进行作用的;从行业角度来看,主要在公安、交通、楼宇、金融、工业、民用等领域应用较广。七、医疗当下人工智能在医疗领域应用广泛,从最开始的药物研发到操刀做手术,利用人工智能都可以做到。眼下,医疗领域人工智能初创公司按领域可划分为八个主要方向,包括医学影像与诊断、医学研究、医疗风险分析、药物挖掘、虚拟护士助理、健康管理监控、精神健康以及营养学。其中,协助诊断及预测患者的疾病已经逐渐成为人工智能技术在医疗领域的主流应用方向。八、教育通过图像识别,可以进行机器批改试卷、识题答题等;通过语音识别可以纠正、改进发音;而人机交互可以进行在线答疑解惑等。AI 和教育的结合一定程度上可以改善教育行业师资分布不均衡、费用高昂等问题,从工具层面给师生提供更有效率的学习方式,但还不能对教育内容产生较多实质性的影响。九、物流物流行业通过利用智能搜索、 推理规划、计算机视觉以及智能机器人等技术在运输、仓储、配送装卸等流程上已经进行了自动化改造,能够基本实现无人操作。比如利用大数据对商品进行智能配送规划,优化配置物流供给、需求匹配、物流资源等。目前物流行业大部分人力分布在“最后一公里”的配送环节。
人工智能学科有着十分广泛和极其丰富的研究内容。不同的人工智能研究者从不同的角度对人工智能的研究内容进行分类。例如,基于脑功能模拟、基于不同认知观、基于应用领域和应用系统、基于系统结构和支撑环境等。因此,要对人工智能研究内容进行全面和系统的介绍也是比较困难的,而且可能也是没有必要的。下面综合介绍一些得到诸多学者认同并具有普遍意义的人工智能研究的基本内容。人工智能1.认知建模人类的认知过程是非常复杂的。作为研究人类感知和思维信息处理过程的一门学科,认知科学(或称思维科学)就是要说明人类在认知过程中是如何进行信息加工的。认知科学是人工智能的重要理论基础,涉及非常广泛的研究课题。除了浩斯顿(Houston)提出的知觉、记忆、思考、学习、语言、想象、创造、注意和问题求解等关联活动外,还会受到环境、社会和文化背景等方面的影响。人工智能不仅要研究逻辑思维,而且还要深入研究形象思维和灵感思维,使人工智能具有更坚实的理论基础,为智能系统的开发提供新思想和新途径。2.知识表示知识表示、知识推理和知识应用是传统人工智能的三大核心研究内容。其中,知识表示是基础,知识推理实现问题求解,而知识应用是目的。知识表示是把人类知识概念化、形式化或模型化。一般就是运用符号知识、算法和状态图等来描述待解决的问题。已提出的知识表示方法主要包括符号表示法和神经网络表示法两种。3.知识推理推理是人脑的基本功能。几乎所有的人工智能领域都离不开推理。要让机器实现人工智能,就必须赋予机器推理能力,进行机器推理。所谓推理就是从一些已知判断或前提推导出一个新的判断或结论的思维过程。形式逻辑中的推理分为演绎推理、归纳推理和类比推理等。知识推理,包括不确定性推理和非经典推理等,似乎已是人工智能的一个永恒研究课题,仍有很多尚未发现和解决的问题值得研究。4.知识应用人工智能能否获得广泛应用是衡量其生命力和检验其生存力的重要标志。20世纪70年代,正是专家系统的广泛应用,使人工智能走出低谷,获得快速发展。后来的机器学习和近年来的自然语言理解应用研究取得重大进展,又促进了人工智能的进一步发展。当然,应用领域的发展是离不开知识表示和知识推理等基础理论以及基本技术的进步的。5.机器感知机器感知就是使机器具有类似于人的感觉,包括视觉、听觉、力觉、触觉、嗅觉、痛觉、接近感和速度感等。其中,最重要的和应用最广的要算机器视觉(计算机视觉)和机器听觉。机器视觉要能够识别与理解文字、图像、场景以至人的身份等;机器听觉要能够识别与理解声音和语言等。机器感知是机器获取外部信息的基本途径。要使机器具有感知能力,就要为它安上各种传感器。机器视觉和机器听觉已催生了人工智能的两个研究领域——模式识别和自然语言理解或自然语言处理。实际上,随着这两个研究领域的进展,它们已逐步发展成为相对独立的学科。6.机器思维机器思维是对传感信息和机器内部的工作信息进行有目的的处理。要使机器实现思维,需要综合应用知识表示、知识推理、认知建模和机器感知等方面的研究成果,开展如下各方面的研究工作:(1)知识表示,特别是各种不确定性知识和不完全知识的表示。(2)知识组织、积累和管理技术。(3)知识推理,特别是各种不确定性推理、归纳推理、非经典推理等。(4)各种启发式搜索和控制策略。(5)人脑结构和神经网络的工作机制。智能学习7.机器学习机器学习是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和神经计算的核心研究课题之一。现有的计算机系统和人工智能系统大多数没有什么学习能力,至多也只有非常有限的学习能力,因而不能满足科技和生产提出的新要求。学习是人类具有的一种重要智能行为。机器学习就是使机器(计算机)具有学习新知识和新技术,并在实践中不断改进和完善的能力。机器学习能够使机器自动获取知识,向书本等文献资料和与人交谈或观察环境进行学习8.机器行为机器行为系指智能系统(计算机,机器人)具有的表达能力和行动能力,如对话、描写、刻画以及移动、行走、操作和抓取物体等。研究机器的拟人行为是人工智能的高难度任务。机器行为与机器思维密切相关,机器思维是机器行为的基础。9.智能系统构建上述直接的实现智能研究,离不开智能计算机系统或智能系统,离不开对新理论、新技术和新方法以及系统的硬件和软件支持。需要开展对模型、系统构造与分析技术、系统开发环境和构造工具以及人工智能程序设计语言的研究。一些能够简化演绎、机器人操作和认知模型的专用程序设计以及计算机的分布式系统、并行处理系统、多机协作系统和各种计算机网络等的发展,将直接有益于人工智能的开发。
现阶段都是大伙儿还不太知道人工智能技术究竟是什么,而今日作者还要带著大伙儿一块儿了解人工智能技术的核心技术与见解,并知道人工智能技术能够运用的机械加工行业。人工智能技术(Artificial Intelligence),英文简写为AI。 这是科学研究、开发设计用以仿真模拟、拓宽和拓展人的智能安防系统的基本知识、方式、专业能力及运用电脑操作系统的这门新的专业能力科学研究。不久1956年人工智能技术发布面世到目前早已60很多年过去,但对于人工智能技术的勤于思考与发展前途仍在连续不断开展中。"随之云计算技术伺服控制器的人工智能技术(AI)作用的慢慢地全民化,全是在近年来随着互联网大数据,包含各个领域。大伙发布进到1个AI新世代。下边来讲下人工智能技术的几大重中之重:1、深度神经网络(machinelearning,ml)是人工智能技术的1个科学研究支系,重要是设计方案和剖析某些让测算及自动式获得专业能力的蚁群算法,关系去往概率论、统计学、梯度下降法论等很多机械加工行业。 此蚁群算法容许寻找最好是计算机硬件用以未来展望的相一致数学建模模型。2、人工神经网络 artificial neural network :简而言之,就是说运用机械设备生产生产加工好似大伙中枢神经元的相互连接与大数据技术。 神经网络,简而言之,是对大伙大脑结构的三维建模,这是由1个称之为神经元细胞的学习培训控制模块的大数据技术构成。3、 数据管理系统expert system:对于与众不同的某一议案或难题,预备期好很多的处理方法。可是因为是听取意见置入方式行为矫正,因此自身自学能力责任有限公司。 数据管理系统多运用在医药学中病症的确诊。再聊讲下人工智能技术的几大机械加工行业:1、自然语言理解:主视图让计算机硬件能够也许听得懂大伙的語言,穿透话筒听见视频语音后能够也许转换成文本记实,并各个领域自动式词性标注,知道语意。 以至于把计算机硬件欲叙述的內容转换成视频语音讲给人听。 只能智能机器人能依据玻璃瓶子方向的转变作出客观性调节,能够对紧急状况作出适度反映,最經典的社区实践活动就是说交流与沟通智能机器人。2、语音识别系统:现阶段在我国的人工智能技术服务平台关键聚焦点于计算机视觉、语音识别系统和語言解决机械加工行业。 好似这2年当红男星的日本国ili快速翻译机,就是说穿透人工智能技术的语音识别系统快速将听到的汉语转化成日文,帮助使用人即便置身不一样語言的國家可以超过合理的转达与交流与沟通。3、影像辨别:最具象征性的就是说轿车的自动驾驶汽车了。 论到自动驾驶汽车,不可或缺充分考虑三项专业能力:逻辑思维处理,五金机械地质图,和安全驾驶决议报告书。 依据不一样难度系数和不一样机械制造业内的原素看来,关键配有于下列很多机械加工行业:1.无人驾驶汽车大伙儿觉得,无人驾驶汽车在ai机械加工行业超出十分难,我觉得难度系数关键配有于电脑操作系统方面,因为它不可或缺许多数据分析及数据融合,不可或缺各行各业专业能力,还不可或缺营销策略、鉴别、操纵等。 运用AI超过像人相同的安全驾驶辨别,依然是浩繁卓越团队竭尽全力的政策方针。生产制造1个AI数据管理平台,根据数据融合、剖析,进而让高端大气的人工智能技术迈入衣食住行之中。 而不论是哪样特性的人工智能技术运用,间距机械设备要为人处事能做,思人所见即都都是一段路要走。 毫无疑问的是,随之AI网络科技的提升,大伙的网络科技将来从始至终布满更为概率!
国家卫健委官网10月12日发布《关于加强全民健康信息标准化体系建设的意见》,意见指出,推动医疗健康人工智能应用标准化建设。研究制订医学人工智能应用研究指南,推进医学人工智能在智能临床辅助诊疗、医用机器人、人工智能药物研发、智能公共卫生服务、智能医院管理、智能医疗设备管理、智能医学教育等领域应用试点和示范。加快研究制订人工智能技术的相关应用标准和安全标准,构建人工智能技术应用及安全测评标准,提升人工智能技术应用质量,强化人工智能技术应用安全管理。
随着近年来人工智能浪潮的兴起,无人驾驶再次成为话题,国内外很多公司投入了自动驾驶和无人驾驶的研究。智能呼叫机器人在生活中也越来越常见,利用机器模拟人类行为的人工智能实体形态,实现语音识别和自然语义理解,具有业务推理、语言应答等能力。随着社会发展人工智能逐渐进入我们的生活,应用于各行各业,AI不仅给许多行业带来了巨大的经济效益,还给我们的生活带来了许多变化和便利。现在人工智能在什么领域得到应用?今天我们来理解一下吧。一、无人驾驶汽车我相信大家都不知道。无人驾驶汽车BQ24010DRCRG4是智能汽车的一种,也称为轮式移动机器人,主要依靠车内以计算机系统为中心的智能驾驶控制器实现无人驾驶。无人驾驶的技术包括计算机视觉、自动控制技术等,这些技术的构成形成了完整的无人驾驶。随着近年来人工智能浪潮的兴起,无人驾驶再次成为话题,国内外很多公司投入了自动驾驶和无人驾驶的研究。例如,谷歌谷歌X实验室积极开发无人驾驶汽车谷歌DriverlessCar,百度也开始了百度无人驾驶汽车的研究开发计划,自主开发的无人驾驶汽车Apollo在中央电视台春夜登场。但是,由于发现无人驾驶的复杂性远远超过了几年前的期待,实现无人驾驶商业化还有很长的路要走。二、脸部识别该技术已进入许多人家,脸部识别也称为脸部识别、脸部识别,主要是基于人的脸部特征信息进行身份识别的生物识别技术。现阶段涉及人脸识别的技术性主要有计算机视觉、图象处理等。目前,人脸识别技术已广泛应用于金融、司法、公安、边检、宇宙、电力、教育、医疗等多个领域。随着人脸识别技术的进一步成熟和社会认同度的提高,应用于更多领域,给人们的生活习惯带来更多变化。三、机器翻译机械翻译实际上是计算语言学的分支,利用计算机将自然语言转换为另一种自然语言的过程,机械翻译使用的技术主要是神经机械翻译技术。目前,该技术目前在许多语言上的表现已超过人类。四、声纹识别其实生物的特征识别技术有很多种,除了脸部识别,现在使用的有声纹识别很多,声纹识别是生物识别技术,也称为说话者识别,包括说话者识别和说话者确认。声纹识别的工作过程是系统收集说话人的声纹信息并输入数据库,当说话人再次说话时,系统收集该声纹信息,自动比较数据库中现有的声纹信息,识别说话人的身份。与传统的身份识别方法(如钥匙、证明书)相比,声纹识别具有抗遗忘、远程识别权的特点,在现有算法优化和随机密码的技术手段下,声纹也能有效防止录音、合成,安全性高,响应快,识别准确。目前,声纹识别技术有声纹核身、声纹锁和黑名单声纹库等多个应用案例,广泛应用于金融、安全、智能家庭等领域,落地场景丰富。例如,支付宝和微信使用该技术登录了自己的账户。五、智能呼叫机器人智能呼叫机器人在生活中也越来越常见,利用机器模拟人类行为的人工智能实体形态,实现语音识别和自然语义理解,具有业务推理、语言应答等能力。当用户访问网站并发布会话时,智能呼叫机器人会根据系统获得的访问者地址、IP和访问路径等,快速分析用户的意图,回答用户的真正需求。同时,智能呼叫机器人拥有大量行业背景知识库,可以标准回答用户咨询的常规问题,提高回答精度。对于很多电气商务企业来说,用户咨询的售前问题以价格、优惠、商品来源渠道等主题为中心,在这个场景中使用智能呼叫机器人,可以减少人工呼叫每天回答这些重复问题,提高更复杂问题的客户群智能呼叫机器人还可以为用户提供24小时365天的咨询回答、解决问题的服务,广泛应用也大大降低了企业的人工呼叫成本。六、智能呼叫机器人智能呼叫机器人是人工智能语音识别的典型应用,可以自动启动电话呼叫,以语音合成的自然人声形式,积极向用户组介绍产品。在呼叫期间,利用语音识别和自然语言处理技术获得客户意图,然后采用目标语言技术与用户进行多次对话,最后对用户进行目标分类,自动记录每个电话的要点,成功完成呼叫。七、智能扬声器我相信每个人都不熟悉智能扬声器。属于语音识别、自然语言处理等人工智能技术的电子产品类的应用和载体,从本质上来看,智能扬声器是能够完成对话环节的语音交互能力的机器。通过直接对话,家庭消费者可以完成自助点歌、控制家庭设备、唤起生活服务等操作,这样的设备相信很多人都有。八、个性化推荐个性化推荐也是生活中常见的应用程序,是基于集体和协同过滤技术的人工智能应用程序,基于大量数据挖掘,通过分析用户的历史行为建立推荐模型,积极向用户提供符合他们需求和兴趣的信息个性化推荐系统已经广泛存在于各种网站和App中,本质上是根据用户的阅览信息、用户的基本信息、对物品和内容的喜好等多个因素来考虑的,根据推荐引擎算法进行指标分类,将与用户的目标因素一致的信息内容分类九、医学图像处理医学图像处理是目前人工智能在医疗领域的典型应用,其处理对象是由临床医学中广泛使用的核磁共振图像、超声波图像等生成的医学图像。要知道传统的医学影像诊断,主要通过观察二维切片图来发现病变,这往往需要根据医生的经验来判断。利用计算机图像处理技术,可以对医学图像进行图像分割、特征结婚定量分析和比较分析等工作,完成病灶识别和标记,自动描绘肿瘤放射治疗阶段的图像目标区域,重建手术阶段的三维图像。十、图像检索要知道,我们不能在早期进行图像检索,图像检索分为文本和内容两种检索方式。传统图片搜索只识别图片本身的颜色、纹理等因素,因为当时程序技术还不能支持识别图片内容,随着人工智能的发展,图片搜索在近年来用户需求越来越旺盛的信息搜索类应用程序中,基于人工智能深度学习的图片搜索逐渐提高了该技术,用户利用图片匹配搜索顺利找到相同或相似的目标物的需求,如搜索相同类型、相似物的比较等。
图片来源:Pexels近年来,人工智能在社会生活的各个领域都得到了越来越广泛的应用,如零售行业中分析消费者消费习惯的商业智能、汽车制造中的自动驾驶等。在教育领域,在线教育在过去十多年里飞速发展,积累了大量的数据,为人工智能的研究奠定了数据基础,也对人工智能的应用提出了新的需求。一、人工智能在教育领域的主要应用目前,人工智能在教育领域的应用主要包括四类:第一类是“行为探测”,如考场的作弊监控系统。类似的应用还有前不久新闻里报道的“魔镜系统”,即通过人脸识别,实时探测学生是否在认真听讲。不过,是否应该在课堂教学中运用这样的系统还存在很大争议。第二类应用被称为“预测模型”,如通过学生学习过程中的行为数据,预测学生是否有高辍学风险,或者预测学生成绩是否及格等。已有的研究主要集中在MOOC领域。学者们使用学生上线时间、观看视频时间、次数、参与讨论情况、作业提交情况等数据,预测学生是否能完成某一课程,从而使教师能及早为有困难的学生提供帮助,提高MOOC的效率。第三类应用为“学习模型”,如在线的自适应学习系统,即根据学生兴趣、学习能力、知识掌握情况等因素,为学生提供适宜的学习内容。有一些研究试图为学生提供符合其认知模式的学习内容,如为对图像敏感的学生提供以视觉刺激为主的学习资料,但目前研究者们还没有发展出非常成熟的应用。第四类应用“智能测评”与“学习模型”紧密相关。在自适应学习中,系统需要首先对学生的能力、知识掌握情况等进行测评。智能测评旨在以传统测评无法比拟的效率,完成对学生的测评和诊断任务。二、人工智能在教育测评的应用智能测评包括人工智能在传统测试的各个环节中的应用。教育测评的过程本质上是把某种潜在特质(看不见、摸不着又确实存在的能力、素养或心理特质)用一种科学的方法进行量化,用数值来表示被试在该项特质上的发展水平。传统的测评主要有三个环节:命题、答题和评分。人工智能在这三个环节中的应用即为机器命题、机器答题和自动评分。1.机器命题传统命题是由学科专家或专业的命题人员,根据考试的目的,设计试题的过程。命题质量是决定整个测评质量的关键因素,整个试卷在内容上应该是所有需要考评的内容的代表性抽样。试卷难度应当满足测试目的:选拔性考试通常偏难,而达标考核的难度则依据相应标准来确定。在线学习系统和计算机自适应考试的发展,大大增加了对试题数量的需求。一次传统的纸笔考试可能只需要50题左右,但在自适应考试中,需要给每个考生不同的试题,所需的题目数量就成倍增加。同时,自适应考试和在线学习系统中测试的频次往往较高,因此也需要更多的试题。传统的命题成本较高,耗费时间较久,且存在一定的错误率,而机器命题能大幅节约命题成本,提高命题效率。此外,由于机器命题没有泄露试题的风险,提高了考试安全性。因此,机器命题在过去十多年里得到了较快的发展。机器命题有两种主要的模式:强理论模型和弱理论模型。所谓强理论模型,是指在比较扎实的认知理论基础上进行命题。比如部分数学题,解题所需要的能力可以分解为问题提炼、数学表达、运算执行等几个部分。通过分析一组类似试题的考生作答数据,测量学专家们可以较为精确地计算出每个步骤的难度以及这个步骤在整个题目中的权重。随后,计算机自动替换题目中的一个或几个元素,生成新题。这样的新题可以在“母题”的基础上进行较多的变化,新的难度也在很大程度上可控。不过,教育领域的大部分考试都缺少对应的认知理论支撑。因此,机器命题更多使用弱理论模型。具体过程大致如下:命题专家先找出性能好的题目作为母题,再对题目进行非常详细的分析,构成多层次的题目模型,即把题目分解成背景、内容、问题、辅助信息与选项等部分。接下来,专家再确定可以替换的部分。计算机先分析可替换部分的文本难度、问题的难度,再从语料库和数据库中找到合适的内容,进行替换,形成新题。这类新题和母题的相似度很高,难度也基本保持不变。数学和英语是机器命题应用较多的学科,特别是英语的语法和阅读理解题,已经有一些商业软件可以完成命题。例如,“Item Distiller”软件主要被用来命以单句为主的语法题,“EAQC(enhanced automatic question creator)”软件则多用于命阅读理解题。尽管机器命题能节约成本,提高效率,但也存在一定的局限。首先,命题过程仍然离不开命题专家对母题的选择和分析。其次,机器在设计干扰项时比较死板,只会依据母题的模版生成干扰项,而不会根据题目的特点重新设计。第三,由于开放性问题(如简答题等)的标准答案设计需要另一套设计模型,机器命题目前也较少被用于此类问题。最后,机器命题十分依赖语料库。英语的语料库发展比较快,计算语言学的研究已经完成了对词的难度、词和词之间的距离等的量化,为机器命题奠定了良好的基础。而对其他没有成熟语料库的语言来说,好的机器命题则难以实现。2.自动评分这里将要讨论的评分不包括扫描仪读取答题卡,而是指在传统考试中需要由评分员进行打分的开放性问题,如口语考试、简答题、作文题等。评分员打分耗时耗力,机器自动评分可以节约时间和成本,大大提高效率。自动评分一般包括三个步骤。首先,要把语言或手写的文字转化为电脑可以读取、分析的文本。这一步依赖自然语言处理系统,目前中文也有一些软件可以便捷地完成处理。第二步,分析文本。常用的分析方法有两种,一种被称为“隐含语义分析”,另一种则是“人工神经网络”。所谓隐含语义分析,是指把被试的回答转换成数字矩阵,计算与标准答案矩阵之间的距离。这种方法多用于简答题。对于较长的回答,如作文,则更多使用人工神经网络。人工神经网络简单说来就是找出本文的特征,如关键词出现的频率、复杂句式出现的频率、连接词的频率等,根据本文的特征来完成打分。让计算机学习已经由专家完成了评分的答案,每一种分值都需要一定数量的案例,从而完成特征的选取。最后一步就是打分。打分也有两种方法:分类和回归模型。当题目的分值较低时(如可能的得分是0到5分),分类法较为常用。计算机把被试的回答和已经学习过的不同分值的回答进行对比,把回答归入最接近的一组,就完成了打分。当题目的分值较高时(如高考中作文为60分),则多用回归模型,即通过机器学习已经由专家完成打分的大量案例,建立回归模型。新的文本特征作为自变量“X”,通过回归模型,计算出最终得分“Y”。目前已经有一些成熟的自动评分软件,如“Project Essay Grade”,美国ETS开发的“E-Rater”等。新一代的评分软件不仅可以完成评分,还能根据评分模型,给学生提出改进建议。当然,自动评分还存在很多局限。一方面,机器学习的资料是不同专家的评分,本身就存在一定的不一致性,因此,自动评分的结果与人工评分还会有一定的差异。另一方面,自动评分也十分依赖语料库的建设,对于计算语言学没有深入研究的语种,就难以建立比较精准的模型。此外,自动评分在面对“创作型写作”时,往往很难给出准确的判断。3.机器答题机器答题可以大大降低试测成本。在题库建设中,所有的新题都需要经过试测,计算其各项性能指标后,才能在实际考试中使用。招募被试进行试测需要花费大量时间和成本。此外,试测过程中,也可能存在考务安全的问题。目前也在大力加快题库建设,但由于保密问题,很难实现在高考这样的高利害考试中使用试测过的试题。机器答题也可以大大降低泄露试题的风险。机器答题的复杂程度更高,目前还没有成熟的、商业化的应用。我国的科大讯飞正在积极研发,日本、欧美也有一些团队在进行研究。三、人工智能与教育测评的未来研究方向人工智能在命题、答题和评分中的研究和应用都在不断推进过程中。但不少研究者认为,目前的这些应用没有改变测评的基本内容和形式,只在一定程度上降低了成本、提高了效率。在线学习平台已经积累的数据,应该能够支撑研究者们进行更多的探索,突破原有的测评方式,例如应用学习过程中的行为数据完成测试等。研究者们开创了一个新的领域——“分析测量学”,即通过大数据分析而非传统的考试,对学生进行测评。墨尔本大学教育学院的研究团队已经进行了初步的探索。他们通过分析学生在一项游戏化学习过程中的1600多个行为数据,对学生的合作问题解决能力、批判性思维能力、创新领导力等几项核心素养进行评估。分析测量学仍然遵循测量学的基本逻辑:首先要建立理论框架;随后在学科和认知理论的基础上,进行新型“命题”,即通过数据挖掘找到高相关的信息,同时通过传统命题的思路赋予这些数据实践意义;随后再通过理论与数据结合的方式,对不同的行为进行评分;最后运用测量学模型估算被试的能力。这种“分析测量”将改变测试的场景、命题和评分方式,给测量领域带来更具深远意义的变革。人工智能在高效实现个性化学习方面有着无可比拟的优势,未来在教育领域的应用必将更为广泛。但在我们热情迎接人工智能时代的同时,研究者和实践者们仍需保持谨慎。人类认知的拼图还远没有拼完整,因此我们要理智地对待根据已有大数据得出的结论,防止推论过度泛化。此外,如何保护学生、教师和学校的隐私和秘密,合理使用数据,也是急需我们思考和解决的问题。本文转自微信公众号“中国教育财政”,作者黄晓婷,北京大学中国教育财政科学研究所副研究员。文章为作者独立观点,不代表芥末堆立场。