中国科学院计算技术研究所创建于1956年,是中国第一个专门从事计算机科学技术综合性研究的学术机构。中科院计算所在最近公布的2018年硕士统考生拟录取名单中,大多数考生来自985院校,如天津大学、南开大学、东南大学、山东大学等,人数较多的为中科院大学考生,名单中并没有出现清华北大学生。大家都知道国内计算机最高学府为清华大学,清华大学的计算机近年来在国际排名越来越高,曾在2017年在某榜中排世界第一。非全日制专业型考生来自哈工大、湖北工业大学、山东大学、华中科技大学、辽宁工程技术大学等院校。而在去年(2017)的中科院计算所考研录取名单中清华大学还有亮相。
芯片,特别是高端数据芯片历来是信息技术的核心。在这一领域,我国存在短板,主要原因是设计人员较少、入门门槛太高。在这种情况下,我认为我们的芯片产业可借鉴一下开源软件的经验,迎接开源芯片新潮流的到来。假如每个人都不公开自己的创新和秘密,可能几百个品种出来之后,彼此之间不兼容,会产生碎片化,形成很多互不兼容的分支,因此需要很好的组织管理。我们希望这种开源芯片的架构模式,是我们一个芯片可以几个人一个小组,几个月花几万块钱推出适合于定制化的芯片,因为这样对中小企业会很有用。目前,国际上这些开源软件一般都有一个基金会来管理。我们中国也在组建一些新的机构,民间团体可以支持,工信部和中小企业也表示支持。基金会有发言权,基金会有董事,还有各方面的公司和民间组织可以参与。我还期待国家设置一些重大软件项目专项,能够对这类基金给予支持,来促进芯片业的创新,避免中国芯长期受制于人。本报记者孙大卫采访整理(责任编辑:王诗茗)来源: 辽宁日报【来源:东北新闻网】声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 邮箱地址:newmedia@xxcb.cn
如今,产业基金已成为名副其实的引导性基金,促进了“技术吸引资本、资本成就产业、产业促进资本升值、资本收益反哺技术”的高新技术产业生态体系建设。中国科学院计算技术研究所(简称“计算所”)党委书记兼副所长李锦涛接受本刊记者采访时表示,“计算所人的价值观是‘科研为国分忧,创新与民造福’,发展包括计算机系统、网络、智能技术三大主要研究领域的计算技术学科。计算所覆盖学术研究、技术创新、产业化与技术应用的完整价值链,我们的使命和价值体现在成为信息产业价值链上不可替代的关键环节,为做强中国信息产业贡献关键技术和系统。”计算所成立于1956年,是我国第一个专门从事计算机科学技术综合性研究的学术机构。60多年来,计算所获得国家级科技奖励50项、部级科技奖励178项,成为我国计算机领域在读研究生规模最大的培养单位之一——1500多位博士、3000多位硕士从计算所毕业。除此之外,更令人骄傲的是,计算所先后创建了联想控股股份有限公司(简称“联想”)、曙光信息产业股份有限公司(简称“曙光”)、龙芯中科技术有限公司(简称“龙芯中科”)、北京中科晶上科技股份有限公司(简称“中科晶上”)和中科寒武纪科技股份有限公司(简称“寒武纪”)等一批“强”科技的明星公司。无论人才培养还是科技成果转化,计算所都堪称我国“科技成果转化为生产力”当之无愧的助推器。中科院计算所党委书记兼副所长李锦涛争做“产业技术源头”、及时高效的夯实成果转化基础计算所是中国科学院(简称“中科院”)最早建立专业技术转移部门的研究所,也是中科院最早制定科技成果转移转化相关激励政策,并通过职代会形式完成合法化,进入实施阶段的科研机构。根据介绍,计算所的技术发展工作主要包括技术创新、技术应用与技术转移等。技术发展中心是计算所为实现技术转移和孵化设立的专门机构,以技术转移转化为己任。李锦涛告诉记者,“计算所的定位之一是做‘产业技术源头’。从60多年历史发展来看,引领性技术将会成为下一代信息技术战略新兴产业的技术源头。通过信息化拉动工业化和促进产业结构的调整,为国家网络信息安全战略应用提供支撑技术,是体现计算所作为国有研究所满足国家战略需求的主要价值所在,也是计算所的优势所在。”“计算所会根据技术和研发人员的特点以及市场具体情况,有针对性地选择适合全所每项具体技术的方式进行技术转移。”目前,经过多年摸索,计算所已经逐步形成了分所建设、企业孵化和知识产权许可三种技术转移模式,尤其是成立分所模式,得到了国家领导人、中科院领导、地方政府和当地企业的充分肯定和支持。另外,众所周知,资金是实现从科研成果向企业转化的重要前提。李锦涛告诉记者,发达国家在科研、开发、推广阶段的经费投入比例约为1:10:100,而在我国科技成果的推广和转化阶段,缺乏强有力的资金支持,导致许多有应用前景的产品和项目无法投入中试,制约了科技成果及时高效地转化为生产力。“由此,计算所在技术成果转化实现商业化的过程中,一方面要建立完善的金融体系,通过市场机制引导社会资金和金融资本进入技术创新领域,形成创业投资、风险补偿等政府引导的支持方式;另一方面,要加强直接的资金支持,加大对科研院所技术转移的资金和空间上的支持,尤其是补贴前期基本无收益的专业技术转移机构的开支。”“技术吸引资本,资本成就产业”打造高新技术产业生态体系2007年,为规范、系统地管理其经营性国有资产、进一步拓展经营性国有资产的资本运作,计算所全资设立了代表计算所依法行使经营性国有资产出资人权利的资产经营管理公司——北京中科算源资产管理有限公司(简称“中科算源”)。该公司旨在促进技术、产业、资本的良性互动发展,逐步形成在孵企业、成长企业、成熟企业的孵化梯队。2017年,计算所成立北京中科图灵基金管理有限公司(简称“中科图灵”),吸收政府机构和专业投资人从事天使投资与孵化业务,逐步开展与各地方政府及机构投资人之间的合作,为下属公司融资、建立产业生态创造资本平台建设的快捷通道。截至目前,计算所所办一级二级企业数量38家、控股8家、参股30家。其中,中科图灵已完成对寒武纪、物端计算机等项目的出资。通过计算所产业基金的站台、引导、扶助与支持,寒武纪等一系列公司融资得以快速上台阶。李锦涛向记者透露,“计算所全资资产管理公司,以现金出资方式投资计算所技术成熟团队项目,孵化公司的注册资金在100万人民币左右,团队成员一般占70%-80%的股份,计算所资产管理公司一般占20%-30%的股份。”“这类投资模式使计算所的技术通过这些投资企业成功走向市场,真正实现产业化。而后期孵化公司融资后,可以根据市场估值转让股份,从而形成资本积累;同时成立产业基金,积极参与孵化公司的融资。”李锦涛强调。如今,产业基金已成为名副其实的引导性基金,促进了“技术吸引资本,资本成就产业,产业促进资本升值,资本收益反哺技术”的计算所高新技术产业生态体系建设。以龙芯中科为例,2010年,由中科院和北京市牵头出资,以龙芯团队为主体成立龙芯中科,开始市场化运作。需指出的是,通用型中央处理器(简称CPU)是信息产业的基础部件,是电子设备的核心器件,是关系到国家命运的战略产品。龙芯团队早在2001年就开始研发龙芯CPU,也是我国最早研制通用CPU的队伍。目前,龙芯团队拥有覆盖全国技术服务体系,可以形成从CPU到系统内核到应用迁移的全过程保障,在全国范围内进行产业化布局。龙芯CPU已形成系列产品,广泛应用于党政信息化、嵌入式、工控以及以北斗卫星为代表的国家安全重要领域。如今的龙芯中科,经过20年积累,正在成为我国通用CPU的领军企业。与龙芯中科类似,中科晶上是在北京市科委支持下依托计算所成立,致力于突破无线通信领域关键技术瓶颈,研制制约我国通信产业发展的核心器件——基带芯片,打破了国外对通信处理的关键技术及核心器件的长期市场垄断,有效形成了独立自主的核心器件、设备的整体解决方案和推广应用,实现了我国信息通信产业发展的引领创造,成为IT3.0时代产业价值链高端的技术引领性公司。目前,经过8年发展,中科晶上拥有知识产权近300项,已形成晶上通信、晶上农耕、晶上交通等多业务板块。此外,公司共拥有6家全资或控股子公司,早已由成立之初的200万注册资金成长为估值数十亿的高技术公司。再比如,寒武纪成立于2016年3月,是全球人工智能芯片领域的先行者之一。目前,该公司已完成数轮股权融资和股份制改造,并于2020年7月正式在科创板上市。值得一提的,寒武纪背后控股股东、实际控制人为陈天石,其主要股东包括计算所资产公司(中科算源),以及国家科技重大专项成果转化基金(委托国投集团管理)、中国国新控股有限责任公司、中国科技产业投资管理有限公司、杭州阿里创业投资有限公司、科大讯飞股份有限公司、北京联想之星创业投资有限公司等知名投资机构和产业资本。 要做好前沿研究,必须准确把握时代前沿需求事实上,要体现出科学院研究所的独特价值,区别于作为技术创新主体的企业和国家创新体系中的其他力量,就必须以学术领先、引领产业的成果来标识自己。发展60多年以来,计算所陆续分离出团队参与中国科学院微电子学研究所、中国科学院超级计算中心、中国科学院软件研究所和中国科学院计算机网络信息中心等多个研究机构的建设,参与联想、曙光等高技术企业创建和运营。对科技成果转化输出,可以说经验十足。李锦涛告诉记者,计算所的发展历史恰好证明,做好前沿研究必须准确把握时代的前沿需求。“曙光、寒武纪的创新,是在一个全球开放合作的环境下,进行技术链关键环节的创新和产业化,未来世界也是会在一种强竞争的环境下做技术体系的创新。计算所要努力成为像斯坦福大学对美国硅谷的作用那样的世界一流研究所。”作为信息技术领域的科学院研究所,计算所如果没有国际化高水平的前沿研究,科研工作的前瞻性、引领性就无法体现。根据了解,2020年,计算所将实现源头技术转移辐射到1000亿元规模的巨大市场。“用可信的数据表明,计算所为提高我国科技对经济发展的贡献率、降低我国技术对外依存度做出了实实在在的成绩,也就证明了计算所的不可替代性。”值得一提的,为了加强科技创新建设,在人才队伍建设方面,2017年,计算所I-Tech创新创业学院正式成立。学院秉承“精英培养精英”的理念,依托计算所的科技、教育、人才优势,整合社会优质资源,建立了跨学科协同创新的教育孵化平台,培养具有创新精神和创业能力的优秀人才,促进科技成果转移孵化,形成开放式创新创业生态系统,为我国信息技术产业提供强有力的创新创业人才资源和智力支持。此外,计算所通过执行海外人才引进、体制内事业编制、利用院属“中科创嘉”人力资源公司的项目聘用、企业编制、分所的地方事业编制、短期高级顾问人才聘用等特殊政策,建立了计算所完整的人才链。写在最后借助资本杠杆的力量,中科院计算所能够有效挖掘、鼓励和扶持领先型高技术的创新创业,有效促进产业升级,从而在国民经济主战场中贡献力量。谈到此次中科院科技创新投资产业联盟(简称“中科院科创投资联盟”)成立,李锦涛表示,中科院科创投资联盟成立可以为各院所战略投资搭建信息交流平台、精准对接业内顶级项目资源、促进联合投资,并大幅度提升各院所资本运营及投资效率。“未来,我们希望能够帮助优质项目与资本对接,协助所内创业者实现融资,助力投资人找到最有价值的投资项目,以此推动创新及高成长企业快速发展。同时,与中科院科创投资联盟共同建立产业投资生态链,为各自方向上的优秀企业提供更多资金与资源,助力创业企业生长。”一直以来,计算所用开阔的国际视野来牵引研究活动,并通过高水平前沿研究的过程来不断形成学术积累、影响力和高水平的人才梯队。“未来,我们希望可以吸引更多行业龙头企业,通过建立联合实验室、设立基金产品和产业链直投等方式,在国产芯片及上下游产业链的发展方面展开合作,从而支持国产芯片的创新、产业化与产业生态建设。”在采访最后,李锦涛坚定的对记者说到。
集美新城12月30日上午,中国科学院计算技术研究所(以下简称“中科院计算所”)厦门分所暨厦门数据智能研究院在集美新城的厦门软件园三期正式揭牌。中科院计算所厦门分所将以数据智能研究为切入点,逐步完善云计算、芯片、互联网、人工智能等研究方向,开展关键性应用技术研发,基于计算所本部60多年科研及产业化成果,立足地方经济发展,争取成为厦门乃至东南信息领域产业人才和技术的源头。揭牌典礼目前集美新城拥有中国科学院幼儿园诚毅实验园、中国科学院城市环境研究所、中国科学院海西研究院厦门稀土材料所、中国科学院计算技术研究所厦门分所、中国科学院厦门产业技术创新与育成中心、中国科学院(厦门·集美)知识产权协同创新体等中科院系教育、科研单位,是厦门跨岛发展最美新市区。
(观察者网讯)1月19日,中国科学院计算技术研究所回应有关员工造假“国产编程语言”的网络质疑,发布了关于“木兰”语言问题处理情况的说明。声明强调,近日,网上出现质疑“木兰”语言的信息。我所获知这一情况后高度重视。经所科研道德委员会初步调查,“木兰”语言系我所员工刘雷创办的中科智芯公司研发的面向青少年编程教育的集成化产品,该产品的开发包中包含了Python开源编译器,对外却声称“完全自主”。该行为存在欺瞒与虚假陈述的科研不端问题。我所已对当事人刘雷做出停职检查的决定,并就管理责任责令编译实验室负责人作深刻检讨。声明还表示,我所正抓紧对该问题开展进一步深入调查,将尽快公布处理结果,并以此为戒加强管理。我所对由此造成的不良影响深表歉意,衷心感谢并诚恳接受社会各界的监督和批评。事件回顾《中国科学报》1月16日消息称,记者从中国科学院计算技术研究所(以下简称中科院计算所)计算机体系结构国家重点实验室获悉,由该实验室编译组主导研发的国产编程语言“木兰”正式发布。工作人员向记者演示基于木兰编程的“下棋机器人” 图自中国科学报据中科院计算所副研究员、计算机体系结构国家重点实验室编译组负责人刘雷介绍,“木兰”是一款定位于面向智能物联应用、采用最新编程语言设计理念和编译技术的程序设计语言,开发团队致力于将其打造为“智能物联时代的C语言”。刘雷告诉《中国科学报》:“‘木兰’是由编译实验室完全自主设计、开发和实现的编程语言,与之配套的编译器与集成开发工具也完全由团队自主实现,是我们真正掌握核心技术的编程语言。”发布会上,团队负责人刘雷副研究员介绍“木兰”编程语言体系研发过程及应用进展。图自中新网他还称,“木兰”定位为下一代重要应用——智能物联的开发语言,它采用创新的弹性actor执行模型(擅长执行并行计算,笔者注),可成倍地提高应用执行效率,在提高服务质量的同时大幅降低平台运营成本。另据澎湃新闻报道,消息发布后,网络上争议四起,知乎网友@沉迷单车就指出,从网络下载的“木兰”语言编辑器程序图标来看,与用著名编程语言Python生成的应用程序图标完全一致。“都不换个图标吗?”他问道。有计算机业内人士对澎湃新闻记者表示,从目前能掌握的情况来看,“木兰”语言更像是Python语言的“套壳”产物。“这个软件就是在Python语言外边套了一层壳,还是比较简单的那种,相当于一个接口,连图标都没有改。”“木兰”图标使用Python制作的文件图标 图自澎湃新闻1月17日,项目负责人刘雷在科学网上发表回应称,木兰语言在8位单片机上的编译器是本团队开发的,在32位单片机上的编译器是基于Python开源编译器进行的二次开发,但在接受采访中将木兰编程语言和编译器夸大为完全自主开发。刘雷关于“木兰”编程语言的情况说明全文如下:本人系中科院计算所编译实验室员工。基于我在编译技术上的科研积累创办了中科智芯(北京)科技有限公司,该公司围绕青少年编程教育,设计开发编程语言、编译器和集成开发环境等产品。 为了更好地在中小学中普及计算思维,本人带领团队开发了一种称为“木兰“的编程语言。它包含三个组成部分:一、在语言规范上借鉴了Lua语言的特性并进行了扩展,增加数据表达方法等新的特性;二、开发了支持少儿编程教育的可视化编程环境;三、针对8位AVR单片机,实现了相应的编译器和运行时系统,开发了能模拟多任务执行的虚拟机。以上产品已经在数百所中小学中,开展了10万人次的编程科普活动。 针对STM32单片机,我们是基于Python开源编译器进行的二次开发,也就是先将木兰语言的源程序转换为Python的中间表示(AST),再在Python虚拟机上运行。这就是在开发和运行环境中会包含Python系统的原因。 在1月15日接受媒体采访时,本人在对木兰编程语言的介绍中,犯了以下错误: 1. 木兰编程语言主要是用于中小学教育,在介绍中将它扩大到智能物联领域。 2. 木兰语言在8位单片机上的编译器是本团队开发的,在32位单片机上的编译器是基于Python开源编译器进行的二次开发,但在接受采访中将木兰编程语言和编译器夸大为完全自主开发。 对于此次在网络上造成的不良影响,本人郑重道歉,对给中科院、中科院计算所带来的不良后果表示诚挚的歉意。本人感谢大家的监督与批评,并深刻反省,保证不再出现类似问题。 【来源:观察者网】版权归原作者所有,向原创致敬
雷锋网 AI 科技评论按,日前,中国科学院计算技术研究所网络数据科学与技术重点实验室开源深度文本匹配项目 MatchZoo。据悉,MatchZoo 整合了当前最流行的深度文本匹配的方法(包括 DRMM、MatchPyramid、 DUET、 MVLSTM、aNMM、 ARC-I、ARC-II、 DSSM、CDSSM 等算法的统一实现),提供基准数据集(例如 WiKiQA 数据)进行开发与测试,可以应用到的任务场景包括文本检索、自动问答、复述问题、对话系统等等。详细信息可以参见:深度文本匹配开源工具(MatchZoo)雷锋网 AI 科技评论注意到,短短一周时间,该项目在 GitHub 上的 star 数便达到 480 个,在 MatchZoo 微信群里,大家不断提出相应的改进建议以及使用过程中碰到的 bug,开发人员也在持续解疑中。MatchZoo 的开源毫无疑问让文本匹配任务更加便利,那么,在这一项目背后,究竟有哪些成员在努力,做这一项目的初衷是什么,在开源过程中又遇到了哪些挑战?带着这些疑问,雷锋网 AI 科技评论第一时间联系到该项目的核心开发人员——中科院计算所的博士生范意兴,以下为雷锋网 AI 科技评论与他的交流内容。初衷以及团队据范意兴介绍,MatchZoo 项目由中科院计算所的郭嘉丰研究员、兰艳艳副研究员以及程学旗研究员发起,目前团队的开发成员中有来自中科院计算所、清华大学以及美国 UMASS 大学的研究生。「项目的核心开发人员是来自中科院计算所的学生,包括我、庞亮以及侯建鹏,我们几个完成了项目的初期的整体框架的设计与开发,并实现了大部分的文本匹配的模型。后续有来自 UMASS 的杨柳和清华大学的郑玉昆加入,在原来项目的基础上,加入了更多的文本匹配的模型。」上图从左至右:侯建鹏,范意兴,庞亮为什么会想到研发这样一套框架并进行开源呢?范意兴对雷锋网 AI 科技评论说到,「文本匹配任务是一个从信息检索任务、问答任务、对话任务中抽象出来的核心问题,也是我们实验室小组的一个重要方向,我们在文本匹配任务上已经积累了许多原创的模型,比如 MatchPyramid、MV-LSTM、MatchSRNN、DRMM 等等,但是没有一个统一的框架方便大家使用这些模型,同时,学术界在自然语言处理与信息检索研究方向也出现了大量模型,但是缺乏一个基准的环境来研究和对比已有的模型。」基于前期的积累和当前的研究现状,他们选择开源深度文本匹配项目 MatchZoo。他表示,「MatchZoo 旨在方便大家对比使用已有的文本匹配模型,开发新的文本匹配模型,以及把这些模型非常便捷的应用到自己的工作中去。」MatchZoo 结构根据此前介绍,可以看到,MatchZoo 使用了 Keras 中的神经网络层,由数据预处理、模型构建、训练与评测三大模块组成,具体结构如下图。数据预处理模块:该模块包含通用的文本预处理功能,如分词、词频过滤、词干还原等,并将不同类型文本匹配任务的数据处理成统一的格式。同时该模块针对不同的任务需求提供了不同的数据生成器,包括有基于单文档的数据生成器、基于文档对的数据生成器、以及基于文档列表的数据生成器。不同的数据生成器可适用于不同的文本匹配任务,如文本问答、文本对话、以及文本排序等。模型构建模块:该模块包含了深度学习模型中广泛使用的普通层,如卷积层、池化层、全连接层等。除此之外,在这一模块中,他们还针对文本匹配定制了特定的层,如动态池化层、张量匹配层等。训练与评测模块:该模块提供了针对回归、分类、排序等问题的目标函数和评价指标函数。用户可以根据任务的需要选择合适的目标函数。在模型评估时,MatchZoo 也提供了多个广为使用的评价指标函数,如 MAP、NDCG、Precision,Recall 等。而针对这些模块具体的细节,雷锋网 AI 科技评论与范意兴进行了如下讨论,以下为具体的问答环节。AI 科技评论:MatchZoo 工具的可扩展性如何?作为一个工具,用户的体验很重要,你们在设计时考虑到了哪些易用性方面的需求?范意兴:MatchZoo 工具的设计之初就是为了方便大家能快速的使用以及设计更多的深度文本匹配模型,因此,我们在设计 MatchZoo 时就充分的考虑了可扩展性,用户只用关注匹配模型本身而不用考虑数据输入以及目标优化,同时由于我们设计了统一的模型接口,在模型的实现方面,用户也只需实现基本的模型逻辑即可,从而能达到快速可扩展的需求。AI 科技评论:对输入数据有什么具体的格式要求?在设计数据预处理模块时,对输入数据进行预处理操作最大的难点在哪里,你们是如何解决的?范意兴:对于输入数据的格式可以有多种,最简单的数据格式是「label text1 text2」。在数据预处理的操作中,最大的难点在于整个框架输入数据的可扩展性,因此我们将每一条数据对应上了一个唯一的 ID,然后专门在一个 relation 的文件中定义数据之间的匹配度关系。我们还将单词映射到了对应的词 ID,并生成了对应的词 ID 到词向量的映射。同时为了设计一套统一的适用于不同场景不同语言的数据预处理的方案,最大限度的保证数据预处理代码的灵活性,我们设计了一个数据预处理的类(Class Preprocess), 在该类中,我们实现了不同的数据预处理的函数,例如分词、词根还原、词频统计与过滤、以及大小写转换等,用户可以根据自己的需要选择合适的数据预处理的方式,对于有特殊需求的用户,也可以基于我们的数据预处理的类方便的扩展。AI 科技评论:出于快速构建模型的考虑,你们针对文本匹配定制了特定的层,比如动态池化层,张量匹配层等,这些定制化的层分别能实现什么功能?除了增加一些定制化的层,在模型构建模块,你们还做了哪些改进和优化呢?是否能自建可视化工具?范意兴:针对文本任务的特定的需求,我们定制了不同的层,这些层和 TensorFlow 中其他的层具有统一的接口,用户可以像使用 TensorFlow 中内置的层一样来使用这些层。除此之外,在 matchzoo/layers/中,我们还针对文本匹配定制了特定的层,如动态池化层、张量匹配层等。动态池化层主要是针对文本变长的特性设计的,在文本相关的任务中,文本的长度差异非常的大,例如一篇新闻的长度变化可以从几十个字到几万个字;在神经网络模型的逐层抽象过程中需要将不同的输入映射到相同的特征空间中,然而在图像中常用的裁剪或是填补方案在文本处理时,会导致严重的信息损失或是引入过多的噪音,因此,我们实现的动态池化层能避免裁剪或是填补方案带来的问题,针对不同文本的长度的需要进行动态池化。张量匹配层主要是能够建模两个词向量之间更加复杂的模式匹配,当前大部分的文本相关任务都依赖于词向量,不同词之间的交互就转变成其词向量的交互,使用张量匹配层,能更加充分的捕捉词向量中不同维度的各种交互。除了定制化的层,在模型构建中,我们还设计了统一的模型接口,用户也可以基于我们的模型接口方便快速的开发其他文本模型,另外我们也提供了很多成熟模型的完整实现。目前我们还没有为 MatchZoo 构建可视化的工具,后续我们会考虑加上可视化的工具,方便用户的使用。AI 科技评论:除了前面提到的两个模块,还有训练与评测模块,在模型的训练时这个工具在速度等方面的优势如何?除此之外,你们还考虑到了哪些技术细节?范意兴:由于我们的工具是基于 TensorFlow 构建的,因此能很方便的利用 GPU 进行训练和测试,训练的速度与模型的复杂程度相关;在目前 MatchZoo 的样例数据集 WikiQA 上,我们在一个 K80 的 GPU 上测试,目前实现的模型中,最复杂的 MV-LSTM 在训练 50 分钟就已经收敛达到最好的效果,其他的模型基本都在 30 分钟左右即可收敛。另一个值得一提的是,我们针对数据量非常大的情况,设计了一个动态样本(包括单文档样本、文档对样本、以及文本列表样本)构建的方法,避免在大数据的场景下内存不足以存放大量的数据时的问题。AI 科技评论:在 MatchZoo 整体的设计过程中,你们遇到的最大挑战是什么?具体是如何解决的?范意兴:在 MatchZoo 的整体设计过程中,最大的挑战是工具的架构设计,需要设计一个适应不同模型的统一的框架,同时也要兼顾 TensorFlow 本身的模型构建的特性。我们对不同的匹配模型分析后,抽象出统一的接口,并将整体的实现切分成数据预处理模块、模型构建模块、以及模型训练与评估模块,以便于不同用户在不同需求下使用该工具的可扩展性。AI 科技评论:在开发 MatchZoo 工具的过程中有哪些经验和心得可以和大家分享呢?范意兴:开发一个 MatchZoo 文本匹配工具需要对不同匹配算法抽象出统一的接口,良好的架构能够使得工具能方便的扩展。另外,在一些子模块的设计上也要充分考虑灵活性和通用性,比如数据预处理模块,必须考虑到不同任务下输入的多样性,所以要尽可能抽象出能够较好泛化的输入接口。后记可以看到,MatchZoo 在灵活性和通用性上进行了多方面的考虑,开发团队还专门设计动态的样本构建方法来应对数据量极大的情况,此外,在模型的训练上,也能较快达到收敛效果。那么在未来,他们还会进行哪些方面的更新呢?「目前除了及时的反馈大家提出的问题,我们也正在加入更多的 state-of-the-art 的深度文本匹配的模型。」范意兴说道,「除此之外,我们正在为文本分类任务也添加一个公开的基准测试数据集,并给出相应的模型参数配置和性能结果。同时针对工具的使用方面,目前我们是采用 json 文件来确定模型输入和数据的输入,这种方式可以方便快速的实验验证效果,但却给项目的线上直接使用带来一定的麻烦,我们后续也会提供更多的输入接口以支持线上项目的直接使用。」在这里提个小插曲,当看到 MatchZoo 是基于 Python2 的时候,很多同学第一时间都会想到,什么时候能支持 Python3,毕竟后者是未来主流,这也是 AI 科技评论想问的问题。与此同时,在 MatchZoo 微信群里,也有同学在反映这个问题,短短三天时间,开发团队就表示,「最新的版本已经添加了对 Python 3 的支持,欢迎大家测试。」当然,除了语言支持的问题,开发团队也一直在积极解决大家提出的疑问,例如对某段代码的解释、实际的操作案例等。不过雷锋网 AI 科技评论注意到,目前 MatchZoo 主要是由学生团队来维护,那么接下来是否会在维护上遇到挑战呢?范意兴这样说道:「在开源之后,一直有学术界和工业界的朋友加入,开发团队逐渐变大,因此沟通和维护的成本也会变大。」不过他也表明,目前他们团队的人数还比较少,在代码的更新和维护方面还没遇到大的问题。而对于未来,他表示:「我们 MatchZoo 的项目是开源的,也希望能吸引更多的相关开发人员加入,一起把这个工具做得更好。目前最希望能和相关公司合作,了解不同任务场景下的现实挑战是什么,我们也希望这些算法能在真实的应用场景中发挥作用。」GitHub地址:https://github.com/faneshion/MatchZoo
1月21日,2018中国科学院年度人物及团队正式在京发布,6位个人、两个团队获得这一荣誉,这也是中国科学院首次评选表彰这一殊荣。中国科学院党组副书记、副院长侯建国出席并颁奖,他表示,全院广大科技工作者要向老一辈科学家学习,向年度人物和年度团队学习,向身边的先进典型学习,不忘初心,牢记使命,在党和国家最需要的地方建功立业,为实现“四个率先”目标要求、为建设创新型国家和世界科技强国不断作出新的更大贡献。为落实中组部、中宣部《关于在广大知识分子中开展“弘扬爱国奋斗精神、建功立业新时代”活动的通知》要求,2018年中科院党组在全院部署开展了“讲爱国奉献、当时代先锋”主题活动,通过建立一批党员主题教育基地,深入挖掘老一辈科学家对党忠诚、爱国奉献的家国情怀,激励广大党员干部勇担新使命、展现新作为。为了激励更多的科技工作者开拓进取,争当先锋,中科院组织开展了“一所一人一事”先进事迹征集评选活动和2018中科院年度人物及团队的评选,通过大力挖掘选树身边人的先进事迹,让爱国奋斗精神成为全院的时代风尚、价值追求。本次活动于2018年9月开始,20个人物与团队获得提名。最终,中科院数学与系统科学研究院研究员田野、中科院计算技术研究所研究员陈云霁获得2018中国科学院年度创新人物;中科院西北生态环境资源研究院研究员李新荣、中科院亚热带农业生态研究所研究员曾馥平获得2018中国科学院年度先锋人物;中科院青海盐湖研究所研究员王敏、中科院南海海洋研究所研究员黄晖获得2018中国科学院年度感动人物;体细胞克隆猴团队、新疆分院驻村联合党支部获得2018中国科学院年度团队。近年来,中国科学院贯彻落实习近平总书记提出的“三个面向”“四个率先”要求,把科技工作聚焦到实现重大原创成果、重大战略性技术与产品、重大示范转化工程“三重大”产出上来。习近平总书记在2018年两院院士大会讲话中提到的13项基础研究和应用基础研究重大成果中,12项由中国科学院牵头完成,另1项为主要完成单位。2018年,又涌现出克隆猴、阿尔茨海默氏症新药、单染色体真核细胞、马约拉纳任意子、北斗组网卫星等一批重大成果。侯建国表示,这些成果是全院科技工作者撸起袖子干出来的,是新时代奋斗者挥洒汗水拼出来的。党的十九大开启了建设富强民主文明和谐美丽的社会主义现代化强国新征程。习近平总书记深刻指出,我们比历史上任何时期都更接近中华民族伟大复兴的目标,我们比历史上任何时期都更需要建设世界科技强国。这需要中科院广大科技工作者弘扬爱国传统,激发奋斗精神,自觉传承老一辈科学家的爱国情怀,大力弘扬新时代科技报国的创新精神,奋力担当建设世界科技强国的时代重任,把个人理想自觉融入国家发展和民族复兴伟业,实现重大创新突破,作出重大创新贡献。田野陈云霁李新荣曾馥平王敏黄晖中科院体细胞克隆猴团队中科院新疆分院驻村联合党支部2018中国科学院年度创新人物田野 中科院数学与系统科学研究院研究员这位中国数学界的新秀,第一次对贝赫和斯维讷通—戴尔(BSD)猜想这个“千禧问题”给出了接近最终答案的线索,被国际同行评价为“中国继陈景润之后最好的工作”“将会是鼓励很多中国青年数学家的典范”。田野却认为,自己并非天才,能走到今天得益于对数学发自内心的兴趣和长期辛勤的积累。田野办公室的墙壁上有两块大黑板,上面密密麻麻写满了数学验算公式,经常到了深夜,他的办公室依然亮着灯。据田野的博士生导师张寿武讲,田野经常会在半夜睡梦中突然有了思路,然后马上拨通电话和他讨论。从美国哥伦比亚大学博士毕业,田野拒绝了国外优越的工作邀请,毅然回到偶像陈景润工作过的地方——中科院数学与系统科学研究院,从事基础数学研究工作。在田野看来,中科院数学与系统科学研究院倡导的,不是追求发表文章,而是攀登科学高峰,对人类的知识、对社会作出贡献。在这样的环境里,田野如鱼得水,文章虽不多,但每一篇都是解决问题的“大”文章。2017年至今,他在顶级期刊上发表论文4篇,并获得世界华人数学家联盟年会(ICCM)首届最佳论文奖。作为中科院的研究人员,田野是“国家队”的一员;作为一名共产党员,他更是一名先锋战士。十几年如一日,坚定的信念和强烈的责任心驱动着田野不断前行。今后一段时间,田野和团队将继续研究同余数问题的Goldfeld猜想。陈云霁 中科院计算技术研究所研究员陈云霁现任中国科学院计算技术研究所智能处理器研究中心主任,是国际首个深度学习处理器——寒武纪芯片的研发者之一。寒武纪的智能处理能效“秒杀”传统芯片,能大大提升计算机在人工智能领域的计算效能,目前已广泛应用于华为、曙光、联想等公司的产品中。《科学》杂志称其为国际上该方向公认的引领者和先驱。陈云霁认为科学研究没有捷径可走,得下苦功夫。在研发寒武纪之前,陈云霁已在处理器研发领域深耕多年,曾师从中科院计算所研究员胡伟武参与龙芯处理器架构设计,还跟随中国科学院院士陈国良、中科院自动化研究所研究员姚新等进行人工智能研究。2013年至2015年,陈云霁与合作者的数篇学术成果相继在国际顶级会议上发布,在业内初露锋芒。2013年,陈云霁所在团队与法国国家信息与自动化研究所(Inria)合作,设计出世界上首个深度学习处理器结构DianNao(电脑),该项工作获得了计算机系统结构领域顶级国际会议ASPLOS的最佳论文奖,也是亚洲首次在顶级国际会议上获奖。2016年,陈云霁及其所在团队为一大类神经网络加速器设计了一套名为Cambricon的指令集,在2016年ISCA会议上获得同行评议的最高分。同年3月,经过正式注册登记,其所在团队孵化出中国的AI独角兽——芯片方案供应商寒武纪。该公司是全球第一个成功流片并拥有成熟产品的智能芯片公司。2018中国科学院年度先锋人物李新荣 中科院西北生态环境资源研究院研究员1997年,博士后出站的李新荣放弃了留在中科院植物所的机会,回到了以“草方格”治沙闻名于世的沙坡头,从此在这里扎根二十多年。“草方格”是沙坡头独创的治沙技术,一块块纤弱的“草方格”成功地阻止了桀骜不驯的腾格里沙漠的入侵,结束了长久以来“沙逼人退”的困局。1989年“包兰铁路沙坡头地段铁路治沙防护体系”获得国家科技进步奖特等奖,也是中科院建院50年最具影响力的科研成果之一。李新荣带领团队开展长期观测和系统研究,面向国家战略需求把握学科动态,提出沙化草地恢复的理论假说,揭示了干旱沙区土壤水循环的植被调控机理,回答了降水小于200毫米沙区能否通过人工生态恢复的重大科学问题;系统研究了生物土壤结皮的生态水文功能,开展了人工培养拓殖技术研究,大大缩短生物结皮形成时间,具有良好的应用前景,填补了国内相关研究空白。他带领的团队取得了可喜的成果,培养了一支高素质的科研队伍。沙坡头站获得了中科院“野外工作先进集体”“全国防沙治沙先进集体”、科技部首批国家重点野外台站和中国科协“全国科普教育基地”等称号。他本人作为第一获奖人获得国家科技进步奖二等奖,真正成为“把论文写在祖国的沙漠中”的中国科学院优秀共产党员。曾馥平 中科院亚热带农业生态研究所研究员被当地百姓亲切称为“真扶贫”的曾馥平1987年7月毕业于南京林业大学,同年分配到中国科学院亚热带农业生态研究所工作,1994年7月他第一次来到环江县开展科技扶贫,从此开始了他20余年的科技扶贫人生。一到环江县,曾馥平立刻翻山越岭、爬山涉水,开始了考察取材工作,晚上伏案整理资料,着手对比研究。通过不懈的努力,他成功创建了全国首个生态移民扶贫试验区,构建了“科技单位+公司+示范基地+农户”的企业化科技扶贫创新机制,并和同事一起在精准扶贫道路上围绕石漠化治理和岩溶山区生态系统恢复与重建开启了新的里程碑,打造的“肯福”示范区为全区实施40万环境移民提供了示范样板和技术支撑。曾馥平现任中国科学院环江喀斯特农业生态试验站副站长,广西环江毛南族自治县县委常委、科技副县长(挂职)。他坚持“扶贫先扶智”,从转变群众的思想观念着手,引进新技术、孕育新思想,培养新型职业农民,培育和发展特色生态产业,创建农业科技示范园。示范区人均纯收入由1996年不足300元提高到2016年的9226元,生活水平已经超过周边地区的平均水平。曾馥平先后获得“全国十大科技扶贫标兵”“20年中国科技扶贫杰出贡献奖”“中国科学院优秀科技副职”等称号。2018中国科学院年度感动人物王敏 中科院青海盐湖研究所研究员“天上无飞鸟,地下不长草。一日有四季,风吹盐沙跑。”这是人们对青海柴达木盆地恶劣气候环境的生动概括。王敏却在自己最美的青春年华主动请缨到祖国西部的青海盐湖,深入柴达木腹地,与沙漠、盐碱和黄土为伴,坚持不懈30多年解决了高镁锂比盐湖提锂的世界性难题,实现了碧波万顷的千吨级盐湖提锂项目的达产。1986年,王敏在选择就业志愿时,5个志愿全都填写的是中国科学院青海盐湖研究所,一时成为全校轰动的焦点人物,受到学校和北京市的表扬。深入到柴达木盆地,在恶劣的气候环境和艰苦的生活条件下,王敏忍受着风吹日晒、孤独寂寞,以严谨的科学态度执着于盐湖资源综合开发利用及产业化研究工作。2001年10月,原国家计委批准的“青海盐湖提锂及资源综合利用”国家高技术产业化示范工程项目在东台吉乃尔盐湖开工,王敏也由此开始了她的野外工作生涯。经过8年艰苦努力,该项目终于在2007年年底全面建成投产,整个碳酸锂提取工艺的完成,填补了该领域世界空白,标志着青海在高镁锂比盐湖提锂和盐湖资源综合利用产业化方面走在了世界前列。结束东台的野外生活后,她将科研的重心放在了紧密结合地方资源与开拓创新上,尤其是盐湖丰产元素能源材料研究与开发工作,为产业化生产提供了充足的技术基础。近几年,王敏不断超越自我,承担国家科技部、中国科学院、地方科技厅及企业十余项研究课题,2010年获得青海省省级先进个人“巾帼建功”标兵称号;2016年所在的团队获中科院科促奖;多项成果荣获省部级奖项。黄晖 中科院南海海洋研究所研究员头顶烈日,脚踩波涛,与珊瑚为友,与虾贝为伴……多年来,黄晖的足迹遍布福建、广东、广西沿海,海南岛、西沙群岛、中沙群岛、南沙群岛、东沙环礁等有珊瑚礁分布的我国海域。只有溺过水的人,才能明白潜水的风险究竟有多大。而她潜水近三十年,用这种独特而危险的方式,科学考察了我国辽阔的东南海域,在国内首次实现珊瑚人工幼体培育,为人工修复满目疮痍的珊瑚礁打下了坚实基础。自1996年9月在中科院南海海洋研究所工作以来,黄晖一直从事珊瑚生物学及珊瑚礁生态学研究工作。她在科研岗位上严谨求实,兢兢业业,多次填补了相关领域的空白,引领和带动了珊瑚礁生态学研究领域的发展。面对全球范围的珊瑚礁退化,以及我国珊瑚礁生态所面临的严峻挑战,黄晖提出人工修复受损珊瑚礁的宏大构想并摸索出适合不同类型珊瑚礁恢复的技术方法,申请发明专利30多项。研究掌握了我国海域20多种常见造礁石珊瑚有性繁殖过程,并在国内首次实现了人工幼体培育,为珊瑚礁人工修复打下了坚实基础。目前,黄晖在西沙群岛和南海南部共建立300亩修复示范区,可培育珊瑚断枝4万株。黄晖积极参与国家和地方相关珊瑚礁保护与管理的法律法规的制定,积极推动徐闻珊瑚礁自然保护区建立并晋升国家级,为福建东山珊瑚礁省级自然保护区的调整提供了科学支撑。她还积极推动了我国和国际珊瑚礁科研机构的交流合作,促进了我国珊瑚礁生态科研整体水平,并推动了我国的珊瑚礁生态科研成果在国际海洋环境保护决策过程中发挥作用。2018中国科学院年度团队中科院神经科学研究所体细胞克隆猴团队2017年年底,中国科学院神经科学研究所体细胞克隆猴团队成功培育出世界首例体细胞克隆猴,2012年诺贝尔生理学和医学奖获得者John B. Gurdon发表评论:“这是一项里程碑式的工作。”美联社、路透社、《时代周刊》等300多家国际一线媒体进行重点报导,引起国际社会高度关注,引领了国际脑科学研究的新方向。20多年来,国际上多个顶级实验室尝试攻克体细胞克隆猴这个难题,但都铩羽而归。世界公认的克隆专家米塔利波夫前后用了1.5万枚猴卵,却仍以失败告终,国际上一度悲观地认为体细胞克隆猴不可能成功。中科院体细胞克隆猴团队却毅然接下了这一重任。在经费有限的情况下,体细胞克隆猴团队另辟蹊径,创新性提出了“蚕食”的方法,并不断试错,夜以继日地坐在实验台前,用废弃的卵进行训练,努力攻克细胞“去核”这只拦路虎。在5年中经历了数不清的失败,但是依旧锲而不舍向科学目标发起一次次冲锋。体细胞克隆猴团队始终坚持本土培育青年创新人才,他们没有一位具有留学背景,但个个“身怀绝技”,都是各项技术环节的顶尖人才。孙强和刘真义无反顾地放弃国外进修机会,抱定研究“大问题”的信念,把自己的黄金年华奉献给了祖国的创新型国家建设。平台位于一个荒岛,体细胞克隆猴团队和一群猴子在一起的时间,远远超过和家人在一起的时间,大家没有周末、少有假期,经常四五个月都没有个人时间。团队成员孙强夜里骑电动车摔断锁骨,为了不浪费来之不易的猴卵坚持实验,导致锁骨错位需要断开重接。2016年太湖水位超过警戒线1米多,团队所有男性工作人员冒着生命危险坚守在平台,不愿放弃猴群和设备,积极实施搬迁和抢救工作,他们认为在这里“找到了使命感、荣誉感和归属感”。正是在这种勇攀高峰、敢为人先、同心协力、砥砺前行的精神支撑下,团队成功突破了现有技术无法克隆灵长类动物的世界难题,在国际上首次实现了非人灵长类动物的体细胞克隆。中科院新疆分院驻村联合党支部自2014年以来,中科院新疆分院先后派出9批116人次干部驻村,局级干部12人次,处级干部40余人次,现有27人坚守驻村岗位,党员干部占多数,充分发挥了党组织的战斗堡垒作用和党员先锋模范作用,驻村工作取得了实质性进展。习近平总书记强调指出,社会稳定和长治久安是新疆工作总目标。新疆分院既要做好科研工作,还应承担维护新疆稳定的重大责任。自治区党委给新疆分院安排了6个村的驻村维稳和脱贫攻坚任务,是南疆四地州中最偏远、最贫困,维稳形势最严峻,基层工作任务最艰巨的地区之一,6个村8000余村民中60%为贫困人口。新疆分院分党组和各所台党委共同组建驻村维稳和脱贫攻坚工作领导小组,形成覆盖6个村的基层党建体系,6个村的工作队队长同时担任了所在村第一书记。工作队驻村后,协助县、乡党委从严整顿基层组织,壮大党员队伍,优化党员队伍结构,并着手建章立制,完善各类管理制度,打造“永不走的工作队”。自开展驻村工作以来,分院系统广大党员干部积极响应组织号召,舍小家、顾大家,踊跃报名参加驻村工作。当前,分院机关有近1/3的党员干部在开展驻村工作。几年来,在工作队的努力下,农村局面明显改观,村容村貌发生很大变化,村民思想观念和精神面貌发生很大转变。每周一早晨全体村民升国旗、唱国歌蔚然成风,学习国语热情高涨,积极参加科普教育和文体活动,宗教极端思想得到有效遏制。基层干部群众“发声亮剑”,誓与“三股势力”作坚决斗争,村里社会氛围焕然一新。新疆分院驻村联合党支部为村里修路、打井、修渠、架桥,实施了中科院“西部之光和田专项”和一批“科技服务网络计划”项目,发展设施农业,组织引导村民发展庭院经济,组织开展农业技术培训,广泛开展捐资助学,帮助墨玉县建立了天文科普基地,使得村民人均收入逐年提高,生活水平明显改善。驻村工作队连续4年被评为自治区优秀工作队,18名工作队员被评为自治区优秀队员并获得表彰和奖励。阿依玛克村党支部获墨玉县委“先进基层党支部”“和田地区2017年度五星级基层党组织”荣誉称号。(来源:《中国科学报》)
省监委与中科院计算技术研究所签署战略合作协议11月4日,山西省监察委员会与中国科学院计算技术研究所就山西“智慧监督”工程在太原签署战略合作协议。省委常委、省纪委书记、省监委主任王拥军,中国工程院院士、中国科学院计算技术研究所学术所长孙凝晖出席并分别致辞。王拥军表示,建设“智慧监督”工程是贯彻落实习近平总书记关于信息化工作重要论述和中央纪委国家监委、省委有关部署要求的具体行动,是把信息技术系统融入监督工作的探索实践。要通过战略合作,依托中科院计算所的科学技术前沿优势,构建立体监督网络,开辟监督新途径,提升监督执纪执法效能;要运用最新理念思路、最新科研成果和最新应用技术,实现“智慧监督”工程技术方案最优、平台建设最优、监督效果最优,为推动纪检监察工作高质量发展、夺取全面从严治党更大战略性成果提供强大助力。图文制作:山西广电融媒体
据光明日报消息,近期,中国科学院计算技术研究所计算机体系结构国家重点实验室宣布,由该实验室编译组主导研发的国产编程语言“木兰”正式发布。据中科院计算所介绍,“木兰”是一款定位于面向智能物联应用、采用最新编程语言设计理念和编译技术的程序设计语言,开发团队致力于将其打造为“智能物联时代的C语言”。Mulan原本是Mole Unit Language的简写,直译即“模块单元语言”。后来中科院计算所学术委员会主任徐志伟一下就念成了“木兰”,觉得用“木兰”更好,有浓浓的中国文化印记,用来命名这样一款国产编程语言,再合适不过。据介绍,“木兰”是由编译实验室完全自主设计、开发和实现的编程语言,与之配套的编译器与集成开发工具也完全由团队自主实现,是我们真正掌握核心技术的编程语言。“木兰”定位为下一代重要应用——智能物联的开发语言,它采用创新的弹性actor执行模型(擅长执行并行计算),可成倍地提高应用执行效率,在提高服务质量的同时大幅降低平台运营成本。目前,“木兰”已率先在编程教育方面投入应用。“木兰”编程语言的语法更加宽松,更适合初学者学习掌握,降低学习门槛;同时支持模拟仿真和调试功能,在软件上既可以验证软件和硬件设计的正确性;同时支持跨平台,对Android、IOS、Linux、Windows都可以很好的兼容;更重要的一点是,它可以很好地支持龙芯等国产处理器,后续会支持更多类型的国产处理器。以“木兰”为基础延伸的自主研发编程软件、人工智能教材、教学装备目前已经投入到中小学、幼儿园使用。中科院持续加大对“少年硅谷”公益项目的支持,截至目前,“木兰”应用范围涵盖了贵州、甘肃、江西、湖南、重庆、青海、山西、陕西和四川等18个省市共700所中小学。
中新网北京12月17日电 (记者 张素)记者17日从中国计算机学会获悉,来自中国科学院计算技术研究所的研究团队提出图神经网络加速芯片设计“HyGCN”。《中国计算机学会通讯》(CCCF)近日刊发了中科院计算所特别研究助理严明玉、研究员范东睿以及研究员叶笑春共同撰写的综述文章《图神经网络加速芯片:人工智能“认知智能”阶段起飞的推进剂》。文章披露,该团队提出了图神经网络加速芯片设计“HyGCN”。相关论文也先后在计算机体系结构国际会议上发表。严明玉在受访时说,图神经网络在搜索、推荐、风险控制等重要领域有着广泛应用。现有的处理器芯片在执行图神经网络的计算中效率低下,其团队展开面向图神经网络的加速芯片设计,为解决这一难题提供可行方案。让机器“会思考” 设计中“增引擎”图神经网络被认为有望解决深度学习无法处理的关系推理、可解释性等一系列问题,让机器“能理解、会思考”。然而由于图神经网络在图数据处理方面的特殊性,传统用于加速神经网络的芯片难以直接对图神经网络的执行提供高效计算支撑。严明玉解释说,以图数据为输入,融合了深度学习算法和图计算算法的图神经网络具有与传统神经网络不一样的执行行为,即“混合执行行为”。这对现有的处理器结构带来巨大挑战,比如GPU在应对不规则执行行为时极为低效。“为了应对图神经网络的混合执行行为,我们设计了新的处理器结构,以更高效地加速图神经网络的执行。”严明玉说,HyGCN芯片基于混合结构设计思想,分别为图神经网络的两个主要执行阶段——图遍历阶段和神经网络变换阶段设计相应的加速引擎。研究团队实践证明,HyGCN芯片设计能够有效应对图神经网络图遍历阶段的不规则性,并能利用神经网络变换阶段的规则性提高执行效率。目前是“无人区” 计算所正加快孵化“图神经网络加速芯片目前在国际上还是‘无人区’,研究成果发表后得到了业界认可。”严明玉受访时说,目前中科院计算所正加快对HyGCN科技成果进行孵化,提升关键核心技术能力,推动各行各业从信息化向智慧化升级。展望图神经网络的应用前景,严明玉举例说,在日常交通预测、网约车调度、金融诈骗侦查、运动检测等场景,在助力科研的知识推理、化学研究、宇宙发现等领域,以及在知识图谱、视觉推理、自然语言处理中的多跳推理等学科发展方向上,都有极大应用空间。事实上,谷歌地图基于事件树的风险评估、图片社交网站Pinterest的内容推荐、阿里巴巴的风控和推荐、腾讯等公司的视觉和风控等业务中都有图神经网络的影子。有市场研究机构发布报告预测,2022年机器学习芯片市场规模将达到827.2亿美元。图神经网络加速芯片可能将产生300亿美元以上的市场规模。(完)