新京报快讯(记者 王俊)今天(11月14日),北京智源行动计划正式发布,北京智源人工智能研究院揭牌成立。北京大学计算机系主任黄铁军担任首任院长。在2018中国(北京)跨国技术转移大会开幕式上,北京市科委主任许强正式发布北京智源行动计划。许强介绍,该计划是在科技部和北京市政府的指导和支持下,由企业、高校、院所等共同提出,是北京服务人工智能发展的顶层设计。北京智源行动计划的愿景和目标是按照国家新一代人工智能发展规划总体部署,支持科学家勇闯人工智能科技前沿“无人区”,推动人工智能理论、方法、工具、系统等方面取得变革性、颠覆性突破。许强表示,北京智源行动计划是一个融合开放的系统。智源行动计划将以共享数据、智能计算编程框架和算力基础设施为核心,打造北京智源开放服务平台。并将以人工智能领域的国家和省部级科技创新基地或独立实验室为单位,共建北京智源联合实验室。此外,按照北京智源行动计划的部署,北京市科委和海淀区政府推动成立北京智源人工智能研究院。研究院依托北京大学、清华大学、中国科学院等高校,以及百度、旷视、美团点评、小米、字节跳动等企业,建设开放服务平台,召开人工智能峰会,协调推进联合实验室和人才培养。记者了解到,研究院实行理事会领导下的院长负责制,原微软亚太研发集团首席技术官、源码资本投资合伙人张宏江担任首届理事长,北京大学计算机系主任黄铁军担任首任院长。新京报记者 王俊 编辑 邓琦 校对 柳宝庆
旨在发掘新生代研发精英,推进人工智能原始创新。今天,北京智源人工智能研究院在北京会议中心举办“智源学者计划启动暨联合实验室发布会”,向外界介绍了“智源学者计划”及“北京智源联合实验室”的目标与进展,同时发布了全球最大的物体检测数据集Objects365。据透露,智源学者计划旨在面向当前和未来人工智能创新发展,选拔并培养一批具有国际影响力的学科领军人才和具有发展潜力的青年学术英才,目前包含首席科学家、研究项目经理、研究员、青年科学家等四类人才,经过缜密公正的管理办法与工作流程,发布会上公布了首批智源学者候选人名单,并拟于2019年遴选100位智源学者。智源联合实验室则定位于协同创新平台,是研究院面向人工智能未来发展,围绕重大应用需求,联合各大高校、科研院所、优势企业等机构进行全方位科研合作的枢纽。北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)于2018年11月正式挂牌成立。作为北京智源行动计划的重要支持力量,北京智源人工智能研究院是北京市继脑科学与类脑研究中心、量子信息科学研究院之后,着力建设的又一个重要的新型研发机构。研究院集合了北京大学、清华大学、百度、小米、字节跳动、旷视、美团等在人工智能领域拥有深厚积淀的高校、企业,致力于建立创新科研组织与人才引进培养模式,以推动人工智能发展方向和理论、方法、工具、系统等方面的关键性突破。智源学者计划:培养AI高端核心人才 支持勇闯科学“无人区”在发布会上,北京智源人工智能研究院院长黄铁军向与会来宾介绍了智源学者计划。作为北京智源人工智能研究院打造高层次基础研究人才队伍的引领性工程,智源学者计划面向四类不同层次的人才提供支持,分别是在所属科研领域中的顶尖专家学者、兼备技术与管理才能的研究项目经理、在所属研究领域有所成就的领军研究员,以及青年科学家。“智源学者计划”目的是为从事人工智能基础研究的科学家营造良好的科研环境,给予科学家充分的尊重和信任,将技术路线决策权和人财物支配权全部交于科学家,试点科技经费“包干制”,大力简除烦苛,使科学家可以心无旁骛、潜心研究、创新突破。“目标是要找到最好的人,给他自由支配的经费,提供他需要的资源,支持开展人工智能领域特定方向上的重大基础问题研究,或者开展前沿问题的自由探索”黄铁军院长在介绍中说到。智源联合实验室计划:打破传统组织旧壁垒 打造开放平台新范例北京智源人工智能研究院副院长唐杰在现场发布了智源联合实验室计划。智源联合实验室计划,是北京智源人工智能研究院本着开放、共享、竞争、共赢的运营理念,与人工智能领域具有领先优势的企业、高校、科研院所一起实施全方位合作,共同追求原始创新和卓越发展。与现有的大多数联合实验室知识产权归属模式不同,在智源联合实验室经费和资源支持下产出的科研成果,将全部归承担相关任务的依托单位所有。发布会现场,海淀区副区长李俊杰与北京旷视科技首席科学家孙剑共同为“北京智源-旷视智能模型设计与图像感知联合实验室”揭牌。随后,北京旷视科技首席科学家孙剑详细介绍了智源-旷视联合实验室的相关情况。该实验室目前已通过立项论证,作为智源联合实验室计划的第一个联合实验室项目正式启动。孙剑表示,智源-旷视联合实验室建成后,将面向高校院所等科研单位和创新创业主体开放,形成开放互动的人工智能科研创新社区,致力推动图像感知与计算领域的协同创新。作为智源人工智能研究院组织开展跨学科、大协同创新公关方向的首个全方位合作平台,智源联合实验室将与智源学者计划、智源科技项目结合成三位一体的智源科研管理体系。该体系将致力于培育和支持国内优秀科研人才,组织开展跨学科、大协同的创新攻关,突破人工智能领域重大核心基础理论问题,不断完成前瞻性、基础性、集成性科技创新任务,引领未来人工智能基础研究方向,推动北京市人工智能产业发展,服务国家人工智能发展战略。智源联合实验室平台作为开放的服务平台,将打破传统组织形态与技术资源间的种种藩篱,打造开放式的科研环境。在建设人工智能应用验证场景方面,智源联合实验室平台将为广泛的人工智能技术研发人员提供实验环境,并通过智源数据服务平台和开源社区提供开放服务。在国际学术交流层面,联合实验室将积极开展国际科技合作和交流,吸引国内外高水平研究人员开展合作研究。在社会层面,本着向社会大众科学普及人工智能知识的初衷,联合实验室将面向社会公众,特别是学生人群提供每年不少于15天的社会开放日。目前,在面向部分人工智能优势企业开展的首批北京智源联合实验室定向征集工作中,已经收到多家联合实验室申报意向。全球最大的物体检测数据集Objects365数据集发布会上,孙剑还向与会来宾介绍了由智源-旷视联合实验室运营的公开项目——物体检测数据集Objects365。智源-旷视联合实验室建设Objects365数据集的初衷,是希望针对通用物体检测识别这类计算机视觉的基础任务,搭建世界上最大规模的通用物体检测数据集。孙剑介绍说,该数据集也是新一代通用物体检测数据集,具有规模大、质量高、泛化能力强的特点。Objects365定义了生活中常见的365个物体类别,在第一阶段涵盖图像总数超过60万张,标注框总数达到1000万,并计划在三年内将规模扩展到图像总数200万张,标注框总数2400万个。孙剑表示,智源-旷视联合实验室还将举办基于CVPR 2019研讨会的Detection In the Wild 2019(DIW 2019)挑战赛。该挑战赛于4月16日正式启动,5月10日开放测试集,6月10日结果提交截止,6月10日公布比赛结果。主办方为每个赛道的冠军队伍准备了10000美元的奖励。届时,优胜队还将在CVPR现场的研讨会上介绍经验,共同探讨检测问题的瓶颈及优化方向。结语:大力加强产业建设 打造人工智能新枢纽最后,北京市科委副主任张光连在总结时指出,北京智源人工智能研究院是北京市大力支持建设的新型研发机构,必将对推动北京人工智能产业创新发展发挥进一步作用。在智源研究院的建立和发展过程中,北京市科委和海淀区政府给予了大力支持。北京市科委在2018和2019年两年为智源研究院提供了共计3.4亿元的资金支持,海淀区则在办公空间、人才政策等方面提供了服务保障。下一步,北京市还将争取国家科技部等部门的支持,承接“科技创新2030”—“新一代人工智能”重大项目等任务。除了人工智能创新,北京市还将继续谋求人工智能产业化发展,促进科技成果落地转化。2019年,北京市将为重大技术成果提供更多的应用场景,积极推动人工智能技术产业化落地,使人工智能新技术、新产品、新模式在北京率先运用,形成区域优势。同时,北京市还将成立智源人工智能产业培育基金,为人工智双创企业分担创新风险,积极培育一大批国际领先的人工智能企业。围绕着搭建人工智能开放服务平台、引进培育高端人工智能人才、共建高水平联合实验室、加强产学研合作的重要目标,经过北京智源人工智能研究院与各企业、高校、院所等相关合作单位的不懈努力,北京智源行动计划已经初见成效。为响应“加强领导做好规划明确任务夯实基础,推动我国新一代人工智能健康发展”的号召,北京智源人工智能研究院力图为首都北京巩固和加强人工智能高地优势,解决我国人工智能发展所面临的问题,打造链接世界人工智能的中心枢纽贡献力量。
3月20日,北京智源人工智能研究院举办“智源悟道1.0”AI研究成果发布会暨大规模预训练模型交流论坛”,会上发布了超大规模智能模型“悟道1.0”。这是我国首个超大规模智能模型系统,由智源研究院学术副院长、清华大学唐杰教授领衔,带领来自北大、清华、人大、中科院等单位的100余位AI科学家团队联合攻关,取得了多项国际领先的AI技术突破,形成超大规模智能模型训练技术体系,训练出包括中文、多模态、认知、蛋白质预测在内的系列模型,构建我国人工智能应用基础设施。北京市科委、中关村管委会副主任许心超在致辞中指出,“十四五”时期北京将依托在人工智能领域的科技资源和产业发展优势,支持建设智源研究院等一批世界一流新型研发机构,前瞻部署人工智能基础研究,加强关键核心技术攻关,推动人工智能占先。北京市支持智源研究院牵头建设“超大规模人工智能模型训练平台”,此次发布的“悟道1.0”即为该平台的重要内容,通过研发超大规模信息智能模型和生命模型,推动电子信息、生物医药等基础科学科研范式变革,加速科学研究进程;同时推动创新企业及个人开发者基于大模型构建智能化水平更高的场景应用,赋能实体经济智能化升级,促进经济高质量发展。据“悟道”模型技术委员会主任、智源研究院学术副院长唐杰教授介绍,“悟道1.0”先期启动了4个大模型的研发:一是“悟道·文源”,是“以中文为核心的大规模预训练模型”,目前模型参数量达26亿,具有识记、理解、检索、数值计算、多语言等多种能力,并覆盖开放域回答、语法改错、情感分析等20种主流中文自然语言处理任务,技术能力已与GPT-3实现齐平,达到现有中文生成模型的领先效果。二是“悟道·文澜”,是“超大规模多模态预训练模型”,目前性能已到达国际领先水平,在中文公开多模态测试集AIC-ICC的图像生成描述任务中,得分比冠军队高出5%;在图文互检任务中,得分比目前最流行的UNITER模型高出20%。“悟道·文澜”模型已对外开放API。三是“悟道·文汇”,是“面向认知的超大规模新型预训练模型”,目前参数规模达113亿,在多项任务中“悟道·文汇”的表现已经接近突破图灵测试,通过简单微调就已经实现AI作诗、AI作图、AI制作视频、图文生成、图文检索、复杂推理。四是“悟道·文溯”,是“超大规模蛋白质序列预测预训练模型”,目前已在蛋白质方面完成基于100GB UniParc数据库训练的BERT模型,在基因方面完成基于5-10万规模的人外周血免疫细胞(细胞类型25-30种)和1万耐药菌的数据训练,同时搭建训练软件框架并验证其可扩展性。唐杰教授表示,“悟道1.0”已经完成了百亿和千亿参数规模的预训练,在多个国际评测中取得世界第一,在部分任务上具有一定认知能力。目前智源研究院已启动第一阶段的示范性应用搭建,今年还将陆续发布后续迭代版本,面向产业界开放使用。文/北京青年报记者 雷嘉编辑/张鹏[ 北京头条客户端 ]
2019全球计算机科学和电子领域H-index排名(实时更新)前1000名的科学家,中国大陆进榜16位,北京有10位,其中9位,都进了位于海淀区的这家机构——北京智源人工智能研究院。叶晓彦摄以北京智源人工智能研究院为核心,清华大学南门外,将建设北京人工智能标志性创新聚集区,打造世界性的人工智能研究中心。聚集区将建科学家研究中心、学术交流中心、创新孵化中心、技术展示中心。预计明年“五一”投入运行。北京智源人工智能研究院是干什么的?2018年11月14日揭牌成立,陈吉宁市长在致辞中介绍,它是北京市继脑科学与类脑研究中心、量子信息科学研究院之后,建设的又一个重要的新型研发机构。集合了北京大学、清华大学、中国科学院、百度、字节跳动等人工智能领域优势单位,采用新的科研组织形式和人才引进培养模式,推动人工智能发展方向和理论、方法、工具、系统等方面的关键性突破。北京市将把政府、企业和社会数据集合到这一平台上,建设新的开源人工智能工具,并将整合大学和大企业的计算能力,向各类AI研发机构开放。新型研发机构,新在哪?它是一家民办非企业法人单位,实行理事会领导下的院长负责制。其人才培养远景是“找到最好的人,给他自由支配的经费,提供他需要的资源”。比如,投资支持的是人,是目前最顶级和将来有可能变成最顶级的研究人才,长期“施肥浇水”,而不再是项目。如支持年限5年一个周期,期间有验收,没有进展就停止支持。而不是以往支持项目,效果不理想也有可能通过验收。而且,人才的遴选实行同行评议、同行推荐,而不是专家评审。同行最能掌握行业最新进展和人才的真实实力以及潜能。比如,创新财政科技经费支持方式,经费使用实行负面清单制度,只要不用于捐赠、投资、赞助、罚款、支持在职人员学历教育等方面,如何使用,科学家说了算。成立8个多月以来,研究院都干了什么?发布了北京智源行动计划。作为计划的一部分,启动了智源学者计划。根据汇聚的科学家的研究领域,确定了五大学术攻坚方向:人工智能的数理基础、机器学习、自然语言理解、智能信息检索与挖掘、智能构架与芯片。围绕每一个方向,组建顶配的研究团队。团队由四类人组成:智源科学家首席(CS)、智源研究项目经理(PM)、智源研究员(PI)和智源青年科学家。其中,智源首席科学家(CS)由领域内顶尖专家学者担任,负责研究方向的整体规划布局,并推荐智源研究员(PI)人选;智源研究项目经理(PM)则兼备技术和管理才能,协助CS管理项目,并负责多方沟通;智源研究员(PI)是所属研究领域的领军人才,开展确定领域的科研活动。智源青年科学家是38岁以下拥有博士学位、在科研上具有无限发展潜力的青年学者,智源研究院将支持他们开展开放性、探索性研究,勇闯人工智能科技前沿“无人区”,支持他们面向未来人工智能新思维和新体系的发展,提出引领性的原创基础研究成果。经过提名、初评、审议等流程,已经遴选出首批智源学者共28人,其中最年轻的智源青年科学家,旷视科技的张祥雨博士只有28岁。建设智源联合实验室,分别是与高校院所共建、与优势企业共建。目前,北京智源—旷视科技智能模型设计与图像感知联合实验室、北京智源—京东多模态智能对话与人机交互实验室已基本建成。智源数据开放平台、智源社区也都在推进建设中。未来,全北京乃至全国最好的人工智能领域人才,都将汇聚清华南门。来源 北京日报客户端 记者 于丽爽流程编辑 TF003
本文转自【人民日报】;本报电 日前,北京智源人工智能研究院发布超大规模智能模型系统“悟道1.0”。 据介绍,由北京智源人工智能研究院联合北京大学、清华大学、中国人民大学、中国科学院等单位的100余位人工智能科学家联合攻关,形成超大规模智能模型训练技术体系,训练出包括中文、多模态、认知、蛋白质预测在内的系列模型。专家认为,通过研发超大规模信息智能模型和生命模型,有助于推动电子信息、生物医药等基础科学科研范式的变革,加速科学研究进程,同时助力推动创新企业及个人开发者构建智能化水平更高的场景应用。
来源:金融界网站11月14日,北京智源行动计划正式发布,北京智源人工智能研究院揭牌成立。科技部党组书记、部长王志刚,北京市委副书记、市长陈吉宁出席会议。北京智源人工智能研究院是北京市继脑科学与类脑研究中心、量子信息科学研究院之后,着力建设的又一个重要的新型研发机构。该院依托北京大学、清华大学、中国科学院、百度、旷视、美团点评、小米、字节跳动等人工智能领域优势单位,建设开放服务平台,召开人工智能峰会,协调推进联合实验室和人才培养。北大、中科院等人工智能相关合作公司有望受益北京智源行动计划。 上市公司:中科曙光:是中科院科技产业化领军、先进计算及智慧城市两大联盟理事长单位,拥有对中科院旗下顶级科技资产的深度业务合作及股权整合优先权。北信源:与清华大学、北京大学、中国科学院新锐科技团队一起发起成立人工智能产业技术创新战略联盟。中科创达:与人工智能芯片独角兽公司寒武纪达成战略合作,将共同开发新型的人工智能技术以及面向行业的人工智能解决方案,加速推动人工智能场景落地。
雷锋网 AI 科技评论按:今天,在 2018 中国(北京)跨国技术转移大会开幕式上,北京智源行动计划正式发布,北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)揭牌成立。北京智源行动计划北京市科学技术委员会主任许强在会上正式发布北京智源行动计划。该计划是在科技部和北京市政府的指导和支持下,由企业、高校、院所等共同提出,是北京服务人工智能发展的顶层设计,是凝聚各方智慧的行动方案。北京智源行动计划的愿景和目标是按照国家新一代人工智能发展规划总体部署,支持科学家勇闯人工智能科技前沿“无人区”,推动人工智能理论、方法、工具、系统等方面取得变革性、颠覆性突破,引领人工智能学科前沿和技术创新方向,推动北京成为全球人工智能学术思想、基础理论、顶尖人才、企业创新和发展政策的源头,支撑人工智能产业发展,促进人工智能深度应用,改变人类社会生活,改变世界。北京智源行动计划是一个融合开放的系统,围绕人工智能开放服务平台、共建联合实验室,人才集聚培养、产学研学术交流等方向,重点开展四项任务:重点任务一:构建创新生态,打造北京智源开放服务平台。以打造共享数据、智能计算编程框架和算力基础设施为核心,构建北京智能开放计算平台,作为人工智能科学研究和新技术研发的基础设施。重点任务二:推动原始创新,共建高水平联合实验室。遴选优势单位,以国家级和省部级人工智能领域的科技创新基地或独立实验室为单位,与研究院共建若干联合实验室。重点任务三:培养引进并举,集聚高端人才。放眼国际,汇聚北京市人工智能领域基础研究创新资源,引进和培养有全球影响力的人工智能顶尖人才团队。重点任务四:加强产学研合作,举办全球人工智能峰会。组织开展有影响力的人工智能国际前沿科技学术交流活动,把北京打造成链接世界人工智能产业与学术资源的中心枢纽。北京智源人工智能研究院会上,北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)正式揭牌成立,北京智源人工智能研究院是北京智源行动计划的一部分。研究院实行理事会领导下的院长负责制,原微软亚太研发集团首席技术官、源码资本投资合伙人张宏江担任首任理事长,北京大学计算机系主任黄铁军担任首任院长。北京市市长陈吉宁在开幕式致辞中指出,北京智源人工智能研究院是北京市继脑科学与类脑研究中心、量子信息科学研究院之后,着力建设的又一个重要的新型研发机构。研究院将集合北京大学、清华大学、中国科学院、百度、字节跳动等人工智能领域优势单位,采用新的科研组织形式和人才引进培养模式,推动人工智能发展方向和理论、方法、工具、系统等方面的关键性突破。北京市将把政府、企业和社会数据集合到这一平台上,建设新的开源人工智能工具,并将整合大学和大企业的计算能力,向各类AI研发机构开放,欢迎全球的人工智能研究人员参与使用。研究院的组织架构研究院的目标是:在人工智能发展方向和理论、方法、工具、系统等方面取得变革性、颠覆性突破,取得一批具有重要国际影响的原创性成果。研究院首任理事长为张宏江博士。张宏江是源码资本投资合伙人,字节跳动技术战略研究院院长,原金山 CEO。他是声誉卓著的微软亚洲研究院的创始人之一,之后又创立了融技术创新、产品开发、研究成果转换于一体的微软亚洲工程院,并曾担任微软亚太研发集团首席技术官以及微软“杰出科学家”。张博士是国际著名的多媒体领域的专家,视频检索研究领域的“开山鼻祖”,是计算机领域影响因子最高的科学家之一。 他是国际计算机协会(ACM)和电气电子工程协会(IEEE)双院士,曾荣获 2010 年 IEEE 技术成就奖和 2012 年 ACM 多媒体杰出技术成就奖,并获评 2008 年度美国杰出亚裔工程师奖。研究院首任院长为黄铁军博士。黄铁军,博士,北京智源人工智能研究院院长,北京大学信息科学技术学院教授,计算机科学技术系系主任,数字媒体研究所所长,AVS 工作组秘书长,数字视频编解码技术国家工程实验室副主任,国家杰出青年科学基金获得者,教育部“长江学者”特聘教授。主要研究方向为视觉信息处理(图像识别与视频编码)和类脑计算,累计主持国家级科研项目十多项,发表(含合作)学术论文 200 多篇,作为主要起草人制定国家标准、ISO/IEC 标准和 IEEE 标准十数项,申请发明专利八十多项,两次荣获国家科学技术进步二等奖,四次荣获省部级一等奖,并获“中国科协求是杰出青年成果转化奖”和 IEEE 计算机学会 Computing Now Award。(完)
e公司讯,14日,北京智源行动计划正式发布,北京智源人工智能研究院揭牌成立。北京智源人工智能研究院是北京市继脑科学与类脑研究中心、量子信息科学研究院之后,着力建设的又一个重要的新型研发机构。该院依托北大、清华、中科院、百度、旷视、美团点评、小米、字节跳动等人工智能领域优势单位,建设开放服务平台,召开人工智能峰会,协调推进联合实验室和人才培养。北大、中科院等人工智能相关合作公司有望受益北京智源行动计划。(中证资讯)
14日,北京智源行动计划正式发布,北京智源人工智能研究院揭牌成立。北京智源人工智能研究院是北京市继脑科学与类脑研究中心、量子信息科学研究院之后,着力建设的又一个重要的新型研发机构。该院依托北大、清华、中科院、百度、旷视、美团点评、小米、字节跳动等人工智能领域优势单位,建设开放服务平台,召开人工智能峰会,协调推进联合实验室和人才培养。北大、中科院等人工智能相关合作公司有望受益北京智源行动计划。(文章来源:中证资讯)
来源:新浪科技新浪科技讯 3月20日晚间消息,北京智源人工智能研究院在“智源悟道1.0 AI研究成果发布会暨大规模预训练模型交流论坛”上,发布超大规模智能模型“悟道1.0”。据介绍,“悟道1.0”是我国首个超大规模智能模型系统,由智源研究院学术副院长、清华大学唐杰领衔,带领来自北京大学、清华大学、中国人民大学、中国科学院等单位的100余位AI科学家团队联合攻关,取得了多项国际领先的AI技术突破,形成超大规模智能模型训练技术体系,训练出包括中文、多模态、认知、蛋白质预测在内的系列模型,勇闯通用智能发展前沿,构建我国人工智能应用基础设施。同时,与龙头企业共同研发工业级示范性应用,加快大规模智能模型应用生态建设。“悟道1.0”先期启动了4个大模型的研发,包括悟道·文源,悟道·文澜,悟道·文汇,悟道·文溯几个项目。其中,“悟道·文源”是“以中文为核心的大规模预训练模型”,目前模型参数量达26亿,具有识记、理解、检索、数值计算、多语言等多种能力,并覆盖开放域回答、语法改错、情感分析等20种主流中文自然语言处理任务,技术能力已与GPT-3实现齐平。其目标是构建完成全球规模最大的以中文为核心的预训练语言模型,在中英文等多个世界主流语言上取得最好的处理能力,在文本分类、情感分析、自然语言推断、阅读理解等多个任务上超越人类平均水平,探索具有通用能力的自然语言理解技术,并进行脑启发的语言模型研究。“悟道·文澜”是“超大规模多模态预训练模型”,模型参数量达10亿,基于从公开来源收集到的5000万个图文对上进行训练,是首个公开的中文通用图文多模态预训练模型。其目标是突破基于图、文和视频相结合的多模态数据的预训练理论难题,并最终生成产业级中文图文预训练模型和应用,并在多个评测应用上超过国际最高性能。“悟道·文澜”模型已对外开放API。“悟道·文汇”为“面向认知的超大规模新型预训练模型”,参数规模达113亿,在多项任务中的表现已经接近突破图灵测试,通过微调可实现AI作诗、AI作图、AI制作视频、图文生成、图文检索、复杂推理。其致力于从认知的角度研究通用人工智能中一系列更本质问题,侧重进一步提升和发展预训练模型基于逻辑、意识和推理的认知能力,目标是研发出千亿至万亿级别参数量的、更通用且性能超越国际水平的预训练模型,搭建预训练模型体系,同时形成认知智能生态。“悟道·文溯”是“超大规模蛋白质序列预测预训练模型”,已在蛋白质方面完成基于100GB UniParc数据库训练的BERT模型,在基因方面完成基于5-10万规模的人外周血免疫细胞(细胞类型25-30种)和1万耐药菌的数据训练,同时搭建训练软件框架并验证其可扩展性。其最终目标是以基因领域认知图谱为指导,研发出十亿参数规模、可以处理超长蛋白质序列的超大规模预训练模型,在基本性能、可解释性和鲁棒性等多个方面达到世界领先水平。据唐杰介绍,此次发布的“悟道”大模型1.0版本,已经完成了百亿和千亿参数规模的预训练,在多个国际评测中取得世界第一,在部分任务上具有一定认知能力。今年,还将陆续发布后续迭代版本,面向产业界开放使用。会上,智源研究院院长黄铁军介绍了“悟道”模型研发的初衷。据他介绍,本轮人工智能浪潮的基本特点是“数据+算力+算法=模型”,模型浓缩了训练数据的内部规律,是实现人工智能应用的载体。近年来人工智能的发展,已经从“大炼模型”逐步迈向了“炼大模型”的阶段,通过设计先进的算法,整合尽可能多的数据,汇聚大量算力,集约化地训练大模型,供大量企业使用,这是必然趋势。智能模型不仅要规模大(主要体现为参数量),还要智商高,才能满足各种应用需要,这需要突破大量技术挑战。例如:如何使得预训练模型具备像人类一样的符合逻辑、意识和推理的认知能力?如何实现对图、文和视频等多模态数据和信息的理解和建模的统一?如何将中文融入预训练模型,推动中文应用背景下的人工智能的发展?如何使得预训练模型深入融入自然科学研究,在目前基础上进一步实现对超长/复杂蛋白质序列的建模和预测?作为以人工智能源头创新为使命的新型研究机构,智源研究院2020年10月正式启动超大规模智能模型“悟道”项目,研发既博大又精深的超大规模训练模型,从更加本质的角度进一步探索通用人工智能。此次发布上,还同时成立了由9位来自学术界和产业界的科学家组成的“悟道”大模型技术委员会。委员会主任由唐杰担任,后续,技术委员会将为大模型研发的技术方案和路线选择等进行指导和把关。据唐杰介绍,下一步,“悟道”模型应用生态建设分为三个主要阶段,分别关注示范应用、API生态及社区运营维护等。第一阶段为示范性应用搭建,将构建面向电子商务、智能文本服务、垂直领域以及数个独立的示范性应用,将开放几个高质量的应用Demo,支持用户在平台页面上使用及测试。第二阶段为API及平台生态构建,将设计多个API,支持对模型的不同请求方式,构建支持高并发、高速推理的API接口,分别支持企业级用户、个人独立开发者对模型或特定功能的请求。第三阶段为社区运营及迭代,将逐步增量扩大在线评测,构建开发者及使用者社区,建立完善的使用反馈机制,并作为模型迭代的参考标准,同时加强社区维护及管理,加快模型迭代。目前,智源研究院已启动第一阶段的示范性应用搭建,正与快手、搜狗、360、阿里、智谱华章、一览群智、循环智能、新华社等机构就模型的应用进行洽谈,联合构建一批工业级示范性应用。(雪梅)