欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
内江市科协邀请北京机械工业自动化研究所专家到内江开展技术对接孔子之楚

内江市科协邀请北京机械工业自动化研究所专家到内江开展技术对接

为进一步推进北京机械工业自动化研究所有限公司和内江市汽车等产业战略合作框架协议的落地落实。内江市科协邀请北京机械工业自动化研究所有限公司专家到内江开展汽车产业技术对接。12月3日,北京机械工业自动化研究所有限公司副总工程师、研究员韩立新一行四人到内江凤凰机械有限公司进行技术对接,内江市科协主席林海亮、副主席刘书平同志全程陪同。据了解,内江凤凰机械有限公司是内江凤凰企业(集团)有限公司所属的全资子公司,该公司是西南地区最大的汽车车架生产厂,年产车架20万付,产值3亿多元,已同重庆长安跨越车车辆公司、华晨鑫源重庆、四川现代、资阳南骏等汽车厂家配套,得到行业认可和好评,是内江建设全国汽车零配件基地的骨干企业。为促进企业转型升级,进一步提升核心竞争力和市场竞争力,公司拟在微卡汽车行业建设全国第一条车架总成自动化生产线,需要自动化研究方面的高层次专家为其提供技术、智力支持。围绕公司的技术创新需求,内江市科协主动对接,邀请北京机械工业自动化研究所有限公司的专家莅临内江,专家们深入车间现场,实地查看,仔细了解生产工艺中疑点、难点,并与内江凤凰集团董事长李开明、内江凤凰机械有限公司副总经理余跃及有关技术人员进行了探讨交流。下一步双方将在进行工艺调整优化、技术方案制定等继续对接,并达成共建院士(专家)工作站的意向。为助力内江新能源汽车产业园项目建设,3日下午,在内江市科协党组书记高宏、副主席刘书平同志陪同下,北京机械工业自动化研究所的专家们又前往国跃新能源汽车产业园调研,与跃迪集团总裁刘明海等有关人员进行了技术交流,达成了初步合作意向。(刘茂 四川科技报记者张跃明)

学知

度小满携手中科院自动化所 联合培养智能领域博士后

来源:证券日报本报记者 李冰9月15日,度小满金融与中国科学院自动化研究所(以下简称中科院自动化所)在北京举办了“联合培养博士后项目”启动仪式。双方将建立联合培养博士后人员的管理机制,共同开展人工智能及相关领域的博士后联合招收培养,围绕双方主要业务科研领域,培养人工智能领域方面的博士后人才。据悉,双方合作的第一个博士后项目是“情感识别技术在语音机器人中的应用”。据悉,度小满语音机器人的语音识别准确率已达到95%以上,已替代信贷业务中六成重复性工作。今年疫情期间,银行等金融机构的客服人员为避免人员聚集不能按时到岗,度小满的语音机器人团队基于大数据能力将用户的新话术转化为机器学习的知识图谱,在3天内完成了语音机器人的迭代升级,有效解决了多家银行客服无法复工的难题,帮助银行实现远程办公。资料显示,2019年11月,度小满金融“智能语音机器人金融应用”入选中国人民银行首批金融科技应用试点,目前已经应用在工商银行、招商银行、光大银行等80家银行,成本只有人工的1%。度小满金融CEO朱光表示,推进人工智能在金融领域的应用,关键是要有一批既有技术能力也懂金融的复合型人才。我们希望通过与中科院自动化研究所联合培养博士后人才,为博士后人员提供面向人工智能领域的科研与实战环境,共同探索人工智能技术在金融领域的前沿应用,促进科技创新成果转化。“当前语音机器人在听得清、听得懂上已经做的很好,但它还不能理解人的情感。通过在情感计算领域的探索,我们希望有朝一日语音机器人不仅能听懂人的说话,还能判断一个人的情绪是开心还是悲伤。情感识别技术的提升,不仅能大幅提升用户体验,推动整个金融业的智能客服系统升级,在社会治理等多个领域也有重要应用价值。”中国科学院自动化研究所模式识别国家重点实验室副主任陶建华表示。资料显示,中科院自动化所是我国最早成立的自动化研究机构,拥有60多年历史,是国内外首家“人工智能学院”牵头承办单位,在机器学习、自然语言处理、智能机器人等领域取得了丰富的研究成果。(编辑 李波)

不将不迎

专访中科院自动化所曾毅:不应以发展为借口越过AI伦理红线

“有些尝试是在设计阶段就不应该去做的,我们不能用‘可能会影响发展’的借口去尝试那些已经处于红线、甚至越过红线的应用和场景。”近日,澎湃新闻(www.thepaper.cn)记者专访中国科学院自动化所研究员、北京智源人工智能研究院AI伦理中心主任、国家新一代人工智能治理专委会委员曾毅,就国外某些科技巨头停止使用人脸识别技术、中国公众对数据隐私的态度和人工智能治理等话题展开讨论。如何看待放弃人脸识别技术?5月底,非裔美国人弗洛伊德遭美国警察暴力执法致死一事后,人脸识别使用争议再次引发讨论。美国多家科技公司,包括微软、IBM和亚马逊因隐私争议、算法偏见等问题表示暂停向美国警方提供人脸识别系统。对此,曾毅认为,技术公司放弃使用人脸识别算法并没有解决问题,而是在回避问题。他推测,如果技术公司宣布放弃人脸识别的使用,很可能是找到了其他替代方案,例如改用其他生物特征识别方法。“比如公众对人脸识别的意见非常大,技术公司说‘好,我们放弃人脸识别’”,“但公众可能并不知道,虹膜识别、步态识别、声纹识别和指纹识别等其他生物特征几乎可以达到人脸识别的准确率。而这些当中也不乏存在肤色、性别、年龄、种族和国别等偏见的问题。因此简单的禁止使用某项技术并没有解决潜在风险,积极负责任地解决技术的伦理风险本身,发挥技术的善用才是真正应该做的事情”。在他看来,人脸识别技术在国家与社会安全中发挥了很多积极作用,例如跨年龄人脸识别可用来打拐。“关键问题是,不应该让人脸识别系统直接去做决策,比如不能因为肤色黑、以及一些特定的其他面部特征,就判断犯罪的可能性高。”人脸识别技术可以用来做决策辅助,但不应该在决策中扮演决定性作用。对于人工智能算法的偏见问题,他补充解释道,人工智能基于大量的社会数据,数据中已经表征了社会偏见,这是一个不能回避的问题。而技术开发者本身也有可能由于自身的偏见,对系统引入额外偏见。“我们应当采用人工智能技术去规避数据当中的潜在偏见,更应避免技术设计者引入个人偏见。”从“渐变码”看中国公众对数据隐私的态度“说中国公众对隐私问题不是特别重视,其实是一个误区,并可能产生误导。”曾毅认为,就公众对隐私的重视程度而言,中国和西方国家没有本质差异。他提到,2019年世界经济论坛就公众对政府合理使用人脸识别系统的态度进行过一次调研。结果发现,中国公众的支持率是83%,美国的支持率是80%,两者结果相似。2020年5月,他所在的北京智源人工智能研究院人工智能伦理与安全研究中心联合中国科学院自动化研究所中英人工智能伦理与治理研究中心共同发布了《人脸识别与公共卫生调研报告》,显示新冠疫情期间,中国公众没有放松对隐私安全的要求。曾毅尤其关注到,新冠疫情期间,“杭州渐变色健康码将上线”的消息在网上引发讨论。他表示中国网民关于“渐变码”的伦理和隐私安全讨论“非常切中要害”。首先,网民对“渐变码”的关注度很高,很多讨论几千人点赞和回复。“具体观点来看,大家当时就谈,健康码是为新冠疫情而做的。如果超越了新冠防控本身,老百姓是不愿意的,这是一个非常明确的意见。”第二,网友提到,健康码的设计初衷是给别人看的,但每天是否抽烟、喝酒、睡眠时长甚至走路步数,这些都是个人的健康数据,并没有打算给别人看。他认为,公众的对于隐私保护的讨论、对于数据流向等概念的理解非常清晰,分析也很深刻。人工智能治理愿景与技术落地2019年5月,国家互联网信息办公室发布了《数据安全管理办法(征求意见稿)》。同年8月,国家互联网信息办公室又发布《儿童个人信息网络保护规定》,明确任何组织和个人不得制作、发布、传播侵害儿童个人信息安全的信息。曾毅在采访中提到,上述两个规定以及新颁布的民法典中,都有关于数据安全保护的相关规定,尤其关于儿童个人信息保护的规定在全世界走在前列。但无论是欧盟的《通用数据保护条例》或者中国的这些尝试,都有一些需迫切解决的问题。例如,《通用数据保护条例》中提到数据删除,即用户授权同意后改变想法,想把数据撤回。《通用数据保护条例》要求允许用户撤回。曾毅介绍,尽管很多人工智能企业表明自己符合这条规定,但从人工智能模型中删除数据十分困难。目前几乎没有一家企业可以做到在训练好的人工智能模型中,把某个用户数据的影响从模型中删除。“规范的愿景长期来讲一定是有益的,但在落地层面还需要学术界、企业界真正从技术的角度解决伦理与治理的痛点,从而取得突破。”不应以发展为借口越过AI伦理红线换脸软件ZAO在协议中暗藏霸王条款、教室使用表情识别技术、杭州动物园“人脸识别第一案”……2019年发生了数起因滥用人脸识别相关技术或触碰伦理红线而引发争议的事件。曾毅表示,出现这些现象是因为人工智能的利益相关方,例如开发AI的公司、部署AI的企业、用户在数据合规性和用户隐私保护方面做得不够规范。在他看来,人工智能产品研发的过程当中,在设计、研发、使用和部署各环节都应当注意数据隐私安全和算法潜在伦理隐患等问题。应当采取策略性的设计,并使用多相关方共担责任的框架,以此发展未来的人工智能。“多相关方共担责任的框架”是指人工智能算法的提供者和技术使用者承担各自应承担的责任。例如新冠疫情期间的健康码虽然由企业开发,但数据部署和收集工作由各省市的大数据中心负责。因此,不仅提供相关技术的企业需要注意数据安全保护的问题,维护数据的各个省市大数据中心也需要注意相关的保护问题。曾毅总结道,作为一种颠覆性的技术,人工智能可以改变世界,它能够被善用,也有风险被恶用、误用和滥用。“我们在用技术改变社会的尝试中,应当尽可能避免误用、杜绝恶用和滥用。所以,有些尝试是在设计阶段就不应该去做的。人工智能一定是发展是主题,但是我们不能用‘可能会影响发展’的借口去尝试那些已经处于红线、甚至越过红线的应用和场景。”(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

天志

院校分析:中科院自动化所和经济与管理学院

高校简介中国科学院大学(University of Chinese Academy of Sciences)简称“国科大”,入选国家“双一流”世界一流学科建设高校、“基础学科拔尖学生培养试验计划”,是环太平洋大学联盟、京港大学联盟、科技大学联盟、中国高校行星科学联盟成员,首批学位授权自主审核单位之一。国科大的前身是中国科学院研究生院,成立于1978年,2012年6月更名为中国科学院大学。2014年,国科大开始招收本科生,形成了覆盖本、硕、博三个层次的高等教育体系。中科大经济与管理学院成立于2001年。学院设有6个系、11个学术研究中心和3个部级重点实验室。经济与管理学院有统计学、企业管理、金融学、金融、管理科学与工程、创新管理和工商管理7个专业。经济与管理学院现有在读博士、研究生1000余名,在读MBA学生500余名,聘请企业导师100余名。2020年中国科学院大学经济与管理学院各专业推免数据分析各专业推免人数对比中科院经济与管理学院一共在五个专业招收推免生,分别为统计学、企业管理、金融学(学硕)、金融(专硕)、管理科学与工程,其中金融占比最大。统计学招生数量少,只招收一人。生源院校类别比例中科院经济与管理学院2020招收40位推免生,以985、211生源为主(占比82%),双非院校生源相对较少(占比18%)生源校及招收生源人数985院校北京大学(1)、北京理工大学(1)、湖南大学(2)、华东师范大学(1)、华南理工大学(1)、华中师范大学(1)、吉林大学(1)、南京大学(1)、南开大学(1)、厦门大学(1)、山东大学(1)、四川大学(1)、武汉大学(1)、西北工业大学(1)、浙江大学(1)、中国人民大学(1)211院校南京航空航天大学(1)、北京交通大学(1)、西北大学(1)、中国矿业大学(北京)(1)、中国政法大学(3)、中央财经大学(1)、西南交通大学(2)、郑州大学(1)双非院校东北财经大学(2)、河南大学(1)、南方科技大学(1)、山西财经大学(1)、湘潭大学(1)、中国社会科学院大学(1)从生源本科院校来看,中科院力学所的生源非常平均分散,生源并未受中科院力学所地理区位(北京)影响。各地区各大学生源人数近似相等,并未出现人数位差。各专业招收生源人数比例2020年中科院经济与管理学院管理科学与工程生源平均,以商科、文科强校居多。有一个双非生源本科学校,南方科技大学(1人) 。2020年中科院经济与管理学院金融生源中双非院校有4人,来自河南大学、山西财经大学、湘潭大学和中国社会科学院大学。2020年中科院经济与管理学院金融学生源中双非院校仅有一人,来自东北财经大学。2020年中科院经济与管理学院企业管理招生量少,报考不确定因素较多,生源学校均来自211,985。五位生源本科学校分别为:北京科技大学(1)、武汉大学(1)、郑州大学(1)、中国人民大学(1)、西安交通大学(1)统计学专业只招收一人来自浙江大学。2020年中科院自动化所推免数据分析自动化研究所简介自动化所自建所以来,已为我国人工智能学术与产业界培养了大量的优秀人才,硕果累累,他们现如今活跃在人工智能、机器人领域的高校、科研院所及企业中。截至2017年底,自动化所共有在职职工896人,其中科技人员795人,科技支撑人员54人。包括中国科学院院士2人、发展中国家科学院院士1人、研究员及正高级工程技术人员92人,副研究员及高级工程技术人员229人。共有国家973项目首席科学家4人,IEEE Fellow 8人;中国科学院“百人计划”入选者22人,“西部之光”人才入选者2人;国家杰出青年科学基金获得者14人,国家优秀青年基金获得者5人,新世纪百千万人才工程入选者9人。自动化所是1981年国务院学位委员会批准的首批博士、硕士学位授予权单位之一,现有控制理论与控制工程、模式识别与智能系统、计算机应用技术和社会计算4个专业二级学科博士、硕士研究生培养点,并设有控制科学与工程1个专业一级学科博士后流动站。各专业推免人数对比中科院自动化所一共招收5个专业,分别为社会计算、模式识别与智能系统、理论与控制工程、计算机应用技术和电子信息。其中模式识别与智能系统招收人数最多为67人,社会计算人数最少,仅招收4人。生源院校分析从本科生生源院校来看,自动化所共招收138名学生,绝大多数来自985,211院校,共134人(占97%);极少数来自双非院校,仅有4人(占3%)。生源院校及招生人数中科院自动化所本科生生源院校多为强工科学校,地区分布比较广泛。招收的学生来自211院校多位于北方,尤其北京及其附近。招收人数最多的院校有大连理工大学(9人)、哈尔滨工业大学(9人)、北京科技大学(9人)、西安交通大学(9人);所招双非院校学生极少,仅4人,分别来自天津工业大学、燕山大学、中国科学院大学,均位于北京及其周边。各专业招生人数比例2020年中科院自动化所电子信息专业招收人数多为985、211院校学生,不过其中亦包含双非院校天津工业大学(1人)、燕山大学(1人)、中国科学院大学(1人)。2020年中科院自动化所计算机应用技术专业招收学生均为985、211院校的本科生,大多为211院校学生。除在北京化工大学招收2人外,其余学校仅招收1人。2020年中科院自动所社会计算专业仅招收4人,分别来自四所院校北京邮电大学、大连理工大学、东北林业大学、中国科学技术大学(均为985、211院校)。2020年中科院自动化所控制理论与控制工程专业招收的本科生大多为来自北方985、211院校的学生。山东大学学生最多,招收4人。2020年中科院自动所模式识别与智能系统专业招收人数最多,所招学生均来自985、211院校,其中在大连理工大学(6人)和哈尔滨工业大学(6人)招收人数最多。

截稿日

中国科学院自动化研究所将携手玖富集团组建联合实验室

1月16日,“AI in All·智慧2018——中科院自动化所&玖富联合实验发布会”在北京举行,玖富集团与中科院自动化研究所国家重点实验室联合对外宣布,双方将一同合作,成立“面向金融的智能语音服务联合实验室”,充分发挥中科院自动化所在人工智能领域的技术优势,结合玖富集团在人工智能应用场景探索的实践经验,加速智能金融进程,全面提升玖富在风控、获客、客户服务等业务方面的智能化水平。联合实验室在中科院自动化研究所举行挂牌仪式,将由中科院自动化研究所模式识别国家重点实验室副主任陶建华教授领导,中科院自动化所李雅副教授、玖富集团人工智能中心总经理赵礼悦博士担任主任,全面负责实验室研发工作。据了解,中科院自动化研究所成立于1956年10月,是中国较早成立的国家级自动化研究机构,曾为中国“两弹一星”做出过历史性贡献。自动化所是1981年国务院学位委员会批准的首批博士、硕士学位授予权单位之一,该所现设科研开发部门12个,包括国家重点实验室2个,国家工程技术研究中心1个,中国科学院重点实验室1个,以及8个科研开发部门,是国内人工智能领域较具学术权威性的科研机构之一。陶建华教授主要的研究领域为语音识别与合成、模式识别、音视频信息处理、人机交互等方面,特别在智能语音系统方面十分具有权威性,是国家杰出青年基金获得者,入选国家“万人计划”科技创新领军人才。其曾先后负责和参与国家级项目(国家重点研发计划、863、国家自然科学基金重点、发改委、科技部国际合作)30余项。据赵礼悦博士介绍,实验室正式成立后,将结合玖富在人工智能、大数据、应用场景等多方面的实践经验,发挥中科院自动化所的技术优势,在语音交互、自然语言理解、情感分析、声纹识别、多模态人机对话等人工智能领域进行前沿的探索,帮助玖富万卡搭建基于语音交互的用户身份管理、客服和质检系统等等,同时也推动智能金融的发展与进步。随着中国的数字化进程逐步推进,快节奏的经济转型和大规模的消费升级导致中国数字行业竞争极为激烈。人工智能也不再停留在舆论关注层面,各类人工智能公司已经从一开始的拼技术、拼履历、拼大牛的阶段,陆续进入到拼行业、拼落地的实干阶段。事实上,玖富集团在人工智能领域的探索早已开始。作为一家致力于大数据和人工智能技术研发的金融科技公司,近年来玖富业务流程正在加速向智能化进程过渡。从用户引入、用户服务、风控管理到后续服务的实时跟进,在“移动金融大师兄”的业务线上,人工智能的参与感越来越强。当前,玖富在人工智能领域已经进行了广泛的布局,尤其是玖富万卡覆盖线上线下全场景,为人工智能的落地应用提供了广阔的空间。除了前期投资人工智能研发公司云量科技外,还联合推出人工智能助手、上线智能客服等。同时,玖富也在自动化信用评估方面进行深入布局。今年年初,玖富集团推出了一个以机器学习、知识图谱等技术为基础的信用评估体系“火眼分”,火眼分基于用户提供或者授权获取的不限于金融属性的特定数据,以及在玖富平台的行为表现数据,可以对用户的还款能力和还款意愿等进行综合信用评估,自动进行动态量化评定。火眼分越高代表信用状况越好,借款成本就越低,可使用额度则越高。2017年,玖富万卡在图像识别,智能客服,搜索推荐系统和知识图谱等领域有了很多突破性进展,落地了很多人工智能产品。专属客服是玖富万卡基于自然语言处理和对话系统推出的智能客服系统,不但具备了传统客服系统可以回答用户问题的功能,更添加了用户信息查询和闲聊等功能,使得用户只需登录客服界面就可以了解自己在万卡的各种信息。万卡商城最新的推荐系统采用Graph Embedding算法,利用商城的Feed流信息对商品进行建模,不但保证了推荐的准确性,同时为用户推荐了更加个性化,更有新鲜感的商品,真正实现了千人千面。中科院自动化所-玖富联合实验室将是中科院自动化所和国内金融科技企业共同成立的联合实验室。合作期间,中科院自动化所将开放源代码,与玖富积极开展人才交流和培养,合作期间研究成果的知识产权归双方共有。凭借中科院自动化研究所在人工智能、智能计算、智能控制、智能系统等方面的技术优势,结合玖富集团创立近12年来所累积的海量数据优势以及集团在科技创新的大力投入,“中科院自动化所-玖富联合实验室”将立足于玖富万卡等平台的智能交互服务工作之中,形成相互支持、相互进步的格局。可以预见的是,未来随着我国创新技术的突飞猛进,信息收集处理的系统化、智能化和自动化趋势,人工智能将成为服务社会大众,服务于金融创新的不可或缺的有生力量,也将协助金融行业服务效率全面提升。

而能精焉

由中科院自动化研究所孵化,「中科慧远」已批量出货手机玻璃盖板外观检测设备

文 | 小妍@边界计划编辑 | 王艺瑾近年来,消费电子元件微型化和复杂化的趋势对工业质检的精度、准确度和效率提出了更高要求,而国内逐渐攀升的人工成本也加速了“机器替人”的趋势。目前,PCB、FPD、半导体、光伏、汽车电子等行业都逐渐在用自动光学检测技术(AOI,全称Auto Optical Inspection)替代人工目检。而以往的AOI设备主要来自国外,在运输成本和本土化服务等方面尚未满足国内企业的需求。这种情况为“国产替代”创造了市场空间。36氪近日接触到的“中科慧远”是国内一家可以实现AOI全套实机生产的工业外观精密检测设备和解决方案提供商。该公司成立于2016年,由中国科学院自动化研究所孵化,并获得中科院自动化所及政府基金的千万级投资,还在2018年获得联想创投和丹华资本的Pre-A轮融资,在2019年获得中科创星的千万级A轮融资、某政府基金的过亿元投资。该公司CEO张武杰告诉36氪,计算机视觉在工业领域的应用主要体现在尺寸量测、与机械臂抓取相配合的引导定位、精密对位、外观检测这四个领域,而中科慧远选择了外观检测领域,现阶段的核心产品集中在手机盖板检测。该公司在去年9月研发完成了盖板玻璃成品检测设备、白片检测设备、丝印在线品控设备和高精度3D玻璃背盖检测设备,并从今年开始批量出货。该公司还从今年开始研发显示面板的来料检验、贴合检验、显示模组检验和玻璃边缘检验设备,并计划明年将产品线拓展至非3C领域。谈及为何一开始要做手机盖板外观检测,张武杰表示,首先,和汽车等行业相比,手机行业的体量足够大;同时,以往手机玻璃盖板都是人工检验,但人工成本逐年上升、人员培养周期又长,还存在人眼疲劳引起的误检漏检造成后续返工等问题。与之相比,中科慧远的自动化检测设备可以在解放人力的同时,为企业降本增效。具体来说,以往人工检测效率是每天1000-1200片,而中科慧远的机器检测效率可达到每天4万-4.5万片,且出货品质相对稳定,能保证实时交付。此外,张武杰表示,在外观检测领域,手机玻璃盖板的检测难度很高,因为它透明、高反光、受环境干扰大、对缺陷的容忍度低、对检测精度要求高。这意味着,攻克手机玻璃盖板检测之后,会更容易把技术复用和延伸到精密制造和高端装备等领域。而中科慧远之所以能把这事儿做成,是因为其核心团队来自中国科学院自动化研究所,在相关技术领域已经积累多年经验、并花了三年时间深入产业内部。目前,中科慧远的客户包括伯恩光学和京东方等玻璃盖板或面板领域的头部企业。张武杰预计,他们今年底的合同订单额可达五六千万,明年收入可达一亿,其客户一般可以在1到1.5年时间内收回设备的购买成本。中科慧远创始人兼董事长张正涛博士是中国科学院自动化研究所精密感知与控制研究中心副主任;首席科学家徐德博士是中国科学院自动化研究所总工程师,首席科学家顾庆毅是中国科学院百人计划专家、曾任广岛大学副教授;CEO张武杰是连续创业者,曾创立北京兰瑾科技有限公司。(封面图片来自pexels.com)

神思

出门问问&中科院自动化研究所共建语言智能与人机交互联合实验室

机器之心原创作者:高静宜3 月 29 日,「语音智能与人机交互联合实验室」在北京成立,该实验室由中国人工智能公司出门问问与中科院自动化研究所模式识别国家重点实验室自然语言处理与机器翻译研究团队联合建立,将专注于自然语言理解、多轮对话管理、问答系统、机器翻译等人机语音交互核心技术研发领域。出门问问成立于 2012 年 11月,是一家在语音识别、语义分析、垂直探索等技术领域具备自主研发能力的人工智能公司。根据此前路透社报道,于 2015 年 11 月出门问问完成 C 轮融资后的累计融资金额达 7500 万美元,投资方包括 Google 、红杉资本、真格基金、SIG 海纳亚洲、圆美光电、及歌尔声学。「我们不能止步于产生需求时才进行研发,或是仅仅满足于照搬、挪用国外的新技术、开源算法。只有在探索前沿、核心算法上进行投入,我们才能够在人工智能领域实现突破。」出门问问创始人李志飞说。李志飞在美国约翰霍普斯金大学获得博士学位后,曾加入 Google 研究院从事机器翻译的研发工作。基于这样的想法,出门问问对技术研究合作在经费投入也没有设置门槛和限制。「只要能做出比较有意思的成果,甚至对我们的技术不一定有直接的影响,都没有关系。我们是有情怀的,可能比较理想主义一点,但我们是真正希望能够做出一些创新的。」李志飞说。事实上,能够促成这次为期三年的合作基础是,双方共同看好基于自然语言处理技术的人机交互趋势,且在研究资源方面能够实现优势互补。中科院自动化所模式识别国家重点实验室专注于机器翻译,而机器翻译是 NLP 技术最集中、最核心的应用,同时团队在基本自然语言处理方面的技术有非常扎实的研究成果,在国内甚至国际上都是十分领先的团队。而出门问问在成立之初就把眼光放在人工智能自然语言处理领域,并在两年前开始发力人工智能在智能硬件领域的商业化,先后发布了 Ticwatch 智能手表、Ticmirror 车载智能后视镜等 AI 落地产品,由此带来的研究优势是具备大量的用户、数据,可以构建端到端的系统,能够完成需要大量工程师、产品经理共同构建的工程方面的成果。另一方面,在李志飞看来,企业做研究与科研机构有很大区别,大多数企业很难全力做比较长线的研究,作为创业公司要保证足够的前沿技术敏感寻求实验室共建是有效途径之一。他以深度学习的崛起作为案例说:「深度学习开山鼻祖 Geoffrey Hinton 曾在学界做了很多年相关研究,在 2007 年,当时我还在微软研究院语音识别组实习,他们就开始与微软进行合作,探讨把深度学习算法部署在微软系统里。直到 2012 年的时候,他们在语音识别领域做出了巨大的突破,之后 Google 才开始跟进。在美国,对于技术最早的探索大多还是在科研界。这也是国外很典型的一种模式。」这次合作目标计划从搭建面向特定应用任务的自然语音处理系统开始,逐渐延展到场景构建和算法设计的创新,再到第三年设计具备演化拓展能力的算法和系统,推动合作企业的业务迭代。比如,基于自然语言的人机对话系统中,目前的瓶颈在于自然语言的理解以及上下文的对话机制,在听歌的场景下,用户说:「我想听周杰伦的歌」、「他有没有摇滚歌?」,在车载场景下,用户说「我要导航到国贸」、「找目的地附近的停车场」,这两处场景就存在一个比较通用的上下文指代的问题。「我们一直以来的目标就是把语音交互做到三个比较大的应用场景里,即可穿戴、智能家居、智能车载。」李志飞介绍说,「未来发展的整个趋势就是无手无屏的语音交互,换句话说,就是在用手和用眼效率比较低的场景。在技术层面上来说,未来把物理世界的知识深度结合到自然语音交互也是一个趋势。和人类沟通一样,人机交互系统只有在拥有了知识的前提下,才能进行快速、深度、有效地沟通,这个过程涉及到知识表示、逻辑推理等问题。我们最核心的终极目标,就是打造一个无处不在的懂你的虚拟个人助理。」研究目标之外,李志飞还希望可以在这次合作中摸索出一套产学有效合作对接的机制。过去有很多产学合作只实现了单方面的需求,比如企业支持学界进行研究,研究成果却并没有深度创新点进而作用于企业迭代,或者学界只为企业提供人力,实验室无法得到本质上的收获。只有构建一套既能够帮助科研机构解决实际有用、有意思的问题,同时可以帮助企业得到算法技术本身的提升的机制,才能使合作双方配合默契、有效,进而实现推动技术创新和产业发展的双重目标。「这不是一个短平快的过程,要实现预期成果是一个长期的过程,需要保持耐心。」李志飞说,「事实上,很多学界研究人员对实际产品系统并不够了解,我们希望在这次合作中,他们可以花一些时间来了解我们的系统。这样他们就无需自己从头搭建一个系统,而是可以直接在我们基于工程人力、数据所快速完成的原型系统中,进行算法验证。我想,这也是研究里面比较有意思的地方。在独一无二的系统里解决独一无二的问题远比拿出一个很多年前的问题来琢磨有趣,也比把某些算法的准确率提高百分之五更能得到认同。我们的系统是基于自然语言的人机对话,是在移动场景下用户直接去使用的,是一个非常新的系统。在这里找新的方向,就好比开辟了一个新的城池,再在城池中去种菜,而非在老城里发明更好的种子。这样的研究不仅更容易出成果,也更能得到行业认可。」

臣之事君

中科院自动化研究所:外籍员工发不当言论已解聘

#互联网大事件#11月5日,中国科学院自动化所研究所外籍雇员被爆出在社交媒体上,大肆发表歧视性、种族主义言论。此事发酵后,激起了不少中国网友的热议。随后,该员工在网上做出所谓的“道歉声明”,但被不少网友指责“避重就轻”、“没有诚意”。11月7日中科院科学院自动化所研究所表示:知悉相关情况后,研究所对于该外籍人员的错误态度表示极度震惊及愤慨,并表示严厉谴责。研究所认为,遵守我国法律法规,尊重中国文化是我所聘用员工的首要条件。目前研究所已立即对该人员停职检查,并正在研究下一步处理意见,后续将及时对外发布。据此前通报,Mark A.Kolars为该所科学艺术团队项目聘用人员,主要从事视觉特效设计相关工作。网友们对这件事有什么想吐槽的吗?

漫步者

背靠中科院自动化所,「中科神探」用5年时间深耕智能安防

我国监控摄像机的保有量已超过2亿,其中仅有1%左右的监控视频数据能够被结构化利用,即大量视频数据的价值有待被市场挖掘。中科神探成立于去年11月,核心研发团队来自中科院旗下的类脑研究中心。创始人袁飞告诉36氪,类脑研究中心的前身是中科院自动化所“一三五”重大研发项目“超级计算大脑系统”,自己是该项目视觉研究团队的负责人。整个项目组从70年代就开始研究人工智能。1987年,模式识别实验室正式成立后,基于视频等高级语义的分析的研究便一直在进行。2008年袁飞在其导师马颂德研究员,前中科院自动化所所长、前科技部副部长的带领下展开多模态生物特征识别方向的研究工作。虽然公司在去年年底才成立,但是核心团队于2012年便开始在安防、反恐等领域与政府部门合作并落地了一系列应用成果。从2013年到2016年公司成立前的这3年时间,中科神探承接了多个地方与国家项目,包括2014年承担首届乌镇互联网大会的人脸识别项目以及去自主研发的”CASD”人脸识别产品正式落地天安门及周边地区。袁飞提到,现有的智能安防方案,大部分仅能实现卡口等特定条件下的人脸及机动车的检索。而在中科神探与公安联合开发系统的过程中,发现客户对自然场景下的行人与非机动车的搜索需求是最大的。事实上,在复杂环境下,人脸的识别仅占一小部分,视频流里如人的步态、衣服纹理等大量其他信息更具价值。基于过去多年的实战积累,中科神探的视频解析与搜索平台能在对视频结构化处理后,对特定目标实现精准检测、分类、跟踪以及搜索。为了满足不同客户对特定场景的需求,团队还研发了智能单兵产品、人证比对仪、人脸闸机和移动端APP,今年中科神探在安防领域的样板工程预计在明年能为公司带来3000万以上的收入。袁飞告诉36氪,拥有中科院自动化所做背书的中科试探在客户推进中确实有一定的优势,但是公司最牢固的护城河依然是算法的创新。他表示,中科神探的算法模型在准确度、速度以及能耗上都极具竞争力。以准确度为例,除了已有的深度学习算法外,团队还建立了视觉知识库,该知识库通过提取视频中的特征模式,让机器基于特定规律做推理与预测。随着特定规律的导入,知识库的数据量将越来越大。举例说明,向知识库输入有关于“踩点”的规则后,如果在某个受管控的区域内,任何行为模式满足“踩点”的规律的人群,系统会将其标记并作出预警。而随着标记的人群越来越多,这类人群拥有的其他共同行为模式也将被机器所学习。袁飞表示,视觉知识库的建立,除了必须具备对公安业务的深入了解外,海量的优质数据同样不可缺少。这一点中科神探有着极大的优势。从2012年开始,团队在自动化所做项目服务时就已经接入了数亿级的真实数据。基于过去10余年的实战积累,中科神探的多模态生物特征技术能够综合利用人脸识别、姿态识别、步态识别等技术,实现复杂自然场景下行人、非机动车目标的精准识别、搜索与跟踪。中科神探的CASD视频解析与搜索平台可实现10000路以上实时视频流的结构化分析与搜索应用,支持上百个用户的并发访问,完全满足城市级的安防应用。中科神探全职员工20人,袁飞2012年博士毕业于中科院自动化所,毕业后留所工作担任课题组组长,拥有12年的人工智能研发经历与5年的产品设计经历,其他团队核心成员也都出自中科院自动化所。明年,除了在安防领域的布局外,中科神探将进入新的细分市场,如智慧城市、智慧监所、军民融合以及智慧物流等领域,预计将带来千万级人民币的收入。

黑娥

中科院自动化所赫然:大规模人脸图像编辑理论、方法及应用

雷锋网AI 科技评论按:2018 年 4 月 14 日-15 日,中国图象图形学学会围绕「生物特征识别」这一主题,在中科院自动化所举办第四期「CSIG 图像图形学科前沿讲习班」。生物特征识别(BIOMETRICS)技术,是指通过计算机利用人体所固有的生理特征(指纹、虹膜、面相、DNA等)或行为特征(步态、击键习惯等)来进行个人身份鉴定的技术。本期讲习班邀请旷视科技首席科学家孙剑,中科院自动化所研究员孙哲南、王亮、赫然,中科院计算所研究员山世光、清华大学副教授冯建江、徐明星,中山大学教授郑伟诗等八位学者分别就人脸、虹膜、指纹、步态、音纹等人体特征的研究现状做了详细报告。雷锋网 AI 科技评论作为合作媒体针对会议进行报道。会议整体内容请参考雷锋网报道:CSIG 图像图形学科前沿讲习班,旷视和中科院带来生物特征识别精彩报告(一)CSIG 图像图形学科前沿讲习班,山世光等四位学者带来生物特征识别精彩报告(二) 本篇文章为讲习班报告第三篇,由中科院自动化所研究员赫然讲解,报告题目为:大规模人脸图像编辑理论、方法及应用。赫然:2009年毕业于中科院自动化所,获博士学位。中国科学院自动化研究所模式识别国家重点实验室研究员,中国科学院脑科学与模式技术卓越创新中心年轻骨干。2017年至今,担任中国科学院大学人工智能技术学院模式识别教研室副主任。从事模式识别应用基础理论研究,并应用到生物特征识别和智能视频监控,在智慧城市监管需求的平台上取得成功应用,取得一定经济效益。近期主要聚焦在生成式深度学习及大规模图像编辑中遇到的瓶颈问题,展开图像模式分析基础理论研究。出版信息理论学习专著1部,在IEEE TPAMI、TIP、TIFS、TNNLS、TKDE等权威国际期刊以及NIPS、ICCV、CVPR、IJCAI、AAAI、SIGIR、ACM MM等权威会议发表论文120篇,研究工作获得国家自然科学基金优秀青年科学基金资助。 赫然:大家下午好,我叫赫然。今天的主题是「大规模人脸图像编辑」。这里有两个要点,一是大规模,二是对人脸图像进行编辑。所谓人脸图像编辑,即对输入的人脸图像进行一系列操作处理,在内容和表观上对图像进行重组和编辑,进而创造出完全不同的人脸图像。我们希望机器能够对现有的图像进行自动处理,并且得到一些新的图像,而这些新图像则需要同时符合人的认知和特定的需求。该问题是当前机器学习、计算机视觉重要的研究内容之一,并且在交互娱乐、卫生医疗、公共安全等领域有着广泛的应用场景。今天介绍的内容分为两个部分:第一部分介绍图像编辑涉及的理论基础,第二部分介绍它的方法和应用。一、基础理论1、全光人脸分析在计算机处理图像的过程中,涉及一个基本的概念就是全光函数。它是决定空间中光线呈现形式的因素组成的一个函数,包括光谱信息、时间信息、空间信息、深度信息、亮度信息和方向信息等。如果波长固定,那就是灰度图像,如果有多个波长,那就是彩色图像;如果是时间有变化那么就是视频;空间信息自然不用说了;如果考虑深度信息就是深度成像,在成像时会测量图像的深度信息;如果考虑亮度信息就是高动态图像;如果考虑光线方向,就是光场相机。所有这些组成了全光函数,在人脸识别中我们需要对这个函数有所了解,从而得到比较符合真实世界的图像。目前,我们智能感知与计算研究中心依托国家自然科学基金委重大仪器专项[1]和华为公司合作项目[4][5],已设计和搭建全光人脸采集系统和深度数码变焦图像分析设备。这部分工作主要由中心的张堃博和胡坦浩完成。2、视觉拓扑优先图像编辑的基本研究目标是希望生成/合成的图像是符合人的视觉认知的,通俗而言就是让观察者判断不出这个图像是真实的还是计算机生成的。基于这些考虑,中科院的陈霖院士提出了视觉拓扑优先的概念,他认为人在识别人脸时对拓扑信息的变化的感知优先于其它信息。实际上,对于拓扑结构变化的敏感性是生物感知系统中的基本特性,例如蜜蜂对空心圆和实心圆的拓扑结构变化非常敏感。相关成果发表在《科学》杂志上。视觉拓扑优先机制的数学建模问题一直是一个困难问题,我们中心在国家自然基金委重点基金项目[3]的支持下,深入研究了视觉拓扑优先的多种数学表达形式,例如全局和局部结构、小波分解、heatmap和人脸解析图等。根据拓扑变换的性质,相关的人脸图像编辑任务可以分为拓扑不变任务和拓扑变换任务。3、生成对抗结构这里涉及到最常用的模型是生成模型,即学习联合概率密度分布,它可以从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度。生成模型的主要功能有两个:一是进行密度估计,二是生成样本。生成/合成人脸时,所要的就是生成/合成的人脸和真实人脸相似。生成模型中大家比较熟悉的就是GAN,即生成对抗网络。大家都比较熟悉,我在这里就不再详细介绍了。此外,我们也结合变分自编码机和胶囊模型来研究新的生成式模型。 4、身份保持结构每个人都有自己的身份信息。人脸生成/合成任务自然希望能够保持这个身份信息。在身份保持方面,我们的研究借鉴视觉认知中最基本的概念,即,定序测量(Ordinal Measures,OM)。这是一个基本的度量方式。人类所采用的度量方式主要包含以下四种。生活中,定序测量的思想随处可见。比如我们只需要知道篮球比足球重,至于重多少克则大多数情况下是没有必要知道的。根据 OM 概念,中科院的谭铁牛院士提出一个既简单又好用的方法,即,通过简单的比较大小,实现计算机视觉的复杂特征提取。最初这个研究工作应用到虹膜识别,判断虹膜是否属于同一个人。基本思路就是通过比较大小得到一个特征编码,通过这个特征编码便可以进行分类。目前这种思想已经被广泛应用于计算机视觉中。我们把这种定序测量的方式引入到卷积神经网络的激活函数中。常用的激活函数有两种:ReLU 和Maxout。通常认为,由于 Maxout 需要使用两条直线才能近似 ReLU,因此,Maxout 网络通常是 ReLU 网络大小的两倍以上。而我们这个方法采用的定序测量非常简单,就是比数值大小,谁的值小谁就被抑制掉,因此可以得到一个比较小的卷积神经网络。不同于以前的方法,我们借鉴神经学中一个基本的概念:侧向抑制。这是神经元的激活机制,即通过对比机制来减少临近神经元的激活,同时神经元能够抑制一些神经信号传播,这种方式能够增加神经信号的清晰度。借用这种概念,我们在网络中添加了侧向抑制的机制,以眉毛区域为例,其相邻水平位置激活,相邻竖直位置就会被抑制。引入上述概念后,依托于国家自然科学基金委重点项目[2],我们中心的吴翔等设计了一个轻量级的神经网络 Light CNN [6],该网络具有提炼度高,空间占用小的特点。它在人脸识别以及车辆识别问题上都已经取得了较好的效果。这个网络所具有的结构小而分辨率高的特点能够辅助我们在人脸图像编辑过程中进行身份判别。该工作发表在 IEEE TIFS, 2018 上。目前,该研究工作受到国内外研究者的较大关注,相关代码已经在 github 上公布,依据网络层数不同,分为 LightCNN9 和 LightCNN29 两个版本。以上四个部分就是我们在研究人脸图像的过程中遇到的基础问题。首先,需要对光的结构比较了解,只有了解了光的信息才有比较好的成像效果;其次,因为图像是给人看的,因此生成的图像要符合人的认知;另外,介绍了一种基本的网络结构,即生成对抗网络,来指导人脸图像的编辑;最后是身份保持损失,目的是希望合成后的人脸图像保持原有的身份信息。这四个部分构成了图像编辑的主要基础部分,当然还有一些其它部分。二、方法应用接下来介绍一下我们中心近期做的一些相关研究内容,由于时间关系,主要包括七个主要部分。每个部分在计算机视觉中都是独立的分支,在金融民生或公共安全领域也都有很重要的应用。1、超分辨率第一个是图像超分辨率,即在给定低分辨率(LR)输入的情况下估计出高分辨率(HR)图像的问题。例如摄像头采集的图像一般分辨率比较低,如何对它进行超分,得到一张清晰的图像并保持其身份信息,就是我们所研究的内容。超分算法一般可以分为两大类,一类属于通用的超分算法,例如基于插值的方法、基于图像统计的方法或者基于字典学习等的方法,这类算法适用于所有的图像超分问题。另一类属于特定领域的超分算法,例如基于先验统计的方法,现在也有基于生成模型的方法以及感知损失函数的方法。我们中心的黄怀波等提出在超分的过程中使用小波分解技术[13]。假设超分图像的每个位置在超分时都依赖于原始的图像对应的地方,这样我们的超分算法不会破坏全局信息。通常,超分问题被建模为一个概率问题。在这种模型中,给定输入的图像,直接预测完整的图像,这个预测过程不能保证是不变的。不同于此,我们在训练时输入一张高清的图像,然后进行小波分解,对分解后的图像分别预测,之后再合成完整高清图像,这样得到的结果就可以尽量避免出现偏差。2、视角旋转另外一个比较重要、也是现在各大公司比较关注的人脸视角旋转应用,即将归一化的人脸旋转到任意姿态。例如从一张正脸图像生成侧脸图像;或反之,从采集到的一张侧脸恢复其正脸图像,公安领域常有此需求。 视角旋转有 x、y、z 三个方向,我们目前只考虑左右偏转。如果从单张图像进行旋转的话,这需要「无中生有」,因为有些信息是没有的,所以旋转时结果存在偏差。人脸旋转有两部分研究内容,一部分是 2D 模型,一部分是 3D 模型。既然图像合成比较难,又不能直接预测,因此,我们引入几个局部通路专门负责人脸局部信息的合成,该工作发表在 ICCV 2017 [15]。根据人脸五官,我们引入四个局部通路,再加上一个全局的通路,同时保持全局和局部的拓扑保持不变。局部四个部分进行分别合成,最后再与全局进行融合,得到一个正脸。我们中心在该问题上的后续工作成果[9]发表在 CVPR2018 上。3、上妆去妆另外一个做的比较多的就是上妆去妆。「上妆」自然是希望在拍摄后把人脸进行妆颜美化,去妆则是去除掉图像中的妆容从而变为素颜。作为一个单独的研究问题,上妆去妆从 2009 年开始陆续得到研究者的关注。2018 年,我们中心的李祎等提出利用生成网络来完成去妆[11],并在 AAAI2018 上发表。我们主要希望针对手机用户,使得去妆之后能够得到比较好的视觉结果。跟前面的方法类似,这里仍需要保持拓扑结构,同时我们提出两层对抗网络,采用两个判别器,一个是进行身份信息判别,另外一个对是否为真实图像进行判别。最新的自动上妆工作是2018年美国 Adobe 公司提出的模型。该方法以 cycleGAN 模型为基础,对眼部、唇部和其他面部皮肤分别上妆,之后再把分块上妆结果反贴回原脸。由于该方法在合成全脸化妆效果时使用的是 image warping 方法,因此该方法实际上采用的是一种半生成模型。4、表情编辑表情编辑涉及到两个问题,一个是表情合成,一个是表情去除。2018 年,我们中心的宋凌霄等提出一个新的表情合成/去除的算法[14],包括一下几个基本部分:一、拓扑结构变化,因为眨眼的时候拓扑结构发生变化,因此希望用这个信息指导表情的变化;二、身份保持,我们不希望添加了表情后变成了另外一个人。我们的工作有两个特点,一个特点是能够得到一个真实图像,另外一个是能够识别身份信息。下面是我们方法得到的合成效果。5、年龄变换从娱乐领域而言,预测脸部年龄的变化是一个重要的应用,其基本任务就是如何使人脸图像老化/年轻化。年龄变换在电影中应用比较广泛,例如年轻的演员在电影中变老,或年老的演员需要扮演年轻人等。在公安领域也有应用,比如寻找丢失多年的儿童;当然在隐私防范或生活娱乐中也有很多应用。年龄合成作为计算机视觉的一个分支问题,其研究始于 1994 年。我们中心的李佩佩等在 2018 年提出了一种基于全局和局部的生成方法[12]。做年龄合成时,我们知道一般额头、眼睛以及嘴角变化比较大。因此除了做一个全局通道外,我们还在模型汇总另外添加了三个局部通道,随后将这三个局部通道合起来后再与全局通道融合在一起。同时,我们也使用多个判别器来保证合成结果的视觉效果。这是我们得到的实验结果:6、像素补充接下来的工作是人脸补充,即把遮挡了的人脸补全,这在图像编辑中也有很重要作用。现有方法可以归纳为三类:早期是使用基于补丁的方法,即通过观察缺失内容的上下文信息,从相同图像或外部图像数据库中搜索相似的补丁;其次是基于扩散方程的方法,即利用扩散方程迭代地沿着边界将低级特征从上下文区域传播到缺失区域;第三种则是基于稀疏表示的方法,即如果缺了某块儿区域,便通过编码或者解码,把原始的图像补充上去[8]。2017 年,国外学者进一步研究了基于生成模型的人脸补充,其目的是希望生成的拓扑结构和真实的拓扑结构保持一致。在图像感知的时候,拓扑结构先于其它结构,所以我们考虑把拓扑结构作为先验条件。基于这种考虑,我们中心的宋林森等提出一种新的方法(Geometry-Aware Face Completion and Editing),先预测缺失的地方,随后再把这个拓扑结构跟原图一起输入,来生成真实的图像。7、跨光谱合成所谓跨光谱合成,指根据某种光谱/模态下的人脸图像,直接合成其他光谱/模态人脸 图像的技术。这个技术广泛应用于异质人脸识别,例如下图的可见光图像和近红外图像间的人脸识别。这个问题的挑战和光线有关,一方面不同的图像之间光线差别比较大,而另一方面可用于跨光谱训练的图像数据集也比较小。不过这个领域的研究也比较多,包括基于字典学习的方法、基于补丁映射的方法和基于生成模型的方法等。我们的工作[10]是基于生成模型的方法,发表在 AAAI 2018 上,这应该是第一篇使用GAN模型的跨光谱合成方法。我们构建了生成对抗异质人脸识别模型(AD-HFR),并使用了全局和局部的结构,除了对整个脸部进行生成外,还对眼睛部分进行了专门处理,并且包含了身份保持函数。三、总结本次报告主要介绍了人脸图像编辑涉及的基础理论和应用方法。由于时间关系,基础理论部分还有部分内容没有深入介绍;而在应用部分,今天主要讲了超分辨率等,但还有人脸生成等许多应用没有涉及。事实上人脸图像编辑,是计算机视觉中一个长期的研究目标,当前仍有很多问题没有解决。例如,当前研究的人脸图像分辨率大多是 128×128,随着手机的发展,其分辨率将会越来越高,那么如何编辑更高分辨率的图像?同时,很多场景对精确度的需求也变得越来越高,比如在 3D 重建中,医疗领域希望人脸的深度信息精度能够从 0.1 厘米提升到 0.05 毫米,这样便可以精准估计面部运动和身份信息。另外,一些特殊应用场景会要求生成十几万人乃至几亿人的人脸数据。另一方面,人脸图像编辑也是机器学习的重要研究内容,它的理论学习方法、硬件和软件都需要更大的突破,才能得到符合人类视觉感知的结果。 感谢中心成员张堃博、宋凌霄、吴翔、李祎、胡坦浩、黄怀波、李志航、李佩佩、胡一博和宋林森等人对于本次报告给予的协助和支持。谢谢大家。参考文献[1] 复杂场景中多模态生物特征获取设备. 国家自然科学基金委重大仪器专项.[2] 基于定序测量的物体识别理论和方法. 国家自然科学基金委重点项目.[3] 基于非欧空间的视觉计算理论与方法. 国家自然科学基金委重点项目.[4] 基于深度学习的人脸超分辨率技术合作项目, 华为公司.[5] 多视角人脸图像合成技术合作项目, 华为公司.[6] Xiang Wu, Ran He, Zhenan Sun, Tieniu Tan. A Light CNN for Deep Face Representation with Noisy Labels. IEEE Trans. Information Forensics and Security (2018).[7] Shu Zhang, Ran He, Zhenan Sun, Tieniu Tan. DeMeshNet: Blind Face Inpainting for Deep MeshFace Verification. IEEE Trans. Information Forensics and Security 13(3): 637-647 (2018).[8] Ran He, Wei-Shi Zheng, Tieniu Tan, Zhenan Sun. Half-Quadratic-Based Iterative Minimization for Robust Sparse Representation. IEEE Trans. Pattern Anal. Mach. Intell. 36(2): 261-275 (2014).[9] Yibo Hu, Xiang Wu, Bing Yu, Ran He and Zhenan Sun. Pose-Guided Photorealistic Face Rotation. CVPR 2018.[10] Lingxiao Song, Man Zhang, Xiang Wu, Ran He. Adversarial Discriminative Heterogeneous Face Recognition, AAAI 2018.[11] Yi Li, Lingxiao Song, Xiang Wu, Ran He, Tieniu Tan. Anti-Makeup: Learning A Bi-Level Adversarial Network for Makeup-Invariant Face Verification, AAAI 2018.[12] Peipei Li, Yibo Hu, Qi Li, Ran He, Zhenan Sun. Global and Local Consistent Age Generative Adversarial Networks. ICPR 2018.[13] Huaibo Huang, Ran He, Zhenan Sun, Tieniu Tan. Wavelet-SRNet: A Wavelet-Based CNN for Multi-scale Face Super Resolution. ICCV 2017: 1698-1706.[14] Lingxiao Song, Zhihe Lu, Ran He, Zhenan Sun, Tieniu Tan. Geometry Guided Adversarial Facial Expression Synthesis. CoRR abs/1712.03474 (2018).[15] Rui Huang, Shu Zhang, Tianyu Li, Ran He. Beyond face rotation: Global and local perception gan for photorealistic and identity preserving frontal view synthesis. ICCV 2017.