欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
用强化学习寻找关键节点——复杂网络研究新范式金印仇

用强化学习寻找关键节点——复杂网络研究新范式

牵一发而动全身,网络中有些节点一旦被去除,就会对网络的连通性产生断崖式的影响。该如何找到这样的节点。近日,发表在 Nature Machine Intelligence 上的一篇论文“通过深度强化学习识别复杂网络中的关键节点”中,提出的 FINDER 算法,开辟了解决该类问题的全新范式。1. 找到关键节点,四两拨千斤地改变网络结构在传染病防控中,那些一旦被去除之后,就会让整个网络传播疾病的能力显著降低的节点被称为“超级传播者”;在营销方案设计中,需要找到关键用户,通过这些用户,让产品信息快速传遍全网;而在药物设计中,找到蛋白质相互作用网络的中心节点,同样能指导药物靶点的选择。 上述场景,都可以归类为这样一类问题:即在网络中寻找一组节点,当按照顺序从网络中去除这些节点之后,在所有可能情况下,网络的连通性会发生最大程度的改变。图1:911恐怖分子网络在不同去除节点方案情况下,最大连通部节点数的情况上图中 a 是参与 911 事件的恐怖分子的社交网络,如果从图中 62 个节点中,选择 16 个去除,去除后,要求网络中相互连接最多的恐怖分子数最低(图中紫色部分),图 b 代表去除的是度数最大的 16 个节点(浅蓝色),图 c 代表通过通过总影响力算法得出的去除的节点,而图 d 代表本文提出的算法去除的节点。可以看出,相比传统的方法,通过新的算法,仅仅去除 14 个节点,就能够让恐怖分子的网络分崩离析互相能联系的恐怖分子是 9 个,而之前为 14 个)。该案例说明,找到网络中关键节点,在现实中有着诸多实际的用途。2. 强化学习与图嵌入强化学习是机器学习三种范式中的一种,其与其他范式的区别之处,在于实时的奖励。其学习的过程是:智能体根据初始策略,决定采取何种行动,外界环境会根据智能体的行动,为其提供奖励,智能体会基于奖励,调整策略,以此迭代提升智能体的决策力。在寻找关键节点的问题上,策略是建立算法根据网络结构,在有限的计算中,找出应该去掉哪些节点。行动是依次去掉这些节点。而奖励则是去掉后,按照定义的网络连通性评价方式,网络连通性会有多大的改变。 复杂网络通常用图这种数据结构来记录,而将图用更低维度的数据进行表征,则被称为图嵌入。通过图嵌入,替代原图的数据,能保留原图中拓扑结构,节点之间的相互关系,以及关于图、子图的其他相关信息。通过图嵌入,能够在之后对图的分析任务中,获得更好的结果。3. FINDER有何不同之处寻找关键节点的问题,如果通过穷举法,随着网络中节点数的增加,会导致计算所需的时间呈指数级增加。这在计算机科学中被称为 NP-hard 问题,是优化算法领域的终极挑战。之前的对该问题的解法,是通过网络中节点的局部特征,例如根据节点分布,属于的模体数,来决定去除哪些节点的。但网络节点的异质性,以及网络的涌现特征,会使得节点对连通性的贡献度,难以通过一个简单指标概括。图2:FINDER 算法示意图FINDER 先在模拟的,节点数较少的 BA 无标度网络中,能够通过穷举法找到最优解的网络中,进行离线学习。如上图前半部分所示。之后在真实场景下的网络中,使用之前训练好的智能体,让其不断根据当前网络,决定要去掉哪个节点。最终得到去除节点的顺序,并据此评价算法的表现,如上图下半部分所示。具体分为两步:首先是编码。使用图嵌入算法 GraphSAGE,通过迭代,提取网络中每个节点的特征。例如最初每个节点的特征是其度数,之后,每个节点的特征向量会向周围的节点传递该节点的特征。 之后的解码步骤:利用强化学习中的 Q-learning,基于当前去除节点后连通度的变化,相比最优连通度的变化差距多少,调整产生策略(下一步去除哪个节点)的神经网络的参数。该神经网络为两层的全连接结构,Relu 为激活函数。在端对端的训练过程中,待优化的损失函数为网络重构误差与 n 步之后的 Q-learning 的奖励函数之和。4. FINDER效果如何随着网络中节点数的增加,实用的算法其运行时间,不应该有明显的增加。对于 FINDER,其时间复杂度为 O(E+V+V * logV),其中 E 代表网络中边的个数,V 代表节点个数。这意味着该算法可以在大数据集上高效执行。 为了说明算法的灵活性,在训练时,采取了两种连通度的评价方法(连接边/最大连通部大小),并分别在节点有权重和无权重的情况下,进行训练和评测。结果表明 FINDER 在上述四种组合下,都表现优异。 评价 FINDER 的效果,分为两步,首先是在 BA,ER 和 WS 模型生成的随机网络上进行评价。由于 FINDER 训练时,使用的是由 BA 模型生成数据,因此其在 BA 模型生成的测试集中表现最佳。如果将训练数据的生产模型替换为 ER 或者 WS 模型,则其在真实网络中的效果会下降。这一点反映了巴拉巴西的无标度网络模型,其模型组成虽然简单,但其包含了真实网络中具有的节点异质性等特征。若非如此,在模拟网络中训练出的智能体,也难以在真实网络中,同样表现出色。 相关阅读:无标度网络模型开山之作:随机网络中标度的涌现真实世界的网络中,评价 FINDER 时,文中使用了 9 种不同来源的网络。其中包含 4 种社交网络,电子邮件通信网、P2P 文件共享网络、社交新闻评价网络、人体内蛋白质互作网络及不同罪犯和所犯罪行的二分网络。在所有 9 种网络中,FINDER 的性能都显著优于之前的方法。图3:FINDER效果对比举例上图的网络,是随机生成的网络,图中横轴是去除的节点比例,纵轴是网络连通性相比之前的比例。从左到右,依次代表节点无权重,节点权重为其度数,节点随机权重的场景。图中红色代表的 FINDER 算法,效能显著优于其他方法。5. FINDER代表了解决一类问题的通用范式该方法为如何解决网络上的优化问题,尤其是那些与具体知识无关,但是由于节点异质性而变得难以解决的问题,提供了一种全新的范式。即将问题转换为,如何通过强化学习,在已知答案的模拟网络上训练智能体找到最优策略。 之前的方法,基于的是一般性的统计规律,例如度数大的节点,连接的节点更多。因此去掉后可能会影响网络的连通性,这种基于相关性推演出的启发式规则,对于特定的场景下,不一定适用。例如小世界网络中,连通两个部分的关键节点,其本身的连接数不多,其重要性来自与其在网络中所处的位置。 而强化学习加图嵌入,则能够让算法基于训练中学到的复杂规则,针对特定场景,动态地制定解决方案。基于这种模式,可以找到解决很多其他问题算法,例如在网络中,识别出该保存哪些节点,能够使网络的连通性最大程度的得到保存。图4:通过强化学习解决最小渗滤阀值问题示意图由于强化学习能够处理延迟反馈带来的问题,即第一步的行动,在第四步才得到反馈,因此对需要多步操纵网络的任务,该方法也是使用的。上图描述的是用该类方法,解决网络中最小渗滤阀值这一问题。由于该问题中,每一步的决策依赖于之前的决策,因此相比寻找关键节点这个问题,在离线训练过程中,其不同点在于,会让智能体先行动 N 轮,之后再给出反馈。基于强化学习,找出网络中为达成某一目标的最优行动,进一步的研究,需要关注的是算法的可解释性。即为何算法会给出这样的策略,如何对其解释。可解释性的增强,可以让这类算法应用到更真实的场景当中。例如警察决定起诉黑帮中的关键成员,通过网络分析,得出了应该起诉哪些人。但还需要有额外的算法,说明如果不起诉这些人,为什么就不能打击该黑帮。否则,公众会怀疑算法是否公平,是否会造成对女性或少数族裔的歧视。苇草智酷简介——苇草智酷(全称:北京苇草智酷科技文化有限公司)是由长期从事互联网前沿思想、人文、科技和投资领域的专家所组成一个的思想者社群组织,其前身是已运营 5 年的互联网思想者社区—网络智酷。苇草智酷秉承“让天下思想者连接起来”、“让思想流动起来”、“让思想直立行走”的主旨和愿景,在泛互联网思想领域中,立足全球视野,感知时代脉搏,聚焦思想前沿。

丹心令

“复杂网络”中的学者吴晓群:以智慧探索“美丽”

央视网消息:随着互联网的飞速发展,复杂网络研究的重要性日益凸显。致力于发掘复杂网络中的美丽新世界,这是武汉大学数学与统计学院应用数学系教授吴晓群和她的团队正在做的事情。  吴晓群 如果人类能通过观察网络的行为动力学,解释个体之间的关系,是否能更好的认识世界?吴晓群给出的答案是肯定的:它将推动全人类的进步,改变我们的世界和生活。 什么是复杂网络?“绝大多数人认识的网络,可能只是日常上网用的万维网,但网络的概念很大,我们实际就生活在一个极其复杂的网络中。”吴晓群解释说,每一个人可以看作是网络中的一个节点,而人与人之间的关系,以及人与事物的关系都可以用一条线来表示,这样就形成了一个庞杂的网络。如今,很多数学家试图用数学的方式描述这个网络,研究它的几何性质、形成机制、演化过程、统计规律,以便更好地服务于现实需求,而这也恰恰是吴晓群所要攻克的难题。 复杂网络的研究可以让世界变得“简单”,“当你沉浸在‘双11’狂欢中,淘宝用大数据为你推荐产品的背后,其实就有复杂网络理论的应用。”吴晓群解释说。利用复杂网络的理论,把杂乱无章的信息建立起关联,人们就可以对模糊世界进行精准量化和预测,发现什么是重要节点,什么是边缘节点。基于复杂网络分析人们在不同时间、不同地点的行为,未来能够更容易处理复杂问题,例如疏导城市拥堵的交通、控制流行病传播等等。 伟大的数学家欧拉在1736年的论著中记载了新的数学分支——图论,如今,图论已经成为了研究复杂网络的重要工具。这些由问题驱动的数学研究正是应用数学重要的组成部分。 事实上,生活中处处有数学,将数学与现实生活联系起来解决实际问题,正是吴晓群学习数学、从事应用数学研究的直接原因。“应用数学其实是一个交叉学科,用它解决其他学科中的数学问题,才能真正发挥数学的作用。”她说。 2018年1月12日,由全国妇联、中国科学技术协会等共同举办的第十四届“中国青年女科学家奖”颁奖典礼上,吴晓群获得“中国青年女科学家”荣誉称号。吴晓群至今已经在武汉大学学习、工作了21年。近十年来,吴晓群几乎每年都有几个月在国外访学研究,再加上在国内大学授课教学、参加各种学术会议,一度让她感到很难集中精力进行自己想做的研究。然而作为一名女性科研工作者,她无疑是幸运的,她说,“在很多时候,我都能得到单位和家人的全力支持,这也是我与团队能将复杂网络研究不断创新,逐步走向世界前沿的重要原因之一。”目前,吴晓群和她的团队正在如火如荼地开展多层复杂网络这一前沿课题的研究。 除了自己的科研梦想,作为博士生导师,吴晓群对学生的培养也有自己的理解。很多人认为女生学不好数学,但吴晓群却称,“女生学不好数学”只是自己给自己找的偷懒借口。“科研之路是循序渐进的,年轻科研人要受得了清贫,耐得住寂寞,潜下心来做自己看中的方向,终将会做出成果,一切都会变得更好。”她说。(来源:全国妇联宣传部)

伯利恒

提高复杂网络分析效率!中国科学家研发强化学习新框架

智东西(公众号:dxcom)编 | 董温淑智东西6月29日消息,近日,中国国防科技大学、美国加州大学洛杉矶分校和哈佛医学院的研究人员研发了一个深度强化学习框架FINDER。相比于现有的解决方案,FINDER能够更快速、更高效地找到复杂网络中一组最关键的节点,进而使复杂网络以较高的效率运行。这项研究发表在国际期刊《自然》旗下的《自然–机器智能》上,论文标题为《用深度强化学习找到复杂网络的关键参与者(Finding key players in complex networks through deep reinforcement learning)》。论文链接:https://www.nature.com/articles/s42256-020-0177-2一、FINDER:适用场景更广泛,运行速度快出几个数量级在物理科学、信息科学、生物科学等领域的研究中,研究人员可以通过建立网络拓扑结构来模拟实际情况、进而作出预测。在这类复杂网络的运行过程中,节点间的配合直接决定了复杂网络运行的效率。当被用于解决NP难题(NP-hard)时,复杂网络中节点的“分工协作”尤其重要。NP难题指的是在多项式时间内可以被验证其正确性的问题。比如,在疫情防控领域,复杂网络模型可以模拟出疫情传播情况、帮助找到疫苗药物分子等。运行这些任务时,复杂网络要推演和验证病毒是否会传染给下一个人、某种药物分子是否有效的各种情况。在这个过程中,找到最关键的节点能够提升复杂网络的运行效率。对于这类问题,现有的解决方案通常基于大型网络进行训练、针对特定场景提出策略,但缺乏统一的框架。相比之下,中国国防科技大学、加州大学洛杉矶分校、哈佛医学院的研究人员提出的FINDER可以应用于广泛的复杂网络场景,其运行速度快了几个数量级。二、分两阶段进行训练,分别采用不同奖励函数FINDER框架采用纯数据驱动的方法,分两个阶段进行训练。在两个阶段中,研究人员用不同的奖励函数来训练FINDER。第一阶段用经典模型生成的小型合成网络对FINDER进行离线训练。离线训练采用-greedy策略。离线训练阶段分三步进行:首先,研究人员生成一批合成图形;然后,研究人员从合成图形中任意取样一个图形;接下来,FINDER框架在这一图形上进行整个寻找关键节点的流程。这一流程中,代理与图形通过一系列状态、动作、激励进行交互。为了确定状态的正确动作,代理先在当前的图形上编码,并获取每个节点的嵌入向量。节点的嵌入向量会捕获节点的结构信息和节点特征之间的长程相互作用(long-range interaction)。接下来,代理将嵌入向量解码为标量Q值,以便所有节点能够预测部署某个动作的长程增益。▲离线训练阶段示意图一旦离线训练结束,FINDER就进入第二个训练阶段,被应用于真实网络拓扑结构中。研究人员在浣熊接触网络(the raccoon contact network)的最大连通元件(connected component)上进行测试。最大连通元件包括14个节点和20条边。这一阶段中,代理首先将当前网络编码为低维嵌入向量,然后利用这些向量对每个节点的Q值进行解码。第二阶段采用“批量节点选择(batch nodes selection)”策略。该策略在每个自适应步骤中选择一个有限分数的最高Q节点,避免了对嵌入向量和Q值的逐个迭代选择和重新计算。批量节点选择策略不会影响最终的结果,但可以降低几个数量级的时间复杂度。研究人员会重复这个过程,直到复杂网络达到用户定义的终端状态、被移除的节点构成最优的节点集合。▲用真实复杂网络进行训练示意图三、对比3个模型性能,FINDER找出关键节点的效率最高相比于机器人等传统的强化学习技术(状态和动作较为简单),复杂网络技术更加复杂和难以表示。研究团队高级研究员孙怡舟称,这是因为复杂网络具有离散的数据结构和处于极其高维的空间。本项研究中,研究人员用图神经网络(GNN)来解决这个问题。图神经网络中的节点代表动作、图形代表状态。以911恐怖袭击事件发生预测网络为例,网络中每个节点代表参与911恐袭的恐怖分子、每个边(edge)代表他们的社会交流。研究人员在911恐怖袭击事件发生预测网络上运行FINDER框架,并运行现有的高维(HD)方法和集体影响(CI)方法做对比。下图d显示了三种方法的ANC曲线。在框架部署动作后,剩余节点的重要性越低,代表框架性能越好。可以看到,FINDER框架最有效地找到了复杂网络中关键节点。相比于其他两个解决方案,随着被移除节点的重要性升高,运行FINDER框架的复杂网络中剩余的节点重要性最低。▲911恐怖袭击事件发生预测网络(蓝色点代表剩余图形中的节点,红色点代表当前时间步长中FINDER找出的关键节点,灰色点代表剩余的孤立节点)结语:未来将可用于更多类型复杂网络FINDER框架通过深度强化学习方法进行训练,可以找到复杂网络中的关键节点。在未来,FINDER框架或可被用于优化社交网络、电力网络、传染病蔓延网络等模型的性能。目前,加州大学洛杉矶分校的研究团队正计划将FINDER框架用于网络科学研究。哈佛医学院的团队希望将FINDER用于生物网络,以确定蛋白质交互网络和基因调控网络中的关键参与者。另外,研究人员称未来将从以下三方面着手,提升框架寻找关键节点的性能:设计出更好的图形表示学习架构;探索如何在跨图形甚至跨域转移知识;研究并解决复杂网络上的其他NP难题。文章来源:TechXplore、Nature Machine Intelligence

世间

信也科技再攀科研高峰:复杂网络研究成果登上国际顶级期刊IEEE TKDE

据悉,IEEE TKDE主要关注知识发现和数据挖掘、数据库和数据建模、并行分布式数据管理系统、数据密集型可扩展计算系统结构、搜索引擎以及数据工程应用等领域的最新研究进展和技术。该期刊审稿过程专业严谨,在数据挖掘领域享有很高的学术声誉。信也科技与浙大的这篇合作论文被收录,这既是信也科技与高校合作成效的直接体现,也是信也科技始终致力科研斩获的又一硕果。近日,金融科技公司信也科技(NYSE:FINV)与浙江大学合作撰写的论文“Robust Network Enhancement from Flawed Networks”被国际顶级期刊IEEE TKDE正式收录。IEEE TKDE(Transaction on Knowledge and Data Engineering)是数据挖掘与知识工程领域最具影响力的刊物,也是被中国计算机学会(CCF) 定位为数据库、数据挖掘和内容检索领域的A类国际期刊,属于值得我国学者去突破的顶级刊物。据悉,IEEE TKDE主要关注知识发现和数据挖掘、数据库和数据建模、并行分布式数据管理系统、数据密集型可扩展计算系统结构、搜索引擎以及数据工程应用等领域的最新研究进展和技术。该期刊审稿过程专业严谨,在数据挖掘领域享有很高的学术声誉。信也科技与浙大的这篇合作论文被收录,这既是信也科技与高校合作成效的直接体现,也是信也科技始终致力科研斩获的又一硕果。着眼复杂网络基础数据缺陷问题“网络”或者“图”作为一种重要的数据形态,在很多领域中扮演着越来越重要的角色,如社交网络网络分析、搜索与推荐、生物化学分子结构分析等。而在金融领域,将用户、设备、公司、账户等作为节点,构建网络数据,并在此基础上进行反欺诈的方式也已经带来了实际的商业和社会价值。信也科技作为金融科技领域的领军企业具备较高的科技能力,在业务中已实际利用复杂网络结构,结合机器学习技术,快速、精准识别并锁定不良中介和欺诈团伙,并将相关成果发表于2019年CIKM的oral论文“Understanding Default Behavior in Online Lending”。然而,由于采样不完全、数据不可得、量化标准有误差等等原因,现实中收集到的数据一般带有偏差和噪声。而复杂网络数据由于关注节点之间的关联,更容易受到缺失和噪声的影响,从而波及下游任务,比如不良中介识别、欺诈团队识别等。此次由信也科技与浙江大学杨洋副教授团队合作完成的论文“Robust Network Enhancement from Flawed Networks”,便旨在解决上述在复杂网络领域中基础而重要的问题:大规模网络数据中的缺陷检测。这种网络的缺陷,可能是由带缺陷的节点或者带缺陷的边引起的,此次发表的论文专注于解决带缺陷的边引发的问题。期望给整个领域提供一种独特视角出发的有效缺陷边检测算法,提升复杂网络领域算法的噪声鲁棒性,即系统的健壮性。首次提出联合学习网络缺失边和噪声边据了解,上述带缺陷的边可分为噪声边和缺失边。噪声边,即为真实情况下并不存在的边,比如用通话网络来构建社交状况,可能因为误拨的电话或者一些推销、外卖电话而加上了一些不反映社交状况的边;缺失边,则是真实情况下存在,数据中却并没有观测到的边,比如以用户之间的转账来构建关系网络,一家银行往往只有用户在本行转账的数据,而观察不到本来存在的他行转账数据。许多学者已关注到,缺陷边的问题可能引发下游任务的误导性结论,并进行了大量的相关研究。而该篇论文的一个重要贡献是充分考虑了缺失边与噪声边的识别会相互影响(如图1(c)&(d)),提出了E-Net(Enhancement Network model),一个端到端的基于图神经网络的模型,来联合学习噪声边和缺失边。一方面,噪声边被识别出来并去除掉,会有利于缺失边的预测;另一方面,缺失边预测的目标函数可以为噪声边的识别提供间接的监督。由于在很多实际场景中都不容易获取一条边是否是噪声边的标签,这样的半监督学习框架使得模型对噪声具有很强的鲁棒性。图1:在统一框架内识别缺失边和噪声边的示意图对于大规模网络,使用整个网络去推断节点之间的关系(比如缺失边、噪声边)会带来无法承受的计算量。另一方面,使用整个网络进行训练,还会导致模型很难外推到新加入的节点和边上,从而影响应用到实际场景。许多学者采用了子图提取来解决这个问题,即针对任意一对关注的节点,仅提取它们周围子图来推断该节点对之间的关系。论文的另一个重要贡献就是提出了一种RWR(Random Walk with Restart)子图提取方法(如图1(b))。相较于传统的子图提取方法(如图1(a)),RWR不再抽取固定的一跳或两跳邻居,从而可以(1)抽取的子图规模不随节点邻居数爆炸;(2)既包含局部又包含全局的图结构。信也科技AI团队负责人王春平表示:“此算法最强大的优势在于不需事先知道噪声标签,就能通过缺失边的预测来对噪声边进行半监督学习,从而大大提升算法对噪声的鲁棒性。” 论文中工作的有效性已在多个实验中得到了验证。相对于不去噪的模型,对缺失边的预测F1可以提升大约10%,相对于分步识别噪声边和预测缺失边的模型,F1可以提升2%左右。在进行了去噪和缺失填补两方面的网络增强以后,对下游节点分类问题也有很大帮助,F1大概提升4~5%。网络增强已经成为信也科技复杂网络算法挖掘的一个重要环节,并已逐步投入实际业务应用,大大提升了算法的鲁棒性。目前,信也科技完备的自研技术已实现了对业务流程的全覆盖,如人脸识别、多场景OCR、声纹识别等多模态核身、增信技术,语音识别、意图识别、对话管理、语音生成等全流程智能对话机器人技术,以及基于复杂网络的不良中介识别和团伙识别技术等。此外,还形成了智能投放、精准营销、核身、反欺诈、风控决策流、Automl模型平台和智能机器人等一系列AI产品。科技领域累累硕果的背后,是信也科技始终着眼于科技并致力于科研的信念,亦是信也科技来自海内外顶级高校与知名科技企业的相关研究人员以及加州理工大学、加州大学洛杉矶分校、浙江大学等高校的多名担任科学顾问的教授的辛劳与汗水。此前,信也科技已与浙江大学共建人工智能实验室,并同中国人民大学建立了战略伙伴关系,长期保持积极的合作。本次被IEEE TKDE收录的论文即为校企科研合作的阶段性成果之一。今后,信也科技将继续保持对科技研发的关注与投入,并进一步加深与高校的科研合作,力求在相关领域进行新尝试与新突破,努力实现“科技,让金融更美好”的使命。

常德

【中国梦实践者】“复杂网络”中的学者吴晓群:以智慧探索“美丽”

【中国梦实践者】“复杂网络”中的学者吴晓群:以智慧探索“美丽”随着互联网的飞速发展,复杂网络研究的重要性日益凸显。致力于发掘复杂网络中的美丽新世界,这是武汉大学数学与统计学院应用数学系教授吴晓群和她的团队正在做的事情。吴晓群如果人类能通过观察网络的行为动力学,解释个体之间的关系,是否能更好的认识世界?吴晓群给出的答案是肯定的:它将推动全人类的进步,改变我们的世界和生活。什么是复杂网络?“绝大多数人认识的网络,可能只是日常上网用的万维网,但网络的概念很大,我们实际就生活在一个极其复杂的网络中。”吴晓群解释说,每一个人可以看作是网络中的一个节点,而人与人之间的关系,以及人与事物的关系都可以用一条线来表示,这样就形成了一个庞杂的网络。如今,很多数学家试图用数学的方式描述这个网络,研究它的几何性质、形成机制、演化过程、统计规律,以便更好地服务于现实需求,而这也恰恰是吴晓群所要攻克的难题。复杂网络的研究可以让世界变得“简单”,“当你沉浸在‘双11’狂欢中,淘宝用大数据为你推荐产品的背后,其实就有复杂网络理论的应用。”吴晓群解释说。利用复杂网络的理论,把杂乱无章的信息建立起关联,人们就可以对模糊世界进行精准量化和预测,发现什么是重要节点,什么是边缘节点。基于复杂网络分析人们在不同时间、不同地点的行为,未来能够更容易处理复杂问题,例如疏导城市拥堵的交通、控制流行病传播等等。伟大的数学家欧拉在1736年的论著中记载了新的数学分支——图论,如今,图论已经成为了研究复杂网络的重要工具。这些由问题驱动的数学研究正是应用数学重要的组成部分。事实上,生活中处处有数学,将数学与现实生活联系起来解决实际问题,正是吴晓群学习数学、从事应用数学研究的直接原因。“应用数学其实是一个交叉学科,用它解决其他学科中的数学问题,才能真正发挥数学的作用。”她说。2018年1月12日,由全国妇联、中国科学技术协会等共同举办的第十四届“中国青年女科学家奖”颁奖典礼上,吴晓群获得“中国青年女科学家”荣誉称号。吴晓群至今已经在武汉大学学习、工作了21年。近十年来,吴晓群几乎每年都有几个月在国外访学研究,再加上在国内大学授课教学、参加各种学术会议,一度让她感到很难集中精力进行自己想做的研究。然而作为一名女性科研工作者,她无疑是幸运的,她说,“在很多时候,我都能得到单位和家人的全力支持,这也是我与团队能将复杂网络研究不断创新,逐步走向世界前沿的重要原因之一。”目前,吴晓群和她的团队正在如火如荼地开展多层复杂网络这一前沿课题的研究。除了自己的科研梦想,作为博士生导师,吴晓群对学生的培养也有自己的理解。很多人认为女生学不好数学,但吴晓群却称,“女生学不好数学”只是自己给自己找的偷懒借口。“科研之路是循序渐进的,年轻科研人要受得了清贫,耐得住寂寞,潜下心来做自己看中的方向,终将会做出成果,一切都会变得更好。”她说。

良价

青岛理工大学复杂网络与可视化研究所为两大航天工程保驾护航

11月27日,2020全国主流媒体走进青岛理工大学活动隆重举行。来自全国30家主流媒体的40余位编辑、记者走进青岛理工大学校园。与会媒体的编辑、记者先后参观了青岛理工大学BIM中心、数字建构实验室、光大理工环境技术研究院、复杂网络与可视化研究所、摩擦学研究所、激光智能制造技术实验室和山东省增材制造工程技术研究中心。▲11月27日,2020全国主流媒体走进青岛理工大学活动隆重举行。来自全国30家主流媒体的40余位编辑、记者走进青岛理工大学校园。图片来源/大众网青岛理工大学复杂网络与可视化研究所相关负责人介绍,赵正旭教授领衔的“复杂网络与可视化团队”,服务国家两大航天工程—载人航天和探月工程,先后参与国家载人航天(921)工程和深空探测工程中天宫一号与神舟八号、九号、十号交会对接任务,嫦娥二号、三号探月工程任务,长征七号及天舟一号任务等近30次工程实战任务,有二十多年的航天工程行业背景。上游新闻(报料微信号:shangyounews)记者获悉,在嫦娥五号任务中,青岛理工大学复杂网络与可视化研究所航天可视化团队研制的探月工程三期遥操作作业平台再次发挥关键性作用,并接受严格的实战任务考验。11月24日4时30分,长征五号遥五运载火箭在中国文昌航天发射场点火升空,运送“嫦娥五号”探测器至地月转移轨道。“嫦娥五号”此次承担的任务是获取月球样品返回地球,是我国航天领域迄今最复杂、难度最大的任务之一。▲航天测控三维实时可视化系统界面。图片来源/青岛理工大学探月工程三期遥操作作业平台,是航天可视化团队研发的空间三维实时可视化及遥操作系统的子系统,也是北京航天飞行控制中心的常态化测控应用系统,在月面工作段为地形建立、视觉定位、路径规划、任务规划、活动机构规划、规划验证等配置项提供信息显示和业务作业平台,已在“嫦娥四号”探测器月球背面软着陆及玉兔二号月面巡视遥操作操控任务中成功应用。据了解,青岛理工大学“航天可视化团队”先后参与并完成多项深空探测、载人航天等国家重大航天工程实战任务,主要包括探月工程嫦娥二号、嫦娥三号、嫦娥五号T1飞行试验器、嫦娥四号任务的可视化飞行控制指挥与遥操作操控任务,载人航天工程天宫一号与神舟八号、神舟九号、神舟十号,天宫二号与神舟十一号交会对接任务的实时三维可视化任务。上游新闻记者 杨昇

苏辙

「书评」网络科学最新研究揭示成功五大普适定律

作者:[匈牙利]艾伯特-拉斯洛 · 巴拉巴西出版社:湛庐文化/天津科学技术出版社出版时间:2019年12月如果你想打造一个成功的IP,那么你得先知道这个世界的“顶级流量”是如何运作的。成功第一定律告诉我们:能力表现驱动成功,但当能力表现不能被测量时,社会网络驱动成功。比如,如果你想给孩子一个更好的未来,那么你得先知道教育的真相。究竟是你迫切地想进名校,还是名校更需要你?成功第二定律告诉我们:能力表现是有界的,但成功是无界的。如果你想在这个审美快时代打造“爆品”,那么你得先知道到底是什么引爆了流行。成功第三定律告诉我们:初始的成功乘以社会适应度等于未来的成功。成功第四定律告诉我们:成功的团队兼具多样性与平衡性,而且往往更容易让超级领导者脱颖而出。成功第五定律告诉我们:成功可以发生在任何时间和年龄,只要你在一个好想法上坚持不懈。定律的意思就是你不服不行,不管你喜不喜欢,世界就是这个样子。《巴拉巴西成功定律》一书中告诉我们成功不是单打独斗,而是要成为“优先连接者”,让自己嵌入“我们”,机会才会在恰当的时间和空间涌现。本文节选其中两个故事进行分享。泰戈尔·伍兹赢得绝对身价,他比别人做对了什么?泰戈尔·伍兹第一次完成高尔夫开球时仅仅只有九个月大。他早期尝试击球用的是左手,就像是他父亲挥杆击球的镜面影像。几周以后他便改了过来,一下子换到右手击球的姿势。尽管儿子还戴着纸尿裤蹒跚学步,厄尔·伍兹已经意识到儿子过人的天赋。“我知道他一定会称霸世界,”老伍兹后来说,“我那时就知道。”两岁时,泰戈尔· 伍兹赢得了十岁以下儿童小场地高尔夫球比赛。四岁时,他开始跟着职业教练鲁迪·杜兰打球。在他们的第一个赛季里,杜兰惊奇地看到,这个膝盖圆圆的小家伙,居然硬生生地击出无数杆漂亮的好球。从一段带有雪花点的视频录像上可看到,伍兹头戴大号的红色卡车司机帽,手上套着一双白色的高尔夫手套,带着成人的认真表情,将球击过高尔夫球练习场。一脸大胡子的杜兰在旁边屈膝跪着,就好像在向这位儿皇帝跪拜请安。六岁时,伍兹在十岁以下少年世界竞标赛中获第八名。八岁时,获得第一名。到十五岁,他成了获得美国少年高尔夫业余比赛冠军中最年轻的选手。在他十八岁时,他便拿到了他的第一个美国业余高尔夫锦标赛冠军。他之后作为职业高尔夫球手的成就可为传奇,自从加入美国职业高尔夫球协会序列赛事,他便在球场上摧枯拉朽,无往不胜。看了他的简历,我们不禁要得出这样一个结论,伍兹是少有的一个例外,他的表现是无界的。毕竟,他在美国职业高尔夫球协会历史上,创下了平均最低杆的纪录。在他四十一岁生日时就获得了四十一项纪录。当我仔仔细细地看了纪录清单上的数字后,感到非常惊奇。美国职业高尔夫球协会对每一位运动员的表现,留下了非常详细的统计资料,包括击球距离、球道击球百分比、规定杆数到达果岭的百分比,以及每一轮用推杆推球的平均数。在你看到这四项标准是怎样在选手中间分布,你在现实世界中简直不能找到比这更完美的钟形曲线了。它真正地强化了成绩是有界的这一概念是多么具有普遍性:绝大多数选手处于平均位置,少数几个以细微的差别突出一点。而泰戈尔·伍兹事实上在这四个方面都达到上界。但他在这四个方面并不都是最优的。比如,在他获得美国职业高尔夫球协会年度最佳球员的2013年,他从发球台到果岭的平均推杆得分是1.600;亨利克·斯坦森是1.612,而贾斯汀·罗斯是1.914。在这一方面,斯坦森和罗斯都比伍兹有更好的表现。我们再看一看2013年的击球距离这一项,也就是测量他的常规击球能达到多远,结果是令人印象深刻地293码。在这一项中,他位于五十名选手中的第三十位。那年的第一名是莱克·李斯特,他的击球距离是305码。尽管伍兹天赋出众,但他和参加比赛的其他选手一样,其成绩也是有界的。即便获胜,也只在于挥杆中的毫厘之差,同时巧妙地结合不同技能,从而得以胜出。无论我们参照什么标准,他也并不比他的竞争者就高明许多。虽然伍兹的成绩明显是有界的,但他的成功却是无限的。2009年,伍兹成了第一位在整个职业生涯中净收入达到十亿多美元的运动员。同年,他在最富有的非裔美国人中排名第二,仅次于奥普拉·温弗雷。即使在2015年,当他不再主宰高尔夫球赛事,他在福布斯收入最高运动员排行榜上仍位列第九。他财富的一大部分来自于代言协议,其覆盖范围从高尔夫用具到运动饮料、剃须刀、汽车等等。在2000年,伍兹与耐克集团经过谈判,达成一项五年的协议,合同金额达到一亿零五百万美元,在当时是史上运动员签下的最大的一笔合同。作为协议的一部分,他与耐克在高尔夫服装和装备的销售额中按比例分成。他成了品牌核心,连续数年收取版税,在耐克专卖店卖出的每一件带有耐克品牌标识的羊毛背心,都有利润装入伍兹的腰包。伍兹就是被经济学家称之为超级明星的人物,罕见的表现获得罕见的回报。超级明星得以存在,是因为成功是无界的。即使你的成绩比你的竞争者高出仅仅毫厘,你的回报也会轻松地高出百倍,有时甚至数千倍。经济学家谢尔温·罗森,将超级明星描述为“相对较少的一部分人,收入丰厚,在自己从事的领域中占支配地位”。明显的例子包括电影明星、流行音乐歌手、万众瞩目的高管,以及投资商。想一想这些人吧:乔治·克鲁尼、詹妮弗·劳伦斯、威尔·史密斯、凯迪·佩里、布鲁诺·马斯、比尔·盖兹、理查德·布兰森、华伦·布非特、乔治·索罗斯。超级明星的工作质量与他们的成功之间存在一个不成比例的关系,这意味着在稍稍优秀一点的成绩就可以带来超乎寻常的成功。罗森写到,“稍逊的人才是更优人才的糟糕替代者。”这也提示我们,要在卓越的歌手和一个普通的好歌手之间做选择,我们会选择前者。这一理所当然的选择,促使我们所有人去听同样的歌、读同样的书、观看同样的网球运动员。这也因此使市场偏向于那些被认为具有特殊才能的人。郎朗问鼎世界十大钢琴家,从他身上看如何成为顶级流量几年前,我有机会在一个交响乐音乐厅看郎朗演奏钢琴。尽管郎朗光彩夺目的演奏天赋尽人皆知,但他是否能成为世界上最杰出的钢琴演奏家之一仍存有争议。我以前从未看过他的表演,但当演奏开始后,我发现我越来越难以跟上他的音乐,我的注意力完全被他的手势所吸引。当他在键盘上敲击着高八度音符时,身体夸张地大幅倾斜,双手充满激情地挥向键盘上方,手指在空中抖动。不可否认,我为他的才华感到惊叹,但同时也为他所有的身体语言感到茫然。后来才知道,他的这种表演技巧其实是有目的的。伦敦大学学院研究员Chia-Jung Tsay做了一个实验,他要求专业音乐人和新手预测三个进入决赛的选手,谁能在古典音乐比赛中拔得头筹。一组专听选手们的录音资料;一组既有录音资料,又有视频资料。另有一些人则仅仅提供给他们没有声音的视频录像,如果让你以这样的方式来挑选最优秀的音乐家,你一定会觉得有些荒唐可笑。在实验之前,无论是专家还是新手都明显觉得,单独的录音资料最有可能帮助预测优胜者,毕竟,这是一场音乐比赛。但Tsay发现,实验评判组单独依靠声音选拔出正确优胜者的情况仅有25%。考虑到总共只有三个选项,这一结果比我们做多项选择题时瞎猜都还要糟。依据声音进行判断,无论是专家还是新手都与正式的评委会不一致,他们挑选了另外的人荣获最高奖。令人感到意外的是,最为准确地锁定优胜者的,是观看无声视频的那些人所组成,他们在激情洋溢、但听不到任何声音的音乐演奏者中做出选择。在这一组中,新手和专家在预测的准确性上都达到当次比赛的50%。换句话说,那些完全听不见音乐的人预测的准确率是能够听见音乐的人的两倍。在确认最值得获奖的表演者上,专家并不比菜鸟强多少,某些情况下甚至更差。好吧,我们在这儿稍作停留,消化消化这里面所传递的信息:最初的专家评委会肯定也是依据他们所看到的而不是他们所听到的来选择获奖者。如果依据数据分析,我们可以得出这样一个令人惊讶的结论:音乐界的郎朗们受到人们的尊崇,但并不是因为他们演奏的音乐明显优于他们的竞争者——那些观众不能场场满座的演奏家。他们受到人们的敬仰,是因为他们是善于表演的杰出音乐家。有人曾经告诉我她雇用一位男性雇员,就因为他穿了一双粉色袜子。所有的候选人都符合条件,但在一整天的面试之后,只有那位穿了色彩鲜艳的袜子的人脱颖而出。这粉色袜子和Burcu的纹身比起来没有多大的不同,但我必须承认,它给我留下的印象和她突出的简历一样深刻。事实上,如果我一一回顾我所雇用的每一个人的亮点,常常是这些手势或提示吸引了我:在面试结束时开的一个玩笑、简历上所列出的一项令人好奇的技能、一幅引人瞩目的眼镜、或一阵有趣的大笑。作为招聘的主管,我希望能在面试中,了解我们潜在雇员的价值观或人格特点。既然是在条件都合格的候选人中进行选择,我当然要更注意这些方面,而不是他们的简历。应用在我们自己的生活中,这意味着,我们在面试中应该将真实的自我展示出来。一个出人意料的回答,或者一则引人入胜的个人趣闻,可能就使你比别人领先一步。考虑到成绩是有界的,如果你发现一些小技巧可以使你引人注目,那就太值得那样去做了。但要明白,我不是在鼓励你将所有的信念都置于小聪明上。你从一群人中脱颖而出,或弄巧成拙助推那群人领先自己,这中间只有一条微妙的分界线。记住,当我们缺乏硬数据来支持自己的决策时,可以影响我们的因素是细微、甚至是下意识的,你大可不必玩那些虚情假意的套路。Burcu并没有利用她的纹身来打动我,因为纹身早已存在于她的皮肤上。但它反映了她人格的一个方面,使她显得与众不同。在成绩有界的情况下,这些微不足道的小事情能起到大作用。如果音乐上的研究能告诉我们什么,那就是在我们的自我展示中,那些说不清道不明的方面有多么的重要。音乐比赛的评委们仅凭乐曲难以做出区别,他们只好借助表演的其它方面来做出决定。也许就靠音乐表演者的服装、演奏风格、表演技巧和面部表情。这些就是漂浮在朦胧的、难以量化的音乐海洋上的影响因素。没有任何比赛,不管它享有多高的声誉,能够摆脱这些倾向性。举个例子,伊丽莎白女王国际音乐大赛在古典音乐中的影响就相当于“美国偶像”在流行音乐中的影响一样。从1937年开始,这个比赛就开始了它的造星运动,最先是小提琴,然后是钢琴、声乐、大提琴,和作曲。小提琴表演的奖品不仅有一张大额支票,还有一把可无偿使用四年的、琴手梦寐以求的斯特拉迪瓦里小提琴。更重要的是,它可以带来声望,为你进入全世界的顶级音乐大厅、签订获利丰厚的录音合同而敞开大门。这个大赛长期以来以公正著称,为防止偏见而制定了一系列规程。每年从世界各地邀请八十五名满怀希望的演奏者来参加竞赛,其中有十二名选手能经过淘汰赛闯进在布鲁塞尔举办的决赛,演奏同一首专门为比赛所作的协奏曲。要求他们演奏相同的新乐谱,其目的就是要保证没有人会因为挑选了自己长期练习的乐曲而占得先机。另外,选手在决赛中什么时候演奏也是随机抽签决定。发放协奏曲乐谱的时间要交错进行,以保证每位选手在最后演奏前刚好有一周时间练习。决赛的那一周,每个晚上有两名选手,按名单规定的时间在评委面前演奏,然后当场打分。评委们在递交了他们的成绩单以后不得更改分数,在整个打分过程中也不得互相商量。由于注重细节,这个竞赛被认为是古典音乐界选拔和奖励最杰出演奏家的最佳尝试。但这个过程仍然是失效的。让我们看一看钢琴比赛吧。在1952年至1991年之间,在相同的规则下举办了十一场比赛。由于表演的场次是随机安排的,最有才华的演奏者可能会被安排在任何场次。但如果我们观察这四十年的获奖记录,我们会发现一些十分奇特的事情。首先,在第一天出场的演奏者中没有任何人获奖。在获得最高奖的选手中,第二天出场的有两位,最后一天出场的只有一位。剩下的八位获奖者中,有一半碰巧都是在比赛的第五天出场演奏。很奇怪,不是吗?当然,这可能带有偶然性。当我们反复掷一颗骰子,我们可能会这样认为,掷出3,5,6,3,1,2这样的序列,会远远高于6,6,6,6,6,6这样的序列。如果我们拿起骰子,连续掷出六个6,我们会觉得有如神助。但事实是,两种序列的出现其概率完全相同。因此,我们可以将音乐比赛结果归于不可思议的巧合。但两位经济学家将比赛放在他们的统计学显微镜下,得出了强有力的结论:巧合不能解释这种结果。事实是,那些被要求在决赛的第一天进行演奏的选手,其获奖的概率大大降低,其排名总体上比在第五天演奏的选手低三位。在某一特定晚上演奏的次序也很重要。那些第二个出场演奏的选手比一开场就演奏的选手,排名要高一个名次。性别同样起作用。如果所有的条件都相同——看起来似乎是这样——男选手比女选手排名通常要高大约两个名次。女选手如果在决赛第一天第一个出场,她的排名比在第五天第二个出场的、具有相同天赋的男选手要低六个名次。很显然,性别偏见在谁能赢得比赛中产生了巨大的作用,但这还不是决定性的因素。专家指出了另外两种影响因素,都源于比赛的组织方式。第一,所有的选手都演奏同一协奏曲这一独特的要求。实施这一策略,就是要创造一个公平的比赛环境。协奏曲对小提琴手来说是新的,但对评委们来说也是新的,很少有评委能仅仅通过读谱来充分听懂音乐,作品最精妙的部分只能在反复听后才逐渐浮现。当评委们从最先演奏的决赛选手处第一次听到这首协奏曲时,他们对乐曲的生疏感是很强烈的,随着比赛的继续,他们才对作品越来越熟悉。第一天,由于被音乐的新鲜感(freshness,但似乎翻译成陌生感更和上下文一直)所影响,评委们可能不太注意演奏者对音乐的理解、音乐表现上的细微差别,或者由此所带来的特定音色或音质。第二,即使评委们对首位演奏者的长处能够予以赏识,这位选手也会因另外一项为谋求公正而制定的规定所影响,从而注定享受不到公正。这条不容变通的规定是:评委们对他们做出的评价不能回头做任何修改。想象一下,假如首位选手的精彩演奏使你折服,你会冒险给他打上最高分吗?可能不会吧。如果你这样做,一旦你在后边所听到的演奏更让你叹为观止,你就会陷入进退维谷之境。随着比赛的进行,评委们不仅对选手们的演奏听熟了,他们对选手们的评价也更得心应手。同时他们也会越来越慷慨的打分,打分也会越来越放松。【钛媒体作者介绍:本文来自《巴拉巴西成功定律》的作者艾伯特-拉斯洛 · 巴拉巴西。他是全球复杂网络研究权威,“无标度网络”的创立者。美国物理学会院士,匈牙利科学院院士,欧洲科学院院士。同时他也是美国东北大学教授,网络科学研究中心创始人、主任,同时任职于哈佛大学媒体学院医学系,并担任丹那-法伯癌症研究所癌症系统生物学中心研究员。】《巴拉巴西成功定律》将会纳入钛媒体Pro版书库,敬请大家关注前沿书库的上新动态~每位Pro专业用户一年可以在书库中任意选择三本书,由钛媒体免费赠送哦~点击链接、登录,进入“前沿书库”选书:http://www.tmtpost.com/pro人工智能相关好书:http://www.tmtpost.com/3122712.html创业事项相关好书:http://www.tmtpost.com/2788508.html培养领导力相关好书:http://www.tmtpost.com/2678549.html

快乐颂

期刊精选|复杂网络视角下我国高速公路演变特征研究

刘瑞1 叶堃晖1,2 张正丰1(1.重庆大学管理科学与房地产学院,重庆 400045;2.重庆大学建筑经济与管理研究中心,重庆 400045)摘要以1990—2016年全国高速公路及318个高速公路连通城市为研究对象,构建高速公路复杂网络模型,通过网络可视化探讨我国高速公路形态演化特征,立足网络结构及网络节点,从全局网络效率、中介中心度、小世界三个方面分析我国高速公路拓扑特性。研究发现:我国高速公路形态呈“孤立径道网络—树状网络—格状网络—格状放射网络”的演变趋势;我国高速公路网络全局效率不断提升,但整体水平依旧较低;在高速公路网络中,城市“地位”与城市在网络中所处位置相关;2003年以来,我国高速公路网络的小世界特征越来越明显。该研究结果可为完善和优化国家高速公路网络提供理论依据和决策参考。关键词高速公路;复杂网络;形态演化;拓扑特征;小世界《项目管理技术》诚征2020年优质稿件投稿须知:点击这里在线投稿:点击这里邮箱投稿:pmtbjb@126.com觉得不错,点击右下角,“在看”资料来源:《项目管理技术》编辑:兔子 媒体合作:010-88379098声明:本文所用素材部分来源于网络,如涉及版权问题,请及时与我们联系。项目管理技术传播项目管理智慧引领项目管理发展

叶适

2020年人工智能落地发展趋势

作者 | 网络大数据 来源 | raincent_com 转眼间,2019年只剩下不到两个月了。人工智能的热度依旧,只是在资本市场,看空的投资人也越来越多了。从当年大数据的发展趋势看,这种情况反而对产业发展是有利的。因为这意味着,进入赛道的野蛮竞争玩家会越来越少。对于已经拿到赛道入场券的选手来说,如何合理配置手中的资源成为生死存亡的关键,同时细分市场上的领头羊可能在这样焦灼的市场竞争中成长为独角兽。对于从事大数据与人工智能相关领域多年的人来说,其最终目标还是“从数据中挖掘价值”。在挖掘价值时,具体某类技术只是整个过程中某个阶段的辅助工具,单纯某类技术解决不了所有问题。因此,我们基于“最终目标”划分三大类场景去运用“大数据”和“人工智能”构建整体解决方案:一、寻找业务增长点:数据建模能力成为核心,当前Fintech/Regtech领域需求广泛核心要素:帮助企业解决经营决策中遇到的数据支撑问题。无论是营销还是风控,最终都是通过一些报表、模型去辅助业务人员做决策。解决方案:机器学习类产品已经成为金融行业寻求业务增长点的标配工具,同时越来越多的传统行业也开始使用大数据、人工智能等技术做辅助决策。解决方案难点:由于跟业务结合紧密,虽然已经在不同行业开始落地,但实际进展缓慢。由于业务的特殊性,往往不能够单单通过算法本身去解决所有业务问题。这同时也意味着,交付目标以及实施周期的不确定性。二、加深业务壁垒:知识中枢成为重要工具,当前金融/安全等行业试点较多核心要素:对现有业务实现优化。解决方案:在这一场景中,知识中枢运用较多。我们将三大块技术:知识图谱、搜索引擎、深度图谱糅合进知识中枢的概念中。首先通过搜索引擎进行行业知识检索,再通过知识图谱进行概念串联,最后通过深度图谱进行行业知识推理。解决方案难点:如何将行业知识抽象出来,形成公司内部的知识系统,从而有针对性地对现有业务流程、具体业务点进行整体优化。三、降低业务成本:自动化成为基础要素,当前能源/交通等行业突破开始核心要素:如何减少人工干预。解决方案:现有的场景中,偏业务性质的自动化可以通过RPA等技术实现。RPA本身技术门槛不高,但在NLP、OCR、CV等AI技术带领下,已逐步被用在越来越多的场景中。另一方面,由于图像识别以及5G、边缘计算的推动,越来越多的安防监控、无人巡检等AIOT场景开始落地。相对于RPA,AIOT的场景给客户业务带来的颠覆跟价值更大。解决方案难点:现实场景中的有效样本较少,影响模型的准确率和落地。下面我们将结合三种不同的场景来阐述六大AI趋势。趋势一:Fintech/Regtech AI落地过程中,AI平台逐步成为事实标准AI平台,在很多地方又称为AI中台/数据科学平台/机器学习平台/人工智能平台,主要涵盖的功能除了传统统计分析软件包含的功能以外,还包括大数据、分布式计算平台、NLP、CV等能力。行业先行者在探索AI落地过程中,逐步意识到AI平台的重要性。从一开始只针对几个小的业务线进行试点,到后续在更多的场景中推动落地,大家达成共识:与数据中台类似,烟囱式的各自为政只会使得后续AI的落地愈加艰难。AI平台在Fintech市场的爆发,验证了一个基本事实:只要业务领域有足够通用的需求,就会出现足够通用的平台。数据库本身是上一个数据的事实标准,而AI平台则没有一个明确的定位。由于这个想象空间,AI平台便成了各大玩家的必争之地。趋势二:数据建模开始在非金融行业的龙头企业流行,国产化趋势明显AI平台在其他行业的试点也如同星星之火。虽然其他传统行业的信息化水平普遍比金融略低,但也在迎头赶上。往往这些行业取得的成果比金融要多,这是因为满地都是顺手可摘的果子,成果落地比金融行业相对容易。这些企业原本可能使用的是SAS、SPSS或者Matlab等国外产品,现在可能在试用国产AI平台。一方面是因为SAS等产品不足以支撑最新流行的框架算法,另一方面也有国产化层面的考量。AI平台作为人工智能基础平台,本身需要对各领域专业算法具备深入理解以及实现的能力。同时作为平台,也有通用性、高性能以及安全可靠等各方面的平台需求,对相关研发人员有极高的技术要求。当前,国产平台跟SAS等比较,整体还是略占劣势,但是在某些细分领域已经实现了超越。趋势三:图谱应用开始在全行业推广,伪需求略多,注意辨别图谱类的应用,主要对应于上面提到的“知识中枢”。基于“知识中枢”去做特定行业的图谱类应用已经在市场上流行了一段时间。只是,一方面由于客户对这块有不切实际的要求,另一方面,大多数实施图谱应用的厂商能力参差不齐,实际项目也没办法最终落地。2020年对大多数图谱类应用,客户会有一个更清醒的认识:做什么它擅长,做什么它不行,应该怎样做,都会有一定的经验。这也对图谱应用有更高的技术层面的要求,同时也对NLP算法以及图谱算法有更多落地层面的考量,包括性能、实施周期、最终效果等。趋势四:深度图谱在反欺诈、反洗钱、犯罪团伙分析等场景开始落地由于深度学习自身相关技术的停滞,将深度学习与图谱结合成为了学术界的主攻方向。而在反欺诈、反洗钱、犯罪团队分析等场景下,复杂网络分析已经成为主流的分析手段。通过深度学习与图谱的融合,深度图谱给传统的图谱分析带来了图谱推理的能力,从而将原有的模型精度提升到另一个高度。然而,一旦涉及到落地,故事并没有那么简单。一方面,同大多数AI应用一样,落地过程是比较曲折和复杂的。本身模型精度需要不断迭代,同时也需要对业务非常熟悉的人员进行及时反馈,这就导致对业务跟算法的要求都非常高,一旦实施过程中出现偏差,容易有挫败感。另外,在一些对实时性要求比较高的场景中,对底层图数据库的性能也有要求。而当前的市场上,图数据库厂商虽然多,但大多数时候没有懂技术的人员去调优,使得真正能同时满足性能要求和算法要求的图数据库凤毛麟角。趋势五:视频图像类应用的碎片化与场景化成为AI快速落地推广的拦路虎CV类场景是引爆AI大火的导火索,同时,由于大多图像场景偏识别类,跟业务离得比较远,可以大规模地在市场上扩张。不过,我们可以惊奇地看到,CV类的需求还在不停地膨胀。这是因为,当前市场的CV巨头在人脸、车辆等通用需求方面进行了大规模落地,而对于一些偏碎片化的场景,比如设备故障识别、异常识别,甚至特殊场景的人脸识别,都缺乏足够的技术支撑与耐心去推动落地。因此,怎样提升CV场景落地的效率成为大多数CV从业者的主要工作方向,这里面包括多个维度:第一,从科研层面去革新算法,第二,从工具层面去落实标注、训练、部署等的一体化平台,第三,从市场角度定义行业通用化的场景,第四,从技术角度去优化模型,从而降低实施成本。在这个大背景下,四大CV独角兽也好,互联网巨头也好,都试图去推动平台的落地。然而,在这样的“四维”要求下,要踏踏实实地在细分场景中打磨通用模型、平台,谈何容易。但这也让耕耘细分行业的小CV厂商有足够的空间去摸索。趋势六:AIOT物联网场景没有大规模的需求爆发,细分行业开始出现落地我们看到,所谓的AIOT场景,主要还是CV类场景带动,但一些深入需求(如需要传感器数据参与的预测性维护类场景)落地较少。这跟“智能制造”的特点比较相关。客户在车间现场通常需要一个开箱即用的产品,而大多数AI类场景需要足够多的时间去打磨。另外,大多数工业场景需要的不仅仅是大量有价值的数据,还需要对工业场景有深刻的理解。首先,“大量有价值”的数据本身不大可能获得。比如,在预测性维护的场景下,所谓“有价值”,就是指相同或者类似的设备历史上出现故障的时候对应的数据,这种数据当然很少。其次,在部分异常数据的加持下,一般的统计分析算法可能分析不出什么。这跟金融类的风控场景不同,风控场景考验的是人性,从人性的角度去做一定深度的分析,并结合算法就可以取得不错的效果。而对于设备,这里需要的是一个深刻理解机械原理的算法专家。即使面对这样的困境,我们还是看到了一些制造业企业开始摩拳擦掌,虽然深入的AI算法用不上,简单的BI也能提供价值嘛。只是感叹,Predix还是出来太早了,那2020年会有突破吗?还是得看“智能制造”的内生动力多大,期望一些细分场景会有落地。人工智能的2019年注定是平静的一年,因为技术爆发以及投资引导时期已过,避免不了被冷清。然而,正如大多数技术周期一样,当技术本身有价值且具备落地能力的时候,技术落地的过程逐步展开。我们相信对于大多数在探索人工智能落地过程的从业人员来说,故事才刚刚开始。而对于参与炒作概念的玩家来说,也找到了新的方向:区块链。从更宏观的数字化转型的角度来看,还有太多的事情值得大家去落实。抓紧2019年的尾巴好好做几个落地项目吧。

残花泪

细说大脑科学发展史,探索大脑无与伦比的复杂网络

新生儿的大脑已经拥有了大约1000亿个神经元,并通过树突、轴突相连,形成了无与伦比的复杂网络。另一方面,我们也时常会有这样的疑问,人类绝对算得上地球上最聪明的动物,但为什么刚出生的婴儿除了吃奶就是哭泣,其他的什么都不会,甚至不如动物呢?其实对于每天陪伴我们的“大脑”,我们并不是很清楚,那么,我们就从历史上的大事件揭开大脑神秘的面纱。(一)笛卡尔-我思故我在有的人可能有疑惑,笛卡尔和我们的大脑有什么关系呢?关键就在于他的名言——我思故我在笛卡尔是法国著名的哲学家,物理学家,数学家,神学家,是17世纪及其后的欧洲哲学界和科学界最有影响的巨匠之一,被誉为“近代科学的始祖”。笛卡尔认为在人的大脑中有个部位叫松果体,它是灵魂的主要位子,是我们所有想法形成的地方。(1)松果体是整个大脑中唯一的单体部位。我们用两只眼来看世界,两只耳朵来听世界,大脑的一切都是对称的,只有松果体例外,所以必须是共同感觉的源泉,是灵魂的主要位子。(2)松果体小、轻,易于移动。脑垂体虽然小,不可分割和位于中线,但是它在大脑的外面完全无法移动,因此不是灵魂的位子。笛卡尔第二个有趣的观点是涉及记忆方面的。笛卡尔认为记忆可能不只存储在大脑半球,而且也存在松果腺和肌肉中,而且他认为运动的形式有两种,一种是涉及到松果体,一种不涉及到松果体,即反射。由此可见,松果体在笛卡尔的哲学中占了相当重要的地位。有人开玩笑地说“如果笛卡尔今天还活着,他一定在负责研究医院的CAT和PET扫描机”。(二)颅相学德国解剖学家弗朗兹·约瑟夫·加尔(Franz Joseph Gall)于1796年提出了颅相学,他认为人的心理与特质能够根据头颅形状确定。加尔从小就喜欢观察人的外表(尤其是颅骨外表)同心理的关系。例如,他根据个人长期的观察,发现眼睛明亮的人,一般记忆力较好;头骨隆起的人,可能象征着贪婪的脑机能,是监狱中扒手的特征等。后来他归纳出42种人不同的类型。按照他的逻辑,看一个人是什么类型的人,只需要摸一下大脑的形状就可以了。值得一提的是,加尔的颅相学从来没有获得学术界的认可,倒是老百姓很认可他的观点,在19世纪的民间,一度流传很广,直到20世纪初才慢慢绝迹。(三)盖奇-天上掉下来的不都是苹果不是所有从天上掉下的都是苹果,也不是所有被砸的人都是牛顿。1848年,菲尼亚斯·盖奇(Phineas Gage),一个铁路工人,在施工现场被一根铁棒击穿了大脑,铁棒从大脑前额穿进去,从头顶穿出来。盖奇当场晕倒,同事们立即叫来医生,令人惊奇的是,他不但没有死,还恢复了意识,几分钟后就离开了现场。就当大家都以为盖奇奇迹般的康复的时候,盖奇显示出了和之前截然不同的性格。以前,菲尼亚斯是个愿意合作而且友善的人,而现在他却变得专横、优柔寡断、傲慢、顽固、对旁人漠不关心和自私。他的同事都说:这不再是我们认识的盖奇了。最终,他离开了在铁路上的工作,到处游荡,最终成为集市上一个行为怪诞的人而了却了他的余生。死后,他的头颅被保留下来,经过后来的X射线证实,额叶脑区部分受到了巨大的破坏。对于科学史来说,这是一件有意义的事情,它让人们逐渐思考是不是大脑的某一特定部位受损会引起某些特定行为的缺失,这是科学思维模式的改变。(四)布罗卡和韦尼克就在盖奇去世一年后,法国医生布罗卡(Broca)发现了特殊的现象,一个病人除了严重的语言缺陷外,其它似乎一切正常。他能够完美的认识和理解语音,但他只能发出一个音“tan”。病人去世后,布罗卡通过尸检发现在患者接近左耳的大脑区域,就是左颞叶的部位,出现了损伤,后来,他又做了大量的实验调查,发现大脑左侧颞叶特定区域受损的病人,都会出现与“tan”类似的症状,这个区域也被称为布罗卡区,这种病症被称为布罗卡失语症。1874年,德国医生韦尼克(Wernicke)描述了有相反问题的患者,能够清楚地表达,却不能理解书面和口头的语言,往往能够流利地说,却带有毫无意义的词和话。韦尼克进行尸检,发现距离左颞叶不远的区域受到了损伤,这个区域后来被称为韦尼克区。布罗卡和韦尼克的工作是神经科学上里程碑式的发现,他们第一次明确行为障碍问题和大脑特定区域损伤的对应关系。(五)潘菲尔德的侏儒图20世纪30年代,潘菲尔德(Penfield)医生开始治疗癫痫病,治疗的方法是脑外科手术,去掉部分头骨和暴露大脑。他注意到,当用电极刺激皮层的某一部分时,身体的不同部位会回应。他意识到,可以在皮层的特定区域和人体之间绘制一对一的对应图。在图中,你可以看到,大脑的哪一区域大致控制哪种功能以及每个功能的重要程度。例如,我们的手和脸部在大脑的感觉皮层中占的面积很大,这说明这两个部位对于我们的生活是十分重要的。(六)斯佩里的裂脑实验美国神经生理学家罗杰·斯佩里(Roger Sperry)由对大脑半球研究的贡献,获得1981年诺贝尔生理学或医学奖。他是治疗癫痫的医生,通过切除连接两个大脑半球的胼胝体,使它们不再沟通和连接身体左侧和右侧的信息,但他注意到了一些异常。斯佩里通过大量的比较实验,突破了许多传统的理论,科学地解释了大脑功能的高度专门化。斯佩里的科学发现的重大意义体现在以下几方面:一是确立胼胝体的传递功能,证伪“胼胝体无作用说”。胼胝体并不是像传统观点认为的那样,“只是脑的支持物”,而是起着两半球之间传递信息的决定性作用。这样,胼胝体在完整大脑中的作用终于由斯佩里弄清楚了。二是发现了右半球优势功能,匡正右半球劣势观点。斯佩里及其同事对“分离脑”病人进行的一系列单侧性试验,表明大脑左半球长于语言和计算。大脑右半球虽不擅说写,但对语言和字义仍有相当的理解。它对空间的识别,对音乐、艺术、情绪的感知,则优于大脑左半球。三是辩证地提出意识的分离和统一,反对右半球无意识的观点。(七)网格细胞与定位细胞我们人类究竟是怎么知道我们所处的位置,又是怎么知道我们将怎么样去某个地方的呢?我们的定位机制究竟是怎样的呢?1971年,约翰·奥基夫(John O′Keefe)发现了构成这一体系的第一个组成部分。他在大脑的海马体区域发现一种特殊的神经细胞,当实验小鼠在房间内的某一特定位置时,其中一部分这样的细胞总是显示激活状态;而当小鼠在房间内的其他位置时,另外一些细胞则显示激活状态。奥基夫认为这些是“位置细胞”,它们构成了小鼠对所在房间的地图。2005年,May-Britt Moser和Edvard Moser夫妇发现大脑定位机制的另外一项关键组成部分。他们识别出一种神经细胞,他们将其称之为“网格细胞”,这些细胞产生一种坐标体系,从而让精确定位与路径搜寻成为可能。John O′Keefe以及May -Britt Moser和Edvard Moser夫妇的发现解答了一个困扰哲学家和科学家们长达数个世纪的谜团——大脑究竟如何创建一个有关自身周围空间位置的地图?我们又究竟如何能够在复杂的环境中找到方向?(八)大脑并不是一成不变的目前一种流行的说法是,大脑中有专门司职各个运动器官的皮层。举个例子,如果患者的手部被截去,那么随着大脑皮层的重组,面部的皮层就有可能会“侵占”原来手部的皮层,造成人们的感觉错觉。当刺激到面部时,就有可能会误以为手部还在,产生幻肢痛,这也从侧面上印证了大脑存在可塑性。一个新生儿的大脑收到许多来自婴儿感官的讯息。这种讯息必须设法被送回能处理它的大脑。为此,神经细胞必须相互连接,把神经冲动传送到大脑。新生儿的基因指示一条路径让信息从一个特别的神经细胞去大脑的正确的区域。在出生后的最初几年,大脑会迅速生长。每个神经元成熟时,都会发出多个分支(轴突,发送讯息,及树突,接受讯息),增加突触接触的数量和铺设,或者在大脑中搭建从神经元到神经元间具体的连接。加拿大蒙特利尔大学科学家发现,大脑具有惊人的可塑性。可塑性是指大脑由于阅历经验变化而发生变化的能力。大脑中有专门的脑区用于空间处理,即使一个人刚出生就失明,他的大脑也非常灵活,可以让神经元周围的微环境发展变化,使神经元拥有并执行一些新功能。来自伦敦大学国王学院的科学家们于2015年通过研究发现了一种新型分子开关,其可以帮助控制应对神经网络活性改变的神经元的特性,该项研究刊登于国际杂志Science上,相关研究表明大脑中的“硬件”是可协调的,而且对于理解基本的神经科学原理提供了一定帮助,也为后期开发治疗神经性障碍,比如癫痫症的新型疗法提供了希望。