欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
《Nature》科研数据管理很重要!应拿出5%研究经费绞肉机

《Nature》科研数据管理很重要!应拿出5%研究经费

科学研究过程中会产生大量的实验数据,然而因为对于数据缺乏妥善的管理,绝大多数实验数据没有披露,也不会被公开或者共享给其他研究人员作为研究依据。这对于科研经费的投入是极大的浪费。日前,《Nature》期刊发文称:5%的研究经费应用于确保科研数据可重复利用(鼓励重复性研究和无效结果)。荷兰Barend Mons教授认为只拨经费支持研究而不负责数据管理是不负责任的。目前对科研数据管理有着迫切需求。应该对科研数据管理投入部分管理经费,并且聘用专业的数据管理人员,利用专业的数据管理工具对科研数据进行科学管理,这不仅能解放科研人员获得更多的时间,以便更加投入研究工作,并且使得科研人员具有进一步利深入挖掘实验数据进行科学分析。Nature 578, 491 (2020)Barend Mons教授提出了FAIR法则(即可找到,可访问,可互操作和可再利用)作为科研数据管理的基本准则。并且其同仁和荷兰政府制定了相关政策,目前正处于初步实施阶段。国际上其他国家也开始逐渐在科研数据管理领域加大投入。Barend Mons教授还呼吁,利用项目研究经费的5%作为项目管理经费,并且项目负责人在申请项目时必须提交详细的科研数据管理方案。项目资助方也应该要求项目实施方进行此项管理,否则不予以资助。这种科学的管理方式将使得科研的产出比更高。这种管理方式特别适用于目前高校和研究所的实际情况。高校中学生们自己管理自己的实验和研究数据,这不仅分散了学生的经理,不利于深入开展研究工作。并且导致学生往往只关注对自己实验结果有利的部分数据,缺乏对实验数据的深层次挖掘,一定程度上造成实验研究的不全面。因此,专职的数据管理人员在科研中十分必要。许多棘手的问题只有通过数据密集型计算机辅助研究才能解决。绝大多数研究数据从未发布过。因为无法重复使用这些数据而浪费了巨额研发资金。数据再利用的相关政策已经有了,但是解决该问题所需要的资源可能是科学界难以面对的。2013年,Barend Mons教授作为荷兰专家小组的一员并且呼吁国家科学研究资助支持数据管理。七年后,协助起草的相关政策开始实施。要求设备和研究人员创建的数据需满足FAIR原则。 目前Barend Mons教授主导一个国际全球开放展览会(FAIR)办公室,负责帮助研究团队实施这一准则。并且认为这个举措将需要大量的专业数据管理人员,估计约每20名研究人员中就需要一个数据管理人员。即使数据共享,也缺少重复使用所需的原始数据、专业知识、技术支持以及基础设施。大多数已公开发表的数据集分散在“补充文件”中,而补充文件中的数据是难以找到并且重复利用。这种做法使研究人员之间无法互相借鉴。例如,在疾病暴发的情况下,数据的确实可能造成死亡人数增加。Barend Mons教授认为研究经费的5%应该用于数据管理。欧盟有3000亿欧元(3250亿美元)的公共资金用于研究,因此在数据管理上应话费150亿欧元。而研究人员,尤其是经验更丰富的科学家认为这使得研究经费减少了5%。首先,妥善保管数据是一项道德责任,应成为良好研究实践的一部分。第二,如果数据得到适当处理,研究人员将有更多时间进行研究。攻读博士学位的学生最多将80%的时间花在“数据处理”上,不应将时间浪费在修改格式等小错误使数据适合分析。如果有400名这样的学生,那将至少相当于200名全职雇员的薪水。因此,雇用20名专业数据管理员来减少因数据争用而浪费的时间将提高有效的研究能力。许多顶级大学开始意识到不共享数据的代价是巨大的,并且要大于相关的风险。而科学的数据管理可提供可观的投资回报。欧盟委员会2018年的一份报告估计,仅在学术领域,数据再利用问题每年就给欧盟造成至少100亿欧元的损失,以及160亿欧元的创新机会损失。 如今,FAIR指导原则每天被引用3次,但引用并不等同已经应用于实践。Barend Mons教授和她的同事们以及欧洲开放科学云(European Open ScienceCloud)是一项旨在促进开放科学实践的计划,其范围涉及整个大陆范围的数据共享基础架构的要求。据估计,在欧洲的7000万科技专业人员和170万研究人员中,欧洲将至少有1000万严肃数据生成者。因此,我们将需要教育大约500,000种各种类型的数据管理员,以通过实验设计和数据捕获,管理,存储,分析,发布和重用为研究人员提供支持。由于数据管理太过于繁杂且耗时,不能留给研究人员去做。很少有研究人员将数据管理作为他们的核心业务,特别是当前的激励机制不鼓励数据共享,并巩固了古老的和几乎完全基于叙事的学术交流文化。幸运的是,世界各地的研究机构正在建立数据竞争力中心以提供帮助,其中包括荷兰的瓦赫宁根大学和意大利都灵大学的数据中心。但是这个运动还处于起步阶段。研究资助机构应坚持:如果没有经过适当审查和预算的数据管理计划,就不再拨付研究经费。 而FAIR数据可以提供更有效的人工智能(FAIR也可以意味着“完全AI就绪”),这将开创前所未有的研究机会并提高可重复性。一些数据密集型组织正在数据管理方面加大投入,例如制药公司和医疗中心。(注意FAIR与“公开”不同;保密规则仍然适用。)在莱顿大学,一个计算肿瘤学程序可为患者体内分析的每个肿瘤创建一个机器可操作的信息文件,无需手动干预。该项目预算的大约10%用于这些文件的设计和管理,我们称之为FAIR数字双胞胎。更多的研究机构和项目资助方必须做出类似的承诺。关键是数据管理能力的建设,使各个研究团队能够在国内和国际上进行合作并共享好的实践,以便使得数据管理成为良好的规则,而非负担。(文:砰砰砰砰)本文来自微信公众号“材料科学与工程”。欢迎公众号合作转载,未经许可谢绝转发至其他平台。

所假而行

大数据时代 科学数据管理成新命题

“人类正在经历一场前所未有的数字化革命,科学数据的丰富度、关联性与开放性,将成为21世纪驱动科技创新的核心要素。”近日,在北京召开的国际数据委员会(CODATA)2019年学术大会上,中国科学院副院长、中国科学院大学校长李树深院士认为,继“观察实验”“理论分析”“计算模拟”之后,“大数据驱动科学发现”已成为科学研究的第四范式。但在现实世界中,科学数据的发展也面临着机遇和挑战并存的局面。“海量且多样化的科学数据不断产生,大家却没有足够的系统去存储或者处理,80%有价值的数据都在两年之后就浪费了。”国际数据委员会主席Barend Mons认为,过去的一些系统和方法已经不适用于当下的大数据时代,机器的智能化处理和使用数据的能力亟待提升。“的确,在推动科学数据管理和开放共享工作向纵深发展的过程中,我们也发现还有许多政策问题需要探索。”国家科技基础条件平台中心主任苏靖坦言,如何真正实现科学数据可发现、可访问、可互操作和可重用?如何通过建立通用互认的科学数据标识体系来保障数据知识产权?如何进一步使科学数据的全生命周期和统一的技术标准更加完善?如何有效推动科学数据的开放和传播,同时保障数据的安全?如何使科学数据的应用成为解决复杂问题、推动科技创新的真正驱动力?等等。“这些问题的探讨和解决正逐步提上议程,中国也正在成为国际上推动科学数据资源建设与发展的重要参与者。”去年,国务院办公厅正式发布《科学数据管理办法》,并启动了国家科学数据中心的部署和建设工作。时隔一年,科技部和有关部门立足前期工作基础,在高能物理、基因组、气象、地震、海洋等领域组建了20个国家科学数据中心。这些中心将成为我国科学数据管理和开放共享方面重要的基础设施和载体。对于国家层面出台的第一个科学数据领域的管理办法,中科院院士郭华东表示,这使得科学数据的管理和使用有了可遵循的章程和依据,也使得科学数据的开放共享在科学界达成共识。但他同时也提出:“在《办法》推进的过程中还需要着力解决数据权益保障等一系列问题,才能使办法真正落实落地。”CODATA中委会副主席、中国科学院计算机网络信息中心主任廖方宇进一步解释说,站在科学家个人的角度来讲,存在一个科研竞争的压力问题,有的人很难得到科研数据,但有的人有了科研数据却不一定能产生很好的结果,如何来平衡评价?应该出台什么样的激励机制?另一方面,从国家的利益考虑,在国外核心期刊发表论文,科研数据提交到指定的储存机构,有时候就必然面临数据流失、知识产权得不到保护的问题。而国家基础学科公共科学数据中心主任胡良霖最关心的则是数据质量的问题,哪些数据需要保存?该如何保存?比如,一些数据在最初采集的时候成本比较大,经过几年采集技术的快速发展,成本已经大大降低,而长期使用的存储介质的费用远高于最新采集的成本,要不要把历史上存留的这么多数据都保存下来?他建议,我国急需建立自主可控的国际级权威数据库,推动科学数据的分级保存,并且对保存的数据做出明确分级指导和界定。会上,一些与会专家也呼吁,国际数据同样需要在全球开放共享。“多国科学家贡献科学数据共同建设的数据库,应当在贡献者所在国提供镜像服务,以保证各贡献国对数据的平等获取权;对于国际期刊发表论文要求提交数据,期刊应当与论文作者所在国联合确定论文关联数据的存储机构,首选在其所在国的优质数据存储机构。”专家们说。苏靖表示,希望国家科学数据中心能够很好地承担起科学数据管理和开放共享的功能,支撑更多具有世界领先水平的重大科学发现和原创性的技术突破,推动科技创新能力提升和经济社会发展。(科技日报北京9月26日电)

兰花

中国石油大学(华东)科研团队:以大数据管理助力湖北郧阳战疫

通讯员 刘积舜 王宇鹏 中青报·中青网记者 邢婷“喂!何老师,郧阳的疫情发展情况不妙。您能否帮忙研发软件为政府科学决策提供支持?”1月28日,农历大年初四,中国石油大学(华东)海洋与空间信息学院青年教师何亚文收到了来自湖北郧阳的求助电话。打来电话的是湖北省十堰市郧阳区扶贫办负责人,目前是疫情防控指挥部成员。2017年初以来,何亚文一直通过扶贫办为当地精准扶贫工作提供大数据支持。从这一刻起,远在山东青岛的何亚文科研团队投入了一场远程监控郧阳新冠肺炎疫情的战斗,以大数据为当地战“疫”提供强有力的智力支撑。郧阳,位于湖北省十堰市,辖区64万人。2月初以来,这里也成为全国抗击新型冠状病毒肺炎疫情的主要战场之一。彼时,新型冠状病毒肺炎疫情已从武汉蔓延开来,湖北省各市州均成为重灾区。放下电话,何亚文火速召集团队,讨论研发方案,开始了网络协动、远程办公。几位研发核心成员过年回农村老家,没有电脑,只能满村跑去借。团队核心成员胡嘉良的孩子刚6个多月,他每天都坚守到凌晨,直至郧阳的数据发过来处理完才休息,一天24小时几乎是连轴转。仅用两天时间,何亚文团队便完成疫情数据收集、数据分析、建立了疫情数据库,完成了“郧阳疫情”APP的开发和“郧阳疫情专题地图”的制作。早在2017年,何亚文和他的团队就开始了大数据扶贫的探索,并先后研制了面向建档立卡贫困户管理的“扶贫通”平台、面向驻村工作队员的“四双帮扶”APP平台以及面向政府领导决策指挥的“精准扶贫大数据监管平台”,为郧阳的精准扶贫工作提供了成熟的技术支持与服务。不仅如此,其间,团队围绕“三率一度”等指标开展入户调研,走遍了郧阳所有乡镇的重点贫困村、重点贫困户。在几年的精准扶贫工作中,何亚文团队建立了一整套效果显著的面向村一级的管理机制,特别是收集了庞大的本底数据。“这一次抗击疫情,我们这些平台和数据再次彰显了其力量。”何亚文介绍,基于前期精准扶贫工作对全区人口的普查数据和全区高精度地图数据,“郧阳疫情”APP和“郧阳疫情专题地图”得以快速研发和制作,并实现了实时联动,对全区疫情数据动态变化进行监控、展示与分析。“我们从网上看到的疫情地图一般是省、市、区(县)一级,而‘郧阳实时疫情专题地图’则到了乡镇、村、户一级。”谈及地图和APP的创新点,何亚文认为其首要显著特征就是建立在大数据基础上的到村、到户精准显示,其次是APP和地图实时联动,从多尺度时空动态地图上可看到确诊病例、新增病例等信息及其多日的动态变化过程。2月1日统计,郧阳自武汉返乡人员就多达7000多人,其中发热人员近100人,形势非常严峻。郧阳当地各级政府正是借助何亚文研发的APP和地图进行疫情研判、指挥调度,做到科学防治、精准施策,很好地实现了以社区(村)为单元的返乡人数、武汉返乡人数、发热人数、确诊病例的核查与管理,有效控制了疫情的输入、传播和蔓延,实现了疫情登记全覆盖、疫情监测全过程、疫情管理数字化、疫情研判科学化。自2月14日以来,全区已多日无新增确诊病例。“通过对各类数据的综合分析,我们不仅可以确立疫中、疫后的处置方案,还可以明确疫情对各项扶贫工作,甚至对每一个贫困家庭的影响。”在何亚文看来,这次突发的疫情监控软件开发,既是战“疫”,更是为后期扶贫发力进行大练兵。据了解,疫情APP还被应用在山东省临沂市扶贫和疫情防控工作中,基于临沂市前期的扶贫工作,疫情APP的部分功能主要实现了全市涉农企业的复产复工情况的监控与调度。“未来,我们将研判疫情对精准扶贫工作的影响,便于当地采取进一步帮扶措施,保障脱贫攻坚工作的顺利完成。”何亚文对未来的科技扶贫有了更新的期待,“我相信,有了这些机制和数据的支撑,大数据管理将不止在疫情防控方面,在乡村振兴、乡村治理等方面也必能取得很好的效果”。(来源:中国青年报客户端)

奥兰多

实验室数字化管理平台——让科研实验更精准!

实验室数字化管理数字化应用将走进现代化实验室管理,实验室成立数字化实验管理平台,将计算机及数字技术在智慧产业领域的解决方案实施落地,实现技术成果向社会价值的转化。1.实现实验过程规范化管控,提高实验业务协同效率1)实现从实验任务、实验规划、实验执行、实验分析、实验反馈等规范的闭环业务过程。 2)实现以实验委托单为中心的业务关联应用,包括实验各个阶段的输入输出、阶段之间的协同工作开展。3)实现对多专业实验过程的协同应用,提高各个专业实验的协同效率。 4)实现对实验整体过程的可追溯,通过采用科学的统计分析手段支持对实验问题的过程分析。 2.实现实验过程数据及结果数据的统一管控,提高数据标准化规范化管理水平1)实现实验数据集中统一规范管理,保证数据共享、安全。2)实现实验过程信息及结果信息的完整管控,保证信息的完整性。 3)实以技术中心为主体,各分厂的实验室作为分支,使实验数据标准化、规范化。实现实验信息规范化管理,进一步标准化数据处理流程。4)实现对相关实验数据的检索,实现数据的关联查看。并且可以把实验数据和仿真数据进行对比分析。3.建立基于知识的实验业务应用,提高实验效率与质量1)建立实验知识库,实现实验知识的沉淀积累。 2)对实验知识进行分类管理,提供便捷的知识查询及情景化知识应用,初步实现基于知识的实验业务应用,有效规避常见实验问题,提高实验的效率。3)建立实验知识库维护管理制度,提高知识库知识质量,保证知识库的应用效果。4.实现实验可视化管理,保证实验数据的科学性及准确性,实时了解实验的完整情况1)实现实验进度的可视化管理,可以以图形的方式实时查看实验的进度,方便领导决策参考。2)实现实验设备的可视化管理,实时监控各实验室设备的运行情况,可对设备的运行状况进行分析,提前发现设备的问题,方便设备的维护、维修及精度保证,为实验计划的制订及任务分派提供科学的依据。3)实现实验过程的可视化管理,监测实验时设备的状态及实验人员的操作过程是否符合规范,保证实验数据的科学、准确。4)实现以固定终端、移动终端、大屏幕等多种方式展示实验的情况,方便各级领导、计划调度人员、设备维护人员等实时了解实验的情况。5.建立科研项目协同管理平台5)实现科研项目电子化的计划编制,任务分派,工作分解说明和计划考核。6)建立各类科研项目过程控制和项目管理模板。7)根据项目角色在项目中的职能确定其对于项目的访问权限,各级领导、项目负责人可以依据不同的授权访问不同的项目,了解项目信息,包括项目编号、项目名称、项目类别、负责人、计划开始日期、持续时间、截止日期、所处阶段、项目团队(角色、用户)等。8)通过利用科研项目协同管理平台编制项目计划和工作分解说明,并通过电子流程完成项目计划的审批。在项目计划获得批准后,即可以启动项目。项目成员在自己的工作列表中接收任务;9)实现项目实施目标跟踪分析、管理,项目组成员能及时了解项目计划情况和自己承担的工作任务及附带的工作分解说明,按照要求完成相应工作并提交工作结果,通过工作结果(图样、技术文档等)和项目交付之间的关联关系,反馈任务完成情况;10)实现科研项目进展情况汇总,按格式对科研项目情况生成报表;针对不同实验室领域及未来的发展需要,实现数字化实验平台的建设,完成科研项目、相关的实验数据、文档和信息数据的管理,实现科研项目管理、实验业务过程管理、实验数据管理、实验资源管理、实验知识管理等;实现与ERP系统、其他分析工具的集成应用。能够实现和未来大数据系统的集成,向大数据系统提供数据。数字化实验平台以技术中心为主体进行构建,各分厂的实验室通过公司网络接入数字化实验平台,根据平台设定的模式开展工作。实验室数字化管理平台搭建实现实验业务流程管理,提供完备的实验流程管理功能,为用户提供全面的实验流程管理。实现交互式图形方式的流程定义、执行及监控, 以及流程的管理,支持流程分支循环条件判断。在流程启动后可以给相关的人员自动发送提醒消息,并可以在其最新的工作内容中显示出来。支持图形化的流程模板定制,流程模板定义应支持流程分支、条件判断、作业分配、对象审批、文件会签、自动通知、状态变化等复杂需求。支持流程布尔条件判定,决定下一分支流程流向;当流程中的对象完成评审后,将自动获得流程预定义的状态,并冻结该对象。1)根据不同的文档类型,自动确定匹配的流程;2)支持流程中的工作任务处理,可以将工作分配给指定的人、小组、部门或者角色;3)支持多种评审表决方式(如:一票通过、多票通过等),记录每个评审任务的表决意见。4)当流程中的某一任务到达时,自动将数字化实验平台中的任务以邮件的形式发送给相关的任务参与者,从而保证任务或通知能在第一时间被参与者知晓。2.1.5 流程运行中的权限支持流程运行过程中为每个不同的任务节点定义不同的权限。2.1.6 流程查询和跟踪支持查询流程历史记录和正在运行的流程,流程的发起者可以通过图形化的方式观看流程的进展情况。2.1.7 流程中的圈阅、红线批注可以在流程中对图纸、技术文档进行浏览圈阅、红线批注,并可以填写流程审批意见,若发现差错可以退回设计步骤。2.1.8 出差代理当流程执行点人员出差后,通过设定代理人完成流程的任务活动。2.1.9 电子签名实验室数字化管理平台可支持电子签名,可以自动将审核者姓名写入图纸的标题栏或文件的签署栏,支持Word、Excel格式数据的自动电子签名。

北大荒

开掘好大数据资源“富矿”——聚焦我国首个国家层面的科学数据管理办法

新华社北京4月8日电 题:开掘好大数据资源“富矿”——聚焦我国首个国家层面的科学数据管理办法新华社记者陈芳、胡喆从风云气象记载到地震观测数据、从生物基因分析到极地冰芯变化……大数据时代,科技创新越来越依赖科学数据综合分析。近日,随着国务院办公厅正式印发《科学数据管理办法》,我国从国家层面发力补齐科学数据管理短板,加强科学数据全生命周期管理,确保数据安全;按照“开放为常态、不开放为例外”共享理念加大科学数据共享力度,提升科学数据的增值效益、激发科学研究原始创新活力。补齐短板:科学数据管理要“以用为主”当代科学技术发展呈现出明显的大科学、定量化研究特点,科技创新越来越依赖大量、系统、高可信度的科学数据。科技部基础研究司司长叶玉江介绍,科学数据是国家科技创新发展和经济社会发展的重要基础性战略资源,是信息时代传播速度最快、影响面最宽、开发利用潜力最大的科技资源。“当前,我国科学数据的管理与应用仍然存在明显不足,是面向科技强国进军的短板之一,亟待补齐。”叶玉江指出,相比欧美发达国家对科学数据等信息资源的管理,我国一直缺少国家层面的制度保障。资料显示,西方发达国家早在20世纪90年代就制定了“完全与开放”的数据共享政策,并形成了一批国家级科学数据中心,美国的“基因银行”便是目前最权威的基因序列登记数据库之一。2004年起,我国先后在基础科学、农业、林业、海洋、气象、地震、地球系统科学、人口与健康8个领域支持建成了国家科技资源共享服务平台,初步形成了一批资源优势明显的科学数据中心。“此次我国科学数据管理办法的出台,为科学数据工作确定了行动纲领。”叶玉江说,接下来有关部门将充分借鉴国内外先进经验和成熟做法,加强科学数据全生命周期管理,“以用为主”把确保数据安全放在首要位置,突出科学数据共享利用。扩大共享:“开放为常态、不开放为例外”文件锁在保密柜、单打独斗搞科研……这些曾在学术界饱受诟病的现象,在以后的科研进程中,或将进一步完善。“目前,我们大量的科学数据分散在课题组甚至个人手中。有许多高价值的科学数据并未在国内得到充分共享和使用,我国在科学数据开发利用、开放共享和安全保护等方面还有很大改进空间。”叶玉江说。大数据资源是一座“富矿”。中科院地理科学与资源研究所孙久林院士认为,科学数据要瞄准科学研究、科学创新,海量科学数据对生命科学、天文学、空间科学、地球科学、物理学等多个学科领域的科研活动都能带来深刻影响,可使科学研究方法发生重要变革。孙久林建议,应按照“开放为常态、不开放为例外”的共享理念,明确为公益事业无偿服务的政策导向,充分发挥科学数据的重要作用。据介绍,此次出台的办法要求科技计划项目产生的科学数据进行强制性汇交,并通过科学数据中心进行规范管理和长期保存。同时提出法人单位要在岗位设置、绩效收入、职称评定等方面建立激励机制,将科学数据工作情况作为重要的考核内容,为进一步扩大我国科学数据的开放奠定坚实基础。确保安全:尊重知识产权、严惩数据造假“科学数据的价值体现在使用,前提是确保安全。”叶玉江介绍,聚焦我国科学数据工作存在的薄弱环节,此次出台的科学数据管理办法围绕职责不清、能力不足、应用水平不高等问题,从主体责任、知识产权、汇交机制等方面提出了具体措施。“交出去要审查,哪些能提交?提交到什么程度?这些都会纳入日后科学数据管理的视野范围当中。”针对部分科学数据流出国外的问题,叶玉江表示,此次出台的办法还规定了主管部门、法人单位要建立相应的管理制度,确保在国外发表学术论文的作者将支撑论文观点的科学数据汇交到所在单位统一管理。此外,按照“分级分类管理,确保安全可控”的原则,明确主管部门和法人单位依法确定科学数据的密级及开放条件。此次出台的办法还对科学数据使用者的行为进行了规范,体现了对科学数据知识产权的尊重。通过鼓励科研人员整理形成产权清晰、完整准确、共享价值高的科学数据,对科学数据生产者也做出了约束,如出现数据造假等行为,将受到相应惩罚。责任编辑: 王萌萌

肇禋

大数据时代下的科研活动的发展方向

针对大数据时代科研活动的新生知识需求,TIB将其所开展的4个领域的产品研发活动,包括:开放科学(open science)、数据科学(data science)、非文本资源(no-textual materials)和可视化分析(visualization analysis)进行调整拓展,4个领域协同推进数字化/网络化发展。   开放科学产品线   开放科学是数据驱动科研的最佳实践方法。数据驱动科研的背后,就是要解决一系列针对科研数据的保存、流通、管理、保障等需求和问题。TIB开放科学部门的重点工作是推进开放科学基础设施为依托的科研协同环境。   TIB成立的开放科学实验室(Open Science Lab),长期与包括莱布尼兹研究网络2.0在内的多个提供研究人员或者研究基础设施的机构保持合作关系。   Open Science VIVO Beta(2014年3月至今)利用关联开放数据(linked open data),为科研社群提供协同、一致、多样的信息展示。通过在主要德语研究机构上及时抓取科研活动及成果信息,利用关联数据本体的拓展和对接,实现全欧洲境内科研机构、人员、项目等信息的互联整合。目前该网络内共有597位研究人员、19家机构和766项研究成果。该网络在欧美研究社群中广泛使用。   CoScience(2014年3月-2015年3月)是为帮助科研人员共享科研方法、存储科研经验、推广新兴科研工具的数字化信息服务项目。在项目的两期工程中,共与13家高校图书馆、信息机构和数字化项目达成合作。通过开放平台文档和开放视频讲座两种方式,为科研人员集成经验方法,引导研究人员间的知识共享。   非文本资源产品线   TIB提出的“超越文本(move beyond text)”战略具有现实意义。图书馆的知识资源仍然是其最重要的资本和基础[15]。大数据时代的推进使得图书馆馆藏资源不仅仅局限于传统的印本资源,而是囊括了具有多种数据类型、地理分布存储的广泛意义的数据资源。   TIB成立的非文本资源部门关注各类数字化科技信息。针对其中的非文本资源开展了一系列搜集、标引、存取和贮藏实践,将非文本资源视作与传统文本资源同质的“文化遗产”。下面分别列举3个重点领域(全维度的科研数据、视听多媒体资料以及3D数据)的相关实践。   RADAR(Research Data Repository)(2013年9月-2016年8月)是依托莱布尼兹信息基础设施建立的一个通用型科研数据知识库,提供多维科研数据保存(最高保存时限15年)、出版、认证和追踪工作。并与图书馆、研究机构、出版商和开放平台进行数据整合,实现科研数据的分布式存储和一体化获取。   AV-Portal(2014年至今)是一个针对视听多媒體科研数据的分布式集成门户。其视频资源覆盖自然科学和工程等多个学科,对视频质量进行严格控制,视频内容主要涉及计算机可视化、教学资料、仿真模拟、实验过程、访谈和会议记录等。检索视频资源时,可以实现对视频内容的概览、视频语音内容的语种翻译并支持对视频资源每一帧的内容检索。用户可以自由上传资源,资源发布需要审核,部分资源支持开放获取。   DURAARK(Durable Architectural Knowledge)(2013年2月-2016年1月)是一个针对建筑学类3D模型长期保存的数据库。从语义层面对建筑的3D模型资源进行组织和标引工作,建立新的元数据格式对建筑的数据信息以三维立体模型的形式进行长期保存,以期实现对建筑信息多维简便的获取。   数据科学产品线   在TIB开展的数据科学产品开发活动中,大量的成果是以数据科学为工具对数据进行的深度分析与挖掘。在该领域产品研发过程中,TIB同样面对复杂的处理对象——数据类型。与非文本资源产品关注的重点相同,其不仅针对传统文本信息,更重要的是对诸如科研数据、视听内容、3D信息、仿真模块及软件多种数字化的科技数据源进行检索、查询和保存。   基于数据科学领域机器学习、模式识别和统计学方面的工具,TIB针对科研数据的分析、组织和检索工作进行了语义化探索,研究成果多应用于检索工具和系统中。   AV-Portal是数据科学产品的集大成者。在其两个工作重点:文本(数据)挖掘和知识管理(语义分类、本体等)方面均有所应用。文本挖掘工具主要是对非结构化的数据进行整理,使之结构化并挖掘其中的潜在联系;知识管理则主要对现有馆藏资源进行语义层面的改进。   该门户支持对经过质量控制的科学视频进行包括场景、文字、语音和图像在内的多维度的数据识别,以不同的粒度对对象的不同特征进行分析处理,实现对信息进行快速、一致、交互地存取;从语义层面对资源进行分类组织,扩展检索方法;支持基于DOI的针对科学影片和片段的引用,自制影片及科研辅助资料的上传。多媒体检索方法和语义数据分析的技术使得这些非结构化的资源组织和检索工作得以更好地实现。

红手印

科研进入“大数据时代” 上海深化科技创新资源数据发展

10月29日,2020浦江创新论坛科技创新资源分论坛在沪举行,以“云时代的科学第四范式”为主题。 郑莹莹 摄中新网上海10月29日电 (郑莹莹 张亨伟)“近年来,随着越来越多大科学装置的建设和重大科学实验的开展,国内的科学研究也进入到了前所未有的大数据时代。”上海市科学技术委员会副主任傅国庆29日说。当天,2020浦江创新论坛科技创新资源分论坛在沪举行,以“云时代的科学第四范式”为主题。傅国庆表示,科学数据已经成为科学发现的新型战略资源。一个国家的科学研究水平,将直接取决于其在科学数据上的优势,以及将数据转化为知识的能力。他介绍,从国际上来看,伴随着以互联网、云计算和大数据为代表的数字经济的迅速发展,科学数据已经成为传播速度最快、影响面最广,开发应用前列最大的科技资源,科技创新进入了数据驱动的第四范式时代。《上海科技创新资源数据中心三年行动计划(2021-2023)》发布仪式。 郑莹莹 摄当天,《上海科技创新资源数据中心三年行动计划(2021-2023)》发布。该计划的内容显示,“上海科技创新资源数据中心研发与转化功能型平台”(简称数据中心)自2018年12月正式启动以来,围绕人才、装置、机构、项目等科技资源数据要素,以“科技创新资源信息集成融合、科技资源研究与运行评价、科技创新资源协同配置服务”三大核心功能为支撑,在采集、汇聚上海市科技资源和服务大数据的基础上,实现了科技数据的加工、存储、挖掘、分析、共享和服务,从而促进科技资源科学统筹配置,转变政府职能,促进科技资源共享利用,提高服务水平,提高全社会创新服务效率,推动科技研发服务产业的快速发展。目前该数据中心已拥有全球各类科研资源数据近10亿条,数据总量1120TB,覆盖了专利数据、人才数据、文献数据、基地数据、装置数据等多方面的科技资源内容。在此基础之上,未来上海科技创新资源数据中心筹划逐步将科学数据这一关键科技资源纳入覆盖范围,更好更深入地为科技创新事业提供服务。上海科技创新资源数据中心首席执行官朱悦介绍,上海科技创新资源数据中心将紧跟国家战略和上海推进建设具有全球影响力的科技创新中心的建设要求,用三年的时间深化科技创新资源数据服务,探索科学数据管理体系建设模式,探索共建共赢的科学数据应用模式,优化科学数据服务生态,加强国际合作,全力打造支撑“1+1+N+X”科学数据生态体系的技术载体。其中,重点推动以云架构为基础的综合型科学数据管理平台建设,计划到2023年实现50PB存储的建设目标。同场正式发布的SCIPLUS科研云正是“三年行动计划”的一个良好开端,科研云将利用云计算、大数据、人工智能等前沿技术,推进传统科研工作向科研第四范式转变。(完)

草戒指

整合科研大数据打造智能知识服务平台 中科院文献情报中心“慧”系列产品发布

2018年12月27日上午,中国科学院文献情报中心主办的“慧”系列智能知识服务产品发布会在京举行。发布会现场会上,中国科学院副院长张涛院士表示,随着信息时代的到来,数据信息爆炸式增长,数据密集型科研范式成为重要的科研范式,科研人员对科研信息与科研交互的需求越发强烈。特别是面向学科多元交叉,对从基础研究到应用研究再到市场研发整个创新价值链的文献情报知识梳理充满渴求,并且科技创新研发活动也面临海量数据分散孤立、知识价值难以判断的问题,这意味着科技信息服务手段需要创新,知识服务的内涵需要拓展。“慧”系列智能知识服务产品是在中科院支持下为科学家研发的智能知识服务产品,是在新型知识发现与科学研究模式下,在中国科学院文献情报中心的“科技大数据平台”基础上研发的。该系列产品面向科学家群体,突破了“数据计算型”的知识发现与情报分析范式,解决因科技大数据分散孤立不能整合计算、释放知识价值的问题;解决因科学家收集数据、项目填报重复繁杂难以提升科研工作效率的问题;解决传统数据服务架构弱化用户参与、不能促进数据流动的问题。中国科学院文献情报中心主任刘会洲称,“慧”系列产品从“智能的知识分析、精准的知识发现、及时的前沿跟踪、主动的知识递送、开放的学术交流”五个方面,阐述了“智能、精准、及时、主动、开放”服务理念。以“慧眼”与“慧科研”为代表的“慧”系列智能知识服务产品,正是立足中国科学院科技事业发展的新要求,面向科研人员对知识服务的新需要,依托知识图谱与深度学习技术,实现了海量科技大数据在广度与深度上的计算组织,实现了集成文献检索、精准推送、智能分析、学术交流、资源共享、科研管理等贯穿“科研、交流、管理”全链条的开放学术生态系统。国家科技图书文献中心(NSTL)主任彭以祺表示,这样的服务模式和产品,对满足科技创新引领知识服务的转型和升级具有重要意义,对我国科技文献事业的发展起到了推动作用。科技大数据是国家信息安全的重要组成部分,特别在当前复杂的国际形势下,科技大数据的保障对科研工作有不可替代的作用。在当前这个以数据为创新驱动的新环境中,中国科学院文献情报中心作为国家级的科技文献资源保障机构,很好地抓住了时代机遇,率先建成科技大数据平台,将重要基础性战略资源汇聚协同起来,成为推动科学发现和知识创新的新引擎。(文/谷雨)

红猪

ModelWhale科研版:让科研数据的探索与分析更简单

随着互联网、云计算和物联网技术的发展,社会信息化和智能化程度不断加深,数据充斥着整个世界并渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素。由此大数据发展得到全球性的广泛关注,并深刻地改变我们的生活、工作和思维。如何安全稳定的处理与分析越来越多的数据?如何更便捷地使用定量方法、构建模型、挖掘数据价值?如何让底层计算资源更好地调配、更好支持研究?如何发展出更加适当趋势的共享与协作模式?这些都是随着数据的爆炸增长,大数据时代科学研究所面临的问题,在进行数据科学科研项目的过程中,往往也会面临诸多挑战,如:搭建数据分析平台费时费力、在研究工作外消耗太多精力;重复的编程工作繁琐耗时,大量的分析算法需要适应;任务中间成果交接困难,多角色协作缺乏统一媒介;数据资源、分析资料分散,协调管理工作麻烦;科研过程解释、复现不便,成果价值难以充分呈现;成果的碎片化和保密性让其难以体系化流转。基于目前的科研环境,为了帮助研究团队解决底层工程复杂繁琐、研究成果流转复现困难等问题,ModelWhale科研版应运而生,极大的提升了数据科研的工作效率。ModelWhale科研版:让科研数据的探索与分析更简单、流畅ModelWhale科研版是一个科研团队数据科学云端协作平台,可选择Jupyter Notebook交互式和Canvas拖拽式两种编程界面,支持Python和R语言,提供即开即用的云端分析环境和安全流畅的协同管理功能,支持代码级协作、过程与成果的可视化呈现,为研究团队解决底层工程复杂繁琐、研究成果流转复现困难的问题,使科研生产与协作更加便捷和高效。ModelWhale 科研版,如何为科研机构提供数据科学与人工智能一站式科研解决方案?1、数据获取与管理· 数据可统一管理可将研究所需的各类格式数据上传至 ModelWhale 进行安全统一的管理、展现与共享,也可连接关系型数据库,用户可直接调取使用,而无需下载、存储与重复维护。· 快速了解数据情况对于结构化数据文件,可自动生成描述性统计、频数可视化分布,对于关系型数据库可在线查看、筛选各数据库表与详细字段,方便又高效。· 外部数据轻松获取资源库中整合了和鲸社区5000G+优质的数据集,含50+的企业开放数据、100+的科研机构独家开放数据,都可在 ModelWhale 中直接调取使用。2、数据处理与分析· 即开即用 Python 和 R,各类算力弹性调度基于 Jupyter 范式,自带各类常用工具包和机器学习框架,可管理与自定义环境、调用各类 CPU/GPU 云资源、进行离线训练,而无需担心运维计算环境时的费时费力。· 算法代码片段库提供不断更新的算法代码片段,涵盖数据分析处理、可视化与常用模型,也可自行收藏常用代码片段,可简单便捷地调用与复用,降低数据科学技术运用成本。· 拖拽式编程 Canvas基于图形化的操作,进一步提升团队在预处理数据、数据可视化、机器学习建模的工作效率与体验,自定义常用模块,一键转换为 Notebook 进行代码工作。· 过程和结果轻松可视化Notebook 与 Canvas 详细直观地呈现数据分析与建模的过程,在写代码分析数据的同时,无缝进行思路与说明的撰写;模型支持可视化解析,使模型结构更具可读性。3、团队分工与协作· 任务规划轻松流畅进行任务拆解与分配、进度交流与分享,轻松同步团队进展;资料与成果在知识库中可轻松沉淀与梳理,方便协作者直接查看与使用。· 各自分工的成果一键整合通过一键分享与 Fork,科研工作者可快速复制与复现 Notebook,也可将各自分工独立分析编写的 Notebook、关联数据与模型进行一键整合。· 与和鲸社区生产力协作通过科研版内相关模块发起科研众包需求,在数据处理、分析、建模环节获得和鲸社区10万人才的助力,任务成果可基于 ModelWhale 轻松流转。4、成果管理与复现· 论文手稿写作ModelWhale 可直接用于产出论文手稿,Markdown 编辑器体验良好,便捷使用 LaTeX,结合代码输出和图片上传功能,顺畅记录与呈现论文中的每一个要点· 成果管理与沉淀科研成果数据集、成果模型和分析过程可在知识库中安全便捷地托管,方便相关成果的统一管理与再生产时的快速调用· 成果流转与应用项目输出功能,更方便安全地输出数据、模型等成果,便于上下游无缝流转,支持模型一键发布为 API,便于应用到实际场景中· 轻松交流展示Notebook 的分析过程可直接排版为 PPT,结合 Canvas 和模型可视化解析,轻松呈现过程与结果,方便在与同行交流时更好地展示分析细节· 一键成果复现ModelWhale 能够结构化地记录所使用的数据及背后的分析环境,基于云端即开即用的计算环境,同领域研究者可一键 Fork Notebook 并复现成果和鲸科技的 ModelWhale 科研版,可以帮助导师精准把控项目细节,加快研究进度,让团队成员摆脱繁复的基础工作,迅速进入研究重要阶段,大幅提升科研探索效率和论文质量。同时也让科研团队直接跳过琐碎的运维管理,从繁重的基础工作中解放,无需任何硬件部署和运维,快速在应用层开展研究工作,根据任务需求弹性调度云算力,既高效又经济。截至目前,ModelWhale 科研版已经为清华大学、南开大学、中国医学科学院北京协和医学院等科研团队提供服务,并广受好评。

梦女孩

「科研管理」大数据平台下企业精细化营销体系建设研究

当前我国处于重要战略机遇期,中国经济在经历30多年的快速增长之后,经济增速有所放缓,经济结构不断优化升级,增长动力从要素驱动、投资驱动转向创新驱动,经济发展进入新常态。逐步将告别高速增长的历史时期,迎来中速乃至低速增长的新阶段,消费增长减档换速明显,必须树立抛弃旧的思维逻辑和用新的方式再现高增长的工作思路。这要求公司进一步优化管理模式,有效防控发展风险,提升精益化、集约化管理水平,妥善解决好新常态下的新矛盾、新问题。 1当前我国企业营销体系挑战分析随着经济社会的不断发展,客户的服务意识、法律意识和维权意识不断增强,社会各界对供给侧的关注度越来越高,对供给侧企业服务的诉求变化快、增长多、要求高;同时外部监管从严推进的力度进一步增强,企业发展、服务提升与政府监管之间的平衡问题日益凸显。在新一轮改革发展中,在成本监管、担当有为的要求下,如何践行精益管理理念,承担好企业使命,树立良好社会形象,不断提升企业经营管理水平,满足客户多元化诉求,持续提升客户满意度,对公司经营管理提出新的更高的要求。 2我国企业当前营销能力建设趋势构建客户全方位服务体系,为客户提供“可靠、高效、绿色、智能”的产品服务。2.1构建营销一体化管理体系推进“一部四中心”规划建设,打造客户问题解决中心、数据管理中心、营销服务工作质量监督中心、新媒体宣传推广中心,初步实现营销管理从粗放型向专业化、标准化、精益化转变。上线全网一体化的营销管理系统,更加注重客户体验、更加注重精细化管理、更加注重横向协同、更加注重基层减负,为营销管理提供强有力的技术支持。2.2构建客户全方位服务体系坚持以客户为中心,以客户问题为导向,改变传统营销管理理念,逐步将客户服务工作向细节延伸,更加关注客户感受和客户体验,初步树立全员服务的理念。建立覆盖客户全方位服务体系,建立各级客户全方位服务管理委员会制度;推广客户全方位服务“三项机制”和跨部门重大业务协同全流程;推行客户服务调度,建立客户问题横向协同处理机制。使得投诉难等客户问题得到有效解决,初步建立客户投诉提级处理机制。2.3构建营销精益化管理体系坚定不移投入先进技术的开发与应用,形成技术创新、管理创新和服务创新互促互进局面。充分发挥专业化管理优势,实行计量集中管理和客户服务热线(含服务渠道)集中管理。互联网+、大数据、云计算等信息技术飞速发展,并逐步向营销服务领域深入渗透,将极大地推动客户交互能力提升。通过大数据分析技术更加精准地掌握客户需求,通过公司营销服务手段和服务渠道的丰富和完善,不断满足和引导客户需求,为公司进一步开展技术创新、服务创新、管理创新和商业模式创新提供重要支撑。3我国企业当前营销能力建设需求3.1有效提升企业的市场化竞争能力由于长期处于垄断地位,公司营销系统市场竞争意识不强,依法经营意识、服务意识有待提升;面对体制改革后的竞争性市场环境,当前市场化运营模式和多元化业务体系有待建立,商业模式与赢利点有待研究明确,传统业务与竞争性业务协同互补的良性发展机制尚未形成。市场反应能力、客户需求掌握能力、营销策划能力、营销促销手段执行能力待进一步加强;市场化竞争支撑机制有待优化,现行组织架构有待调整优化以进一步适应市场化竞争环境,同时跨部门协同的竞争合力也有进一步提升的空间。3.2有效提升企业的营销精益化水平要建立精细化的分群管理机制,既规范管制性的供给侧企业普遍服务,又提供竞争性的精细增值服务。受经济形势影响,部分企业经营成本和经营风险增加,公司亟待建立完善灵活、高效的市场化机制和规范化、标准化、集约化的运营管理模式,提升精益化管理水平。企业卓越营销能力框架模型如图1所示。请点击图1企业卓越营销能力框架模型输  4我国企业当前营销能力建设框架根据企业卓越营销能力框架模型,以客户为中心的营销服务体系必须形成客户全方位、全维度、全周期的精益化服务模式。其中,通过南方电网、国家电网等相关企业调研,可以发现卓越营销能力建设关键内容主要包括:(1)全面形成客户全方位服务一体化过程。落实“客户需求传递、客户服务协同、客户服务评价”三项机制,实现跨部门重大业务协同全流程的信息化固化。转变服务意识,做好市场需求和客户需求的信息传递。(2)推进客户中心化互联网服务体系建设。积极研究市场化营销手段,探索互联网+智慧服务等新型服务产品,充分满足和引导客户需求,改善客户服务体验,丰富公司品牌的内涵,实现品牌影响力从传统服务领域向新型服务领域的延伸。5企业当前营销能力建设保障措施5.1优化市场营销组织机构根据营销服务集约化管理要求,建立省级客户服务中心,推进服务计量中心实体化运作,优化营销系统“一部四中心”建设。5.2完善营销人力资源管理根据市场化改革和公司集约化管理要求,进一步研究加强人力资源配置,拓展营销人员职业发展通道。加强营销培训,提高各级营销队伍的业务能力和管理能力。5.3保障营销资金持续投入落实营销信息化建设和远程服务渠道建设资金投入,全面提升一体化营销服务水平。5.4加强营销体系审计建设深入开展巡视整改和审计整改,从发现问题、分析问题和改进问题的闭环机制,持续构建营销能力提升的促进方案。6未来企业营销能力建设发展展望6.1客户服务水平极大提升随着信息化、网络化发展,客户服务需求更加方便快捷、及时高效和远程自助,供给侧企业服务以及分布式接入技术带来的共赢共享服务。随着智能自动化技术、物联网技术、云技术、大数据技术、移动技术、图像识别技术的快速发展、智能化水平不断提升。服务渠道和服务窗口将实现“互联网+服务”,客户管理和企业运营实现数字化,现场作业实现自动化、移动化。6.2深化营销管理的精益化客户信息、客户消费大数据全抓取、全记录,跨行业客户信息共享共赢。营销数据质量常态化监控,数据存储、数据分析、业务应用实现一体化联动。营销管理实现标准化管理,制度、流程、技术规范和作业标准进一步完善。客户服务、计量管理集约化管理水平持续提升,集约化管理持续加强,营销管理规范高效。6.3客户服务渠道整体覆盖传统营销业务全面实现网络化,人工智能、图像识别等技术逐步应用,网络服务、移动服务全面推广,实体营业厅实现向智能体验厅转型发展。竞争性增值服务业务向跨行业领域转型发展,利用“互联网+”,打造综合服务平台,公司产业链、业务链与价值链不断拓展,公司竞争力不断提升。作者:石慧达本文刊发于《中国高新科技》杂志2020年第20期(转载请注明来源)