2021年2月26日,省疾控中心在杭州举办省重点研发计划“基于大数据的新发重大传染病监测预警技术研究”项目启动会,省疾控中心监测所、科信部、余杭区卫健局、余杭区疾控中心、杭州联众医疗科技股份有限公司的相关研究人员共计20余人参加。项目组邀请了省疾控中心蒋健敏副主任和陈恩富首席专家对项目方案进行指导。会上,林君芬所长作为项目负责人对整体项目的立项依据、研究内容、预期产出、经费预算、进度安排、已开展的工作等进行了阐述,并提出几个需要重点讨论的问题。随后,5个子项目负责人分别对各子项目进行了详细的汇报,在阐述研究方案的同时,也提出了研究过程中遇到的问题和困难。两位专家认真听取了大家的汇报,为各位汇报者答疑解惑,并对整体项目和每个子项目都提出了中肯的有针对性的改进完善意见。整个会议过程中,大家积极讨论,建言献策,思想碰撞,气氛十分热烈。通过此次会议,各项目组成员和有关单位对整体项目构架有了更全面的认识,两位专家的建议进一步提升了项目实施的科学性和可行性。新冠疫情期间,大数据在疫情信息管理、推动科学决策、优化资源配置等方面都发挥了积极作用,项目组成员参与绘制的“五色图”更是大数据助力疫情防控的成功范例。新年伊始,砥砺前行,只争朝夕,不负韶华,本次会议开启了项目大数据助推疫情防控科研的新篇章。责任编辑:网站管理员 【来源:省疾控中心监测所】声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 邮箱地址:newmedia@xxcb.cn
被质疑的清华大学博士后清华大学作为中国最顶尖的高校之一,很多学生以本科硕士博士都在清华大学就读感到荣幸,然而在美国学生看起来,觉得非常的不可思议,一名清华大学的博士后赴美学习,当介绍起自己的学习经历,美国的同学都觉得不可思议,在同一所高校攻读本科、硕士、博士在美国学生眼中觉得是不可思议的一件事,因为每一所高校的强势学科不一样,如果竟让在一个学术环境下学习,很容易造成学术研究的局限性,在中国很多高校,学术带头人杰青和长江学者等人才研究的方向,就可以看出这所高校该学科的大概情况,因此在科研圈中,学术流动越频繁 学术生产力也会越高,美国高校非常忌讳本硕博都在同一所高校,首先会滋生学术近亲繁殖,其次会让高校学术科研不会有新的发展方向,因此鼓励学生们进行频繁的学术交流,因此在美国存在大量交换生的现象。中科院院士的数据大调查近日中国青年报对中国两院院士做了数据调查,从2459名的院士中,去除一些早期的院士,以及没有攻读研究生的院士,采集到有效的数据为1068人,其中仅有204名院士在同一所学校接受了从本科到硕士甚至博士阶段的完整的学历教育,有864名院士在本科、硕士、博士三个阶段,至少经历了一次环境的转变,更有很多人经历了两次转变。中科院院士的数据调查也符合美国高校的科研数据,那就是跨高校学习更能体验不同的学术文化圈,更能提升科研工作者的科研视野。例如2017年决定从清华大学离职的颜宁,就像颜宁对自己离开清华大学,在网络中留言说的一样,并不是由于清华大学的科研环境不好,清华大学的科研环境和平台非常棒,只是她希望希望可以换换环境,挑战一下自我,从2018~2019年颜宁的科研数据成果来看,只要是科研大牛,无论在哪一个平台和高校,都会有不错的表现!“自讨苦吃”的颜宁,成就最好的自己其实从清华毕业再到普林斯顿大学求学,海外学成归来,成为清华大学最年轻的教授,在众多质疑的压力下,颜宁把最好的青春十年时光奉献给了清华大学实验室,并且通过自己和同事们的努力,已经让曾经不出名的清华大学生命科学院带到了世界顶级科研机构,为了再次挑战自我,放弃了清华大学优越的条件,重返普林斯顿大学,甚至需要为几十万美元的项目写申请书,但是她从2018~2019年的成果产出来看,颜宁其实选择成就最好的自己,告别尘嚣的大都市换成了一个安静的小镇,普林斯顿大学新的团队成员,来自全球的优秀学者,如何获得思想的碰撞和思维的提升,这也许是每一位科研工作者的目标!因此,2019年已经到了高校保研季,希望不同高校的学生可以从中有所收获,多看看不同地区不同高校优秀的导师,选择自己感兴趣的课题进行申请研究生,清华北大固然好,但是换一个学术环境也许会带给你不一样的学术体验!
大数据和人工智能一直是相互纠缠难舍难分的。没有大数据的发展,就没有现在人工智能的火热,都说大数据大数据,那么这个概念的起源到底回归到什么时候呢?每个互联网概念火之前都会有一个元年,16年是vr元年,17年是短视频直播元年,18年是人工智能元年。那么大数据元年呢?这个大数据元年,要从世界范围来说,应该是2005年。这是一个跟自然语言识别的翻译领域,相关的事件。美国国家每年都会给予相应的科研经费在某个领域上面,自然语言处理在2005年的时候还是各个实验室的重点项目,过年每年都会投入大量的经费在上面。所以美国政府每年都有一个关于,该领域的翻译比赛。除了拿了科研经费的机构需要参加之外,其他公司也可以参加。谷歌,就是在2005年是第一次参加该比赛的。2月份参加测试,然后4月份测试结果出来之后确是让大家大跌眼睛。第一次参加测试比赛的谷歌夺得了第一,并和第二拉开了很大的差距。这就有一点匪夷所思了。就连,闻名遐迩的IBM沃森实验室也只排第三,而且数据跟谷歌相差甚远。按正常的科技进步带来的机器翻译分数的增长,每年大概也只有0.5%。那就是说谷歌比第二名第三名的科技领先20年左右,很明显是不可能的。原由事后才知道原来是因为谷歌,雇佣了世界上最著名的机器翻译领域专家奥科博士。而奥克博士也透露谷歌的成功并不在于技术的进步。甚至,他们这次用的方法还是两年前的方法,不过是将已存的数据扩大了很多倍。由于谷歌本身行业的特点,在此次的翻译测试中,谷歌团队使用了比其他研究机构多几千,甚至几万倍的数据。最终的结果大家也看到了。平常大家由于都是学校或者是研究机构。没有这个用超级多的数据的先例,所以各家所提供的数据,上下即便有差别,也顶多是几倍几十倍的差别,对于结果影响并不是很大。可能会由于其他的数据处理的方法的影响,甚至会产生相反的结果。但谷歌不同,这是由于量变产生了质变的影响。奥科当时使用的数据产生的模型是六元模型。也就是一个单词前后六个单词都有关联性。这已经基本上和现在翻译技术相看齐了,而参加测试的其他的研究机构构建三元模型,也就是前后只能考虑三个单词的关联性。这明显和六元模型不是一个量级。果然随着这个,秘籍的透露。在第二年,各个研究机构都比之前使用的数据多了上百倍的差距。最终的结果就是跟谷歌的差距拉小了很多。到现在,由于互联网的发展。网络上的数据呈现裂变式的增长,各个领域的数据开始出现交叉,形成无数个密集的点。各个点之间相互的关联性将网络数据织成一张密集的网,产生海量具有不知名关联性的数据,形成大数据。大数据起源虽然说从05年谷歌那次翻译事件开始。但是真正成为流行语被广泛传播开来,还是在09年之后,随后和云计算一起成为新兴的互联网代名词。本文由“科技快闪”原创编辑,素材整理来源于网络,图片素材来源于网络,创作不易,如有转载,请注明出处!如有侵权,请联系删除!谢谢支持与理解!
北方工业大学位于中国首都北京,前身是创立于1946年的“国立北平高级工业职业学校”。由中央与北京市共建,以北京市管理为主,是北京市重点建设的多科性高校,也是教育部“卓越工程师教育培养计划”院校,是国家首批“卓越工程师教育培养计划2.0”、“新工科研究与实践项目”入选高校。 截至2018年12月,学校有北京市重点实验室2个,省部级研究中心6个,校级研究所10个。北方工业大学承担了国家自然科学基金,“863”计划、科技支撑计划等在内的国家和北京市重大和重点项目,完成了千余项企业合作横向课题,承担如国家电网、国家电厂、海洋大数据等数据存储、实时数据分析处理等第三方托管业务。 作为国家电网、国家电厂、海洋科研院所等上千企业实时大数据科研平台,北方工业大学科研大数据平台承载了庞大的数据存储和分析处理任务,而传统架构无法灵活扩缩,缺少体系化的云平台支持大数据和AI工具,导致IT基础设施对大数据业务的支撑能力明显不足。 基于中国开源云计算的领导者易捷行云EasyStack在教育、科研行业的诸多最佳技术实践,经过严格的竞标与技术选型,北方工业大学决定选择EasyStack ECS易捷行云企业云构建科研大数据云平台,对北方工业大学的众多科研项目和大数据业务进行有力支撑。 无缝整合云与大数据平台 助力科研效率提升北方工业大学科研大数据平台通过对具有来源多样化、海量以及增长快速特征的信息数据的分析,洞察,为企业和科研院所提供进行数据决策依据,以分析结果形成企业的输出能力创造新形态的业务模式。 ECS易捷行云企业云平台通过与大数据平台软件的无缝整合,能以 Analysis-as-a-Service 的方式提供给高校,大幅降低了云平台大数据分析业务的技术门槛。该大数据分析服务支持大数据集群的自动化部署、弹性扩展和监控运维,支持一站式解决科研大数据平台的应用和管理难题;同时支持 Hadoop、Spark等多种大数据集群,满足可学校根据业务需要灵活地选择适合的集群执行分析任务的需求。 “黑科技”解放科研人员双手值得注意的是,ECS企业云提供的CDH 5.4.0集群的生命周期管理从很大程度上解放了科研人员的双手, 在集群中,ECS企业云平台预装了包括 HDFS 分布式文件系统、YARN 任务调度及资源管理系统、HIVE 数据仓库工具、ZOOKEEPER 配置一致性管理工具、OOZIE 工作流管理工具等大数据分析场景支撑组件,通过界面就可以快速创建,调整集群的大小。 而面临不同品牌、多种型号的服务器、存储等混杂资源,该项目在利旧基础设施资源的同时,也对云平台的兼容性、弹性、稳定性提出了较高要求。ECS云主机管理模块支持与多种 Hypervisor 软件的管理集成,架构上是基于插件方式来实现,其带来的优势是不需要改变平台总体架构就可以方便地通过Hypervisor 层的驱动插件,实现对新种类的 Hypervisor 软件的支持。目前ECS领先业界支持多虚拟化平台包括 KVM、VMware、XEN 和 Hyper-v,同时还率先增加了对 PowerVM 小型机虚拟化的支持。 ECS 云主机管理模块在资源层面对底层虚拟化技术的封装,对上层用户来说他们不再需要关心云主机是通过那种 Hypervisor 软件创建的,不需要考虑底层技术的兼容性问题,所有云主机抽象为一种按需使用的计算资源,并且具备秒级获取云资源、支持多种操作系统、实时监控、弹性灵活的特性。 此次,北方工业大学科研大数据平台的云硬盘后端采用分布式架构存储,具备海量扩展能力,并且存储数据时基于多副本机制,支持数据的快速重建,有效避免了任意节点故障导致的数据丢失,大幅提升了存储系统的 SLA 水平,该云平台具备高性能、支持备份与恢复、弹性扩容、多后端支持的特性。 未来,北方工业大学将逐步适应云平台资源使用方式,并持续验证平台的适用性和稳定性。北方工业大学在经历二期扩容后还将结合业务规模进行科研大数据云平台的后期升级。
近日,中科天玑中标中国矿业大学管理学院大数据科研管理平台项目。中国矿业大学管理学院创办于1953年,拥有先进的多媒体教室、案例讨论室、经济管理电脑模拟实验室、企业经营决策沙盘模拟实验室、团队精神实训基地和现代图书信息中心等设施,专注教学的同时,学院还注重学生创新意识和开拓精神的培养,通过理论学习、案例分析、学术讲座、团队训练和企业实地考察等教学方式,提高学生创新和创业能力,培养学生分析问题、解决问题的能力。积极开展与企业及政府的合作,举办各种类型、多种层次的教育培训,不断探索各种联合办学的新模式,在40多家大型企业建立了教学实践基地。为更好的提升学院教学质量水平,在更高起点上推动学校在大数据科研以及创新方面再上新台阶,中国矿业大学管理学院积极拓展大数据相关专业教育教学新模式,将教学科研创新、专业人才培养与大数据紧密融合在一起,因此,选择了中科院计算所大数据方向唯一产业化平台中科天玑,为其搭建专业的大数据科研管理平台。此次,中科天玑为中国矿业大学管理学院搭建的大数据科研管理平台的建设目标是,通过购置支持用户管理及权限管理系统、计算资源共享管理系统、SPARK集群管理平台、docker容器管理平台等软件设施,建立支撑全校师生开展大数据技术研究与应用科研创新的权限管理中心、计算支持中心。通过购买国内外相关软件,支撑学校师生在开展采集、数据分析、机器学习、深度学习及人工智能应用的计算能力支撑。确保能支持高并发、稳定、计算能力强的服务集群,实现高校师生在平台之上开展不同行业领域的大数据科研创新实验课题需求。此外,中科天玑自主研发的大数据教学实验平台也将应用其中,该平台以教学为中心,提供丰富的教学资源,包含教学视频、教学文档、实验手册、实验视频、习题测验等,辅助教师进行课程教学,方便学生与教师进行交互式学习,实现高效的师生互动教学模式;以科研为导向,提供便捷的交互式图形用户接口及丰富的算法库,极大的简化大数据分析科研实验流程,方便师生在平台上进行快速建模与调优,极大的简化了教学模式,实现了完整的教与学闭环流程。高校作为高科技人才以及创新技术的摇篮,承载着科研攻关和人才培养的双重使命。在新的科技浪潮中,大数据会越来越重要地为教育提供更多赋能与可能。未来,中科天玑还将持更开放的态度,寻求与更多与高校合作的机会,助力教育大数据创新合作模式的发展,全面提升教育大数据应用的整体水平和产业竞争力。
全球医疗数据在以每年48%的速度增长,但是大部分数据仍然无法被患者和医疗系统访问。如何释放医疗数据的潜力成为本届达沃斯论坛上热议的话题之一。在海外,谷歌、亚马逊、苹果等科技巨头都纷纷进军医疗大数据领域,利用在人工智能和深度学习方面的的优势,帮助研究机构和药企进行新药研发和患者监测,并开发出与消费者健康相关的产品。在中国,包括阿里巴巴、腾讯、百度在内的平台型超级公司,也都开始涉足大数据医疗行业,科技与生物医疗的结合将正在成为趋势。医疗大数据平台的崛起贝恩公司合伙人Henrik Naujoks在达沃斯论坛期间对第一财经记者表示:“健康医疗平台的崛起势不可挡,我相信未来十年仍然是平台的十年。过去是那些阿里巴巴和腾讯或者亚马逊这些超级平台,现在我们看到越来越多更小的专用平台的崛起,他们更有针对性,围绕健康医疗服务建立起周边的生态系统,这些用户数据会产生很大的价值,也会提升用户黏性。”有数据显示,2018年中国医疗健康大数据市场规模达46亿。大数据在医疗上的应用包括:健康监测、疾病预防、临床辅助决策、互联网医疗、医药研发等方面。通过互联网医院、智能硬件、医药电商等进行辅助医疗,将大大提高医生工作效率和诊疗质量。李克强总理在达沃斯论坛上明确提出,要在民生需求中寻求投资热点,用于改善民生需求。在这过程中,中国14亿人消费市场潜力无限,健康医疗无疑是一个最为可观的市场。成功开发了某医疗大数据智能平台的开心生活科技控股集团创始人、董事长宫如璟在达沃斯论坛期间对第一财经记者表示:“过去一款新药研发的产业链和开发周期都非常长,中间有太多的利益相关方,从而大大增加了新药开发的成本。我们现在提倡绿色医疗,就是要通过人工智能等新的技术,把这个产业链条和周期都大幅缩短,减少新药开发的时间和成本。这对于患者和药企都是很有意义的。”自成立以来,该公司花了10亿人民币打造这样一个医疗大数据处理平台,形成了一套从数据的清洗、提升数据质量,再到数据结构化、标准化的流程。“这个平台就是我们一切应用的基础,大规模机器学习和医疗人工智能的认知系统就是建立在这一平台之上。”宫如璟对第一财经记者表示。利用人工智能的模拟技术,一款新药在研发之前就已经能够通过数据库的连接,模拟出疾病、药品和化合物的形态,在此基础上再去做临床试验的成功率会大幅提升。“我们利用组合模型、大规模运算和大数据分析等技术,推动精准医疗的发展。”宫如璟对第一财经记者表示。她还表示,过去研究人员在开发出一款新药前,就好像是在盲人摸象,他们不知道可能发生的情形,只能通过不断试错。“但有了大数据作为支撑后,我们能够让这些最聪明的大脑,预见到现实可能发生的情况,从而降低他们的试错成本。”宫如璟告诉第一财经记者,“现在我们已经基本能把新药研发成本降低三分之一,甚至在一些情况下能把成本降低三分之二。”如今,开心生活科技每年都投入3-4亿人民币投入研发,与国际医药巨头和国内领先的生物医药公司合作,为其提供医疗大数据的支撑。跨界人才数据保护是最大挑战达沃斯论坛上,与会人员指出,我国健康医疗大数据产业在全球处于同步发展的状态,一大批医疗大数据公司的诞生正是瞄准了这一国际前沿的趋势。预计到 2035年,我国的健康产业有望超越百万亿元人民币,形成以数据驱动的新经济,带动经济转型升级与提质增效,优化经济结构,尤其是与卫生健康等我国居民消费的重要领域相结合,将以裂变方式引领跨界融合,丰富新经济内涵,成为世界新经济的竞争高地。挖掘医疗大数据无疑能够解决重大民生问题。不过挑战也是显而易见的。在宫如璟看来,跨界与前沿交叉人才缺口较大是目前行业所面临的普遍问题。“健康产业既是国家新兴战略科技产业,更是重大民生所系,但是这种人才培养极度困难,更多是实践中自我磨炼成长起来的。”宫如璟表示,“要把健康医疗大数据与医疗人工智能产业培养成国民经济重要支柱产业,需要组织好跨界人才队伍建设。”德勤中国创新业务负责人刘明华也对第一财经记者表示:“从生物医药行业来看,打破人才和资金流动的壁垒,吸引更多国际化的跨界人才,将是决定我国健康产业是否能够进入到下一阶段与全球第一梯队创新型国家竞争的关键因素。”值得注意的是,在加强安全与隐私保护越来越受关注的今天,如何确保医疗大数据的安全不被泄露,是一个更大的课题,也引起了达沃斯论坛嘉宾的热议。凯撒医疗集团执行副总裁、首席信息官Richard Daniels在一场医疗数据分会上表示:“确保医疗数据必须以人为本,要制定开放的标准来推动创新,并且建立起对数据收集和共享工作的信任,这是让医疗大数据发挥更大优势的前提。”
4月20日,由中国科学院深圳先进技术研究院(简称深圳先进院)、中国科学院深圳理工大学(筹,简称中科院深理工)、《大数据挖掘与分析(英文)》编委会联合举办“大数据高端论坛”,这也是中科院深理工计算机科学与控制工程学院自筹建以来的首次大型交流活动。本次论坛以大数据为核心展开讨论,与会专家学者围绕大数据、人工智能、网络安全、分布式系统等内容展开探讨与交流。会议开始,中科院深理工筹备办主任、深圳先进院院长樊建平致欢迎词,对计算机科学与控制工程学院发展及“大数据高端论坛”的成功举办给予期望,并表示中科院深理工由中科院与深圳市在建设粤港澳大湾区和中国特色社会主义先行示范区的背景下共同举办,将充分结合并发挥双方优势,强强联合,打造成为具有特区精神的国际一流研究型大学。会议环节由计算机科学与控制工程学院院长潘毅教授以及李建中教授主持。中国工程院郑纬民院士以“AIPerf和MadFS”为题,论述了目前计算特征的演进,即从传统的数值超算逐渐向融合智能计算转变的趋势。在此基础上,郑纬民院士提出,“我们需要一个人工智能算力基准测试程序,一是给公众一个简单的标准来回答哪套系统更为强劲,二是说明了用于传统高性能计算机的测试结果与人工智能需要的性能不完全一致”。郑纬民院士强调,目前使用的文件系统不能满足新一代的人工智能、大数据、机器学习等应用,因强化对新的存储系统结构的重视程度。原华中科技大学计算机学院院长金海教授针对“区块链系统的技术挑战:分布式系统观”的主题,概述了区块链基本特点以及分布式系统技术的发展路线、面临的核心技术瓶颈及对区块链技术未来发展的看法和展望。目前,区块链技术在共识协议、数据存储、网络通信方面仍然面临挑战,且大部分区块链应用仍然处在未成熟阶段。金海教授指出,未来区块链将数据模型将从链式区块链到图式区块链的转变,实现底层数据存储的融合、区块链网络加速、健壮的网络监管机制等。欧洲科学院院士,原上海交通大学电子信息与电气工程学院计算机系主任过敏意教授则主要就“面向人工智能新特性的计算架构设计”进行分享。过敏意教授认为,以CPU为代表的传统计算系统已经进入算力瓶颈,因此需要人工智能专用芯片架构来满足人工智能发展的算力需求。目前市场上已有一些成熟的芯片,但人工智能新的计算特性也会带来一系列的挑战,包括算法迭代更新、模型黑盒特性、模型稀疏特性等,可以通过新型的专用与通用架构的平衡设计并借鉴程序分析方法来解决上述问题。原东华大学校长、原同济大学副校长蒋昌俊教授作了题为“网络交易风险防控”的报告。蒋昌俊教授强调了网络交易的风险以及对于风险防控的重要性,阐述了其团队研究的成果以及贡献,即建立了并发系统行为能级体系与流量计算方法、提出了网络资源管理与优化的虚拟调度技术和实现网络交易风险防控的行为认证技术。随后湖南大学计算机学院院长李肯立教授以及中南大学计算机学院院长王建新教授,分别主持了“大数据理论研究”以及“大数据应用”两个会谈。参会嘉宾有中科院深理工学术委员会主任委员赵伟,深圳先进院数字所所长乔宇,电子科技大学研究生院院长罗光春,原东南大学软件学院、计算机科学与工程学院院长罗军舟,四川大学计算机学院(软件学院)院长吕建成,英国莱斯特大学信息学院院长刘路,深圳大学大数据技术与应用研究所所长黄哲学,西南交通大学信息科学与技术学院副院长杨燕,北京航空航天大学计算机学院科研处副处长李建欣,浙江工业大学计算机院党委书记范菁,中南大学计算机学院副院长李敏以及中科院深理工计算机科学与控制工程学院院长潘毅、系主任唐金陵、讲席教授李建中。嘉宾在会谈中积极发言,不仅分享了各自的学术成果,更针对大数据这个话题,提出了自己的见解,座谈氛围热烈。论坛最后,潘毅对本次“大数据高端论坛”进行了总结性发言,并对出席嘉宾表以谢意。潘毅表示,期待通过科教融合与产教融合,建设好中科院深理工计算机科学与控制工程学院,解答好“我们为什么要用大数据”“通过大数据能够实现哪些突破”以及“培养什么样的新时代大数据人才”之问。文/广州日报·新花城记者 王纳图/广州日报·新花城记者 王纳广州日报·新花城编辑:刘影
2015年8月,国务院印发了《促进大数据发展行动纲要》,明确提出落实信息安全等级保护、风险评估等网络安全制度,建立健全大数据安全保障体系,强化大数据安全支撑,采用安全可信产品和服务,提升基础设施关键设备安全可靠水平。郑州师范学院“可信计算与大数据科研团队”即成立于这样的背景之下。该团队在工作模式上坚持技术研究为主,兼有理论研究和教学的功能,并采取开放式研究体制,通过产学研结合,促进成果转化。作为一个年轻的科研创新团队,“可信计算与大数据科研团队”无论是团队带头人还是团队成员都具有良好的敬业和合作精神,成员之间具有较好的互补性,已形成了以团队带头人为核心,青年骨干为主体的创新群体,富有创新活力和发展潜力。一、优秀带头人,凝聚团队力量团队带头人公备,博士,教授,硕士生导师。毕业于北京工业大学,现任职于北京工业大学计算机学院,北京工业大学日新人才计划入选者。在可信计算,物联网的研究上取得显著成果:发表可信计算和物联网研究领域SCI/EI论文二十余篇;担任国家发改委移动互联专项:面向电商的移动互联网大数据关键技术研发及产业化项目子课题移动互联网大数据平台方案设计及安全保障技术负责人,负责大数据安全机制研究;主持国家青年自然科学基金一项:物联网感知节点可信运行关键技术研究;主持北京市组织部青年人才骨干项目资助,智慧城市中物联网可信运行关键技术研究。项目负责人胡明生,博士,教授。郑州师范学院信息科学与技术学院院长,软件科学研究所所长。河南省教育科研计算机网专家委员会委员,河南省青年骨干教师,郑州市科技领军人物,青年科技专家,河南省教育厅学术技术带头人。在数据挖掘与决策支持系统领域的研究中取得显著成果:参与完成1项教育部博士点基金项目,获教育部科技进步一等奖;主持完成河南省自然科学基金1项;参与完成国家自然科学基金2项;参与《北斗/GPS基站时钟》项目,获郑州市科技进步一等奖;主持2项郑州市科技攻关项目,均获郑州市科技进步二等奖;SCI/EI检索论文12篇。现主持国家自然科学基金项目1项,河南省重点科技攻关项目1项。公备教授与胡明生教授在团队中发挥了极强向心力作用,是整个“金字塔”的“塔尖”,带领团队朝一个方向发力,在整个团队中起着核心的领导作用和模范示范作用。团队现已吸纳成员7人,其中教授2人,博士2人。该团队以其灵活的组织形式和管理模式,灵活地根据创新任务需要,汇聚人才,整合资源,开展科研、教学、管理等各领域的创新攻关工作。同时,创新团队内部独特的“传、帮、带”效应和学科汇聚作用,更是适应了培养高层次创新型人才的需要。二、紧扣时代脉搏,凝练学科方向该团队在信息安全的大背景下,电子商务的信用体系和安全性是首要考虑的问题。可信计算技术在自主可控的机制下建立了立体数据防护的强安全体系,完整的实现了不安全的进不去、打不开,拿不走,赖不掉的目标。团队将进一步研究可信技术在电子商务场景下的应用、安全策略和相应的产业化推广,拟开展以下四个方面的研究:(一)电商大数据研究与指数发布。利用大数据思维、互联网手段,整合跨境电子商务的海量数据,实现海关、商检、外管、国税等“数据化”监管,实现金融、物流、仓储等领域的“数据化”服务,全面建立适应跨境电子商务发展的新型行政管理服务体系,为基于大数据分析的政府管理创新提供经验借鉴,为转变政府职能、打造效能型政府提供新思路。(二)可信电商平台研究与推广。在信息安全的大背景下,电子商务的信用体系和安全性是首要考虑的问题。团队将进一步研究可信技术在电子商务场景下的应用、安全策略和相应的产业化推广。(三)大数据背景下的物联网安全研究。在物联网中,进行安全对策研究,使物联网得到健康和有力的发展。(四)大数据背景下物联网感知层的可信度量机制研究。针对目前的可信度量机制无法适应物联网异构感知环境的缺点,在物联网感知层可信网络连接模型的基础之上,对非运动感知节点和运动感知节点分别进行可信度量;在可信度量基础之上,研究基于节点可信度量的节点反馈控制机制。三、协同攻关,平台育人通过团队的不断发展,期望能够建立以人才为核心的多元的激励机制,能够激发成员持续地学习创新,并愿意为团队绩效的完成做出积极的贡献。在团队的建设中,继续凝炼鲜明的团队方向,突出团队特色,强化团队优势;进一步加强学术队伍建设,提高团队自主创新能力;开展广泛的科研合作和技术交流,提高团队学术水平。最终形成一支具有国内领先水平和创新能力的“可信计算与大数据科研”团队。该团队在未来将努力实现团队科研工作建设的提升和突破:在建设周期内主持并完成国家级项目1项,省部级项目2项;发表高水平学术成果8篇以上,培养国家、省部级人才3人,签订产学研合作项目5项。做到以学校为源头、地方区域为中心,全方位支撑行业产业转型升级,以产学研地深度结合推进人才培养、科研创新、产业升级全面提升。科研创新是大学的基石,在建设的平台上,“可信计算与大数据科研团队”将继续以特色学科、创新平台为依托,产学研并重,协调发展,不断提高学术水平,让科研创新成为郑州师范学院发展的内生动力,推动郑州师范学院科研事业再上新台阶。
模拟脑神经网络,探索人脑上亿个神经元之间是如何连接与工作的,带来每秒高达100TB数据高吞吐量;脑疾病研究中,通过数万份患者数据验证抑郁症与睡眠治理不佳的脑区有重合之处;在自动驾驶车辆每天产生了数十TB数据中训练视觉识别算法;天文专家从数十PB海量数据中分析发现新天体……如今在科研领域,数据正在发挥着越来越重要的作用。尤其是随着数据采集、存储等技术的不断提升,海量数据的出现彻底改变了传统科研模式。继实验科学、理论科学、计算科学之后,基于“数据密集型科学”的科研新范式在大数据时代下,受到越来越多科研人员的青睐。在“数据密集型科学”的科研新范式驱动下,高校、科研机构加速构建人工智能与大数据平台、为不同学科提供创新基础设施成为当务之急。但由于科研聚焦前沿研究,且不同学科之间存在着很大的差异性,造成对于数据的计算、采集、存储、管理和利用的需求不尽相同,也让高校的人工智能与大数据平台加速向更高水准演进。1数据要素成为科研的驱动力科研范式因为大数据而迅速改变。正所谓是“巧妇难为无米之炊”,即便理论再“高明”、算法再先进,缺乏数据的支持,再好的研究设计都得“半途而废”。如果科研数据越多,研究人员就可以利用大量数据的相关性、可取代因果关系和理论与模型,基于海量数据间的相关性验证更多研究想法和理论,获得更多新知识和新发现。例如,在当前非常热门的类脑科学研究,有一个重要的方向就是多模态多尺度数据分析理论与应用。首先建立脑成像中心,全套磁共振成像设备对小动物或者人体进行脑成像,不断采集和分析脑科学数据,构建起多模态多尺度脑数据库;然后,在利用模式识别、深度学习等类脑智能方法寻找基因、脑影像和认知功能的诊断指标,以揭示脑疾病致病机制、提升脑疾病临床诊断以及药物疗效评估的准确性和效率。“目前高校数据量增长的确非常大,很多科研领域对于各种科研数据的收集也非常重视。”复旦大学大数据学院副院长薛向阳教授如是说。如何理解数据密集型科学与之前计算科学之间的区别,两种科研范式似乎都需要通过大量的计算、数据来完成科学研究。但计算科学通常是先提出可行理论,再搜集数据,之后通过计算仿真进行验证;而数据密集型科学则是先通过采集大量的数据,再通过计算与分析获得新知识和新发现。“数据密集型科学”的科研新范式核心挑战还在于数据。科研数据的数据密集型,具有不可重复性、高度不确定性、高维、计算高度复杂等特征。如今越来越多科研人员,面临的不是缺少数据的难题,而是海量数据环境下如何存储、管理和利用数据,这对于科研数据底座的存储在容量、性能、扩展和管理等方面提出极高的要求。薛向阳教授介绍:“我们正在建设一个人工智能与大数据的开放共享平台,就是希望为科研工作者解决数据存储、管理和利用等方面的挑战,让数据更好地为科研所用。”2科研新范式不应被存储所束缚与其他行业相比,高校与科研机构在建立人工智能与大数据平台时,对于存储的要求更高,往往需要存储这个科研数据基础设施有效解决数据存不下、管不好、用不顺等挑战。具体来看,如今的高校与科研机构普遍都在加速向“数据密集型科学”的科研新范式转变,多学科、交叉研究的现象很常见,都重视科研数据的采集与存储,直接导致了底层存储的巨大压力。以脑科学与类脑研究为例,其所产生的数据主要以影像大文件为主,并包含了大量临时小文件数据。由于需要存储的数据量极大,并且始终保持着很高的增长速度,很多科研机构之前采用传统纵向扩展的存储很快出现明显瓶颈;也有一些天文研究机构,一开始寄希望于通过公有云的方式来保存数据,但是随着数据不断积累,通过公有云的方式不仅带来了额外的带宽成本,还存在效率等方面挑战。“当前很多高校的研究都是基于大数据,首先最关键的是将数据存下来。”薛向阳教授直言道。除了将数据很好地存下来,高校与科研机构大多都渴望将数据流动与共享起来,但现实情况却是数据管理粗放、不够精细化,数据共享低效、管理困难。比如在高校中,经常会遇到一份科研数据同时被多个课题组所使用,每个课题组都需要拷贝一份数据,在不断科研过程中,又各自产生了大量不同的数据,最后衍生出多种版本,让数据管理的复杂度大幅升上,降低了数据功效与流动的效率。另外,因为学科的不同,对于存储的性能、功能要求也是千差万别,没有强大的存储做支撑,往往让科研人员用不顺。例如,从事机器视觉研究的人员,对于存储空间极度渴求;模拟脑神经网络相关的研究,当前只能模拟不到5%,要想100%模拟需要100 TB/s的通量,则对于数据存储性能和带宽要求极高,且挑战巨大。薛向阳教授表示:“高校应用偏科学研究,很多应用都较为超前,对于存储功能层面一直会产生新需求和新挑战。”“一直以来,浪潮都跟国内外多所高校进行紧密合作。高校科研领域的确走在数据存储场景应用的最前沿。”浪潮存储产品线副总经理周川如是说,“浪潮存储有一些新功能、新思路都是在与高校、科研机构的深入合作中产生。”例如,针对高校多个学科与多个课题组共享、使用、管理数据会产生多份数据的难题,浪潮存储为用户定制的软拷贝功能,在元数据和索引上做变更,用户视角是多份不同的文件,但底层则是共同的存储空间,只有数据修改和写入才会增加新的存储空间,实现多份数据极速拷贝和使用,还大幅降低存储容量开销和管理成本,让数据共享、使用变得更加高效。浪潮存储资深架构师叶毓睿介绍:“软拷贝功能是浪潮存储在科研场景实践的一个小注脚,它带来了两大直接好处:一是数据共享加速,第二则是提升存储效率。”3新存储让科研新范式步入快车道今年初,国家正式提出加快数据中心、5G等新型基础设施的建设进度。国家发改委之后则首次指出,创新基础设施为新基建三大范围之一,包括科技基础设施、科教基础设施等,重点支撑科学研究、技术开发等工作。随着中国高校科研费用投入逐年增加,多个科研领域取得诸多突破与成果,创新基础设施的重要性也日渐突出。为此,浪潮存储今年提出新存储之道,在“云存智用、运筹新数据”理念的基础上,推进“存储即平台”战略,打造存储的极致性能、容量、管理等七大核心能力,为创新基础设施构建坚实的数据底座,让科研新范式进入到发展的快车道。例如,在一些注重数据存储性能的科研场景,浪潮存储专门为高频访问的元数据和日志数据“开小灶”,采用SSD盘承载元数据和日志数据显著提升热点数据访问速度,并针对不同数据类型的场景进行优化,让每种场景都能够快速访问、使用数据。又如,针对高校与科研机构运维人员较少、专业度有限的情况,浪潮存储基于智能存储管理平台InView,将人工智能技术融入存储系统,对存储系统进行集中管理、智能监测和故障预测报警,大幅降低科研机构日常的运维工作,并让运维走向自动化和智能化,从而更好地保障各种科研项目的顺利进行。不仅如此,针对高校科研领域对于数据存储需求趋势,浪潮存储积极调研与深入沟通,在新存储之道中聚焦新架构、新介质和新能力的打造,在EB级容量、亿级IOPS、TB级带宽、7个9可靠性、存储自治等关键新能力上提前布局,为科研的数据底座“厉兵秣马”,提前做好准备。总体来看,浪潮存储近年来为构建强大的科研新基建不断“加码”,除了复旦大学类脑智能科学与技术研究院、清华大学RUSH、华中科大苏州脑科学研究院、中国天眼等一系列明星科研项目中积累了丰富的实践经验外,还在科研领域打通用户需求洞察、场景功能适配与前沿技术创新,形成良性循环,让科研新范式加速步入发展的快车道。
通讯员 刘积舜 王宇鹏 中青报·中青网记者 邢婷“喂!何老师,郧阳的疫情发展情况不妙。您能否帮忙研发软件为政府科学决策提供支持?”1月28日,农历大年初四,中国石油大学(华东)海洋与空间信息学院青年教师何亚文收到了来自湖北郧阳的求助电话。打来电话的是湖北省十堰市郧阳区扶贫办负责人,目前是疫情防控指挥部成员。2017年初以来,何亚文一直通过扶贫办为当地精准扶贫工作提供大数据支持。从这一刻起,远在山东青岛的何亚文科研团队投入了一场远程监控郧阳新冠肺炎疫情的战斗,以大数据为当地战“疫”提供强有力的智力支撑。郧阳,位于湖北省十堰市,辖区64万人。2月初以来,这里也成为全国抗击新型冠状病毒肺炎疫情的主要战场之一。彼时,新型冠状病毒肺炎疫情已从武汉蔓延开来,湖北省各市州均成为重灾区。放下电话,何亚文火速召集团队,讨论研发方案,开始了网络协动、远程办公。几位研发核心成员过年回农村老家,没有电脑,只能满村跑去借。团队核心成员胡嘉良的孩子刚6个多月,他每天都坚守到凌晨,直至郧阳的数据发过来处理完才休息,一天24小时几乎是连轴转。仅用两天时间,何亚文团队便完成疫情数据收集、数据分析、建立了疫情数据库,完成了“郧阳疫情”APP的开发和“郧阳疫情专题地图”的制作。早在2017年,何亚文和他的团队就开始了大数据扶贫的探索,并先后研制了面向建档立卡贫困户管理的“扶贫通”平台、面向驻村工作队员的“四双帮扶”APP平台以及面向政府领导决策指挥的“精准扶贫大数据监管平台”,为郧阳的精准扶贫工作提供了成熟的技术支持与服务。不仅如此,其间,团队围绕“三率一度”等指标开展入户调研,走遍了郧阳所有乡镇的重点贫困村、重点贫困户。在几年的精准扶贫工作中,何亚文团队建立了一整套效果显著的面向村一级的管理机制,特别是收集了庞大的本底数据。“这一次抗击疫情,我们这些平台和数据再次彰显了其力量。”何亚文介绍,基于前期精准扶贫工作对全区人口的普查数据和全区高精度地图数据,“郧阳疫情”APP和“郧阳疫情专题地图”得以快速研发和制作,并实现了实时联动,对全区疫情数据动态变化进行监控、展示与分析。“我们从网上看到的疫情地图一般是省、市、区(县)一级,而‘郧阳实时疫情专题地图’则到了乡镇、村、户一级。”谈及地图和APP的创新点,何亚文认为其首要显著特征就是建立在大数据基础上的到村、到户精准显示,其次是APP和地图实时联动,从多尺度时空动态地图上可看到确诊病例、新增病例等信息及其多日的动态变化过程。2月1日统计,郧阳自武汉返乡人员就多达7000多人,其中发热人员近100人,形势非常严峻。郧阳当地各级政府正是借助何亚文研发的APP和地图进行疫情研判、指挥调度,做到科学防治、精准施策,很好地实现了以社区(村)为单元的返乡人数、武汉返乡人数、发热人数、确诊病例的核查与管理,有效控制了疫情的输入、传播和蔓延,实现了疫情登记全覆盖、疫情监测全过程、疫情管理数字化、疫情研判科学化。自2月14日以来,全区已多日无新增确诊病例。“通过对各类数据的综合分析,我们不仅可以确立疫中、疫后的处置方案,还可以明确疫情对各项扶贫工作,甚至对每一个贫困家庭的影响。”在何亚文看来,这次突发的疫情监控软件开发,既是战“疫”,更是为后期扶贫发力进行大练兵。据了解,疫情APP还被应用在山东省临沂市扶贫和疫情防控工作中,基于临沂市前期的扶贫工作,疫情APP的部分功能主要实现了全市涉农企业的复产复工情况的监控与调度。“未来,我们将研判疫情对精准扶贫工作的影响,便于当地采取进一步帮扶措施,保障脱贫攻坚工作的顺利完成。”何亚文对未来的科技扶贫有了更新的期待,“我相信,有了这些机制和数据的支撑,大数据管理将不止在疫情防控方面,在乡村振兴、乡村治理等方面也必能取得很好的效果”。(来源:中国青年报客户端)