欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
上海市环境科学研究院胡冬雯:上海将鼓励企业开展ESG信息披露每更为失

上海市环境科学研究院胡冬雯:上海将鼓励企业开展ESG信息披露

来源:澎湃新闻原标题:绿色金融全球瞰|胡冬雯:上海将鼓励企业开展ESG信息披露3月27日下午,来自中央财经大学、中国社科院、复旦大学、上海环科院的四位嘉宾做客“绿色金融全球瞰”第一期沙龙,共同展望“十四五”绿色金融发展。与会嘉宾从宏观、中观、微观等层面详细解读了绿色金融现状及发展前景。绿色金融已驶向发展的快车道。3月15日召开的中央财经委员会第九次会议,将碳达峰碳中和纳入到了生态文明建设整体布局,并再次强调了积极发展绿色金融。绿色金融涉及碳达峰碳中和、能源结构转型、上市公司环境信息披露、气候投融资、绿色保险、绿色交通、国际合作等低碳经济发展议题。为凝聚共识,形成合力,澎湃新闻将与复旦大学绿色金融研究中心共同主办“绿色金融全球瞰”系列沙龙,为专家学者、政府官员、企业代表搭建沟通交流的平台。聚焦绿色金融,共话低碳发展。以下为上海市环境科学研究院低碳经济研究中心高级工程师胡冬雯的演讲全文:大家下午好,我非常荣幸能够被我们李老师请到这边,跟大家分享一些自己的学习的心得。今天听了王院长和何主任的报告,获益良多。我本人来自于上海市环境科学研究院。我们院的定位,主要是做政府决策支持的,聚焦在上海本地的生态环境和绿色发展话题。上海已初步实现绿色发展今天想围绕绿色金融说点事。由于我个人一直在环保领域工作,对金融领域接触较少,所以在绿色金融方面并不能算专业。但我在环保领域工作了近20年的时间,有一个非常明显的感受,可以和大家分享一下:我参与了上海的十二五、十三五、十四五的生态环境规划编制工作,这个历程当中我能感觉到绿色金融这个词语怎么样从一个概念到一个话题,从一个话题变成一个氛围,今天又从一个氛围可能要衍生出许多相关的政策。十三五末期,绿色金融的火苗就突然旺盛起来,特别是在上海,十三五的时候提出了要打造全球的金融中心,当时都没有提绿色金融,但是在十三五末期由于外部压力和本身的自身发展的水平阶段影响,有人提出作为一个国际金融城市,绿色金融没有被摆到一个核心的位置,这个说不过去,所以当时我们市委市政府就提出了很多的课题,去研究上海怎么样在绿色金融上面下功夫,去挖深挖潜。在这个过程当中,我们又发现我们这些做环保的人都是不懂金融的,以前我们在开会的时候,环保系统环保部门跟金融部门从来碰不到一起,但现在每次开会都在一张桌子上讲话,所以这个是我深有体会的一个感觉。这是第一个想和大家分享的心路历程。第二个想跟大家分享的,就是李老师给我出的题目,叫做十四五期间上海的绿色金融它的形势是怎么样子,首先想给大家介绍一下上海的生态环境发展的总体形势。目前,我们正在编制上海市的十四五的生态环境规划,基本上大的调子都已经定了情况下,我觉得今天可以给大家分享几个大方向。上海在十三五期间,实际上已经实现了很多的从环境质量到绿色发展的改变。我们可以总结出三个方面:第一是生态环境质量有了非常明显的改善,比如大家可以切身体会到的空气质量,上海空气质量就差一点点就可以实现全面达标了,在十三五期间全市三千多条中小河道已经全部消除了黑臭,政府部门投入了非常大的决心去推动全要素环境质量改善的解决。同时我们上海是全国第一个开展并建成垃圾分类体系的城市,目前来说垃圾管理在全国还是保持一个比较领先的地位,这个也是全社会环境治理的难点工作,在十三五把它做成了。所以说,从整体而言我们的生态环境质量实际上是得到了一个非常大的改善;第二个方面是初步实现绿色发展。什么叫初步实现?刚才何主任这提到绿色金融里面那些经受审慎性评估的行业,十三五期间很多行业在上海都整体淘汰掉了,特别是像平板玻璃、电解铝、皮革揉制这几个行业;还有能源结构,因为大家知道上海不像北京这样完全靠外来电来供给能源,上海大部分的能源是靠本地的能源支持的,上海的煤炭占消耗占比在十三五期间从37%下降到了31%,在十四五会有进一步的下降需求;在建筑方面,上海的绿色建筑和装配式建筑在全国是走得非常前面的,目前要求全部的新建建筑全部要使用装配式建筑,50%的建筑要实现绿色建筑这样一个非常有志气的目标。综上所述,总结成“初步实现绿色发展”这几个字。第三个方面是基本启动了环境治理体系和环境治理能力现代化的建设。这个事情是去年国务院两办发的构建现代环境治理体系指导意见里面提出的。建设体系里面涵盖什么内容,包括政府的职能、社会机构的责任和企业主体责任,以及包括绿色金融在内的制度设计,都在现代环境治理体系里面得以体现。所以,在这三个大的基本面格局下,十三五期间老百姓的满意度和获得感还是有比较明显的提升的。十四五期间,上海将初步建成现代环境治理体系对十四五来说,上海面临的一个生态环境总体发展趋势是什么情况呢?目前来说我们总结了三个基本趋势,可以用三个新来概括:一是新变局,什么样的新变局?上海是经济中心和金融中心,上海要面临外部大的经济格局和经济环境的不确定性,以及在疫情常态化管理下的复杂局势。还有政治因素和经济因素带来的一个不稳定性,也是一个长期影响我们开展环境管理决策的因素,这叫新变局。二是新阶段,十三五我们解决了很多环境问题,但是还是有很多存量问题存在的情况,比如一些传统的污染问题,pm2.5和富营养化的问题,在上海并没有得到一个根本性的解决,我们每年还是会有一些重污染天气的出现,我们的空气质量还没有实现全面达标。同时,一些新型的污染问题也在凸显,特别是臭氧污染问题,大家可能觉得空气好像能见度变高了,雾霾的情况减少了,空净不用开了,实际上到夏季的高温天气的时候,臭氧的污染问题越来越凸显,另外包括持久性有机物、环境激素等问题,都是在环境治理发展到一定阶段的时候会去关注的问题,这类问题我们称之为新型的环境污染问题。还有就是今年特别提出了碳达峰碳中和的问题,如何去协同污染治理和碳达峰,是十四五要面临的新阶段的问题。我们把新阶段的这些问题就统称作是新旧交织、多领域重叠的复杂性的趋势。三是新要求,因为上海在全国来说是城市的龙头,面临国家很多的战略性的部署,特别是现在国家提出的应对气候变化、长江大保护,还有长三角一体化示范区的建设,都是大的国家战略。如何去应对这样的一个大的格局,这是我们说的新要求。从三个“新”延伸,整的十四五的基调还是比较明确的,跟我们十三五的站位有比较大的区别。十三五我们还是讲要打好污染防治攻坚战,以最严格的标准来进行污染防治。但十四五整个的基调不再去强调说污染防治攻坚战要继续打下去,要深入打得更好,我们追求深层次的进步,叫做绿色发展,所以十四五的一个主要调基,就会从污染治理转向绿色发展。从具体目标来看,总结下来可能就是两稳定两初步,三达两保两提升。两个稳定的第一个是生态环境改善趋于稳定,第二个是生态环境功能稳定恢复。两个初步的第一个叫做初步实现以资源节约型和生态环保型的产业结构,生产和生活方式,这个是第一个初步。第二个初步叫做初步建成现代环境治理体系。三达,第一个叫做上海的空气质量全面达标,第二个是水环境质量基本达标,第三个是碳排放总量力争达峰。两保的第一个是近岸的海水的水质要保持稳定,第二个是土壤和地下水环境质量保持稳定。两提升是指受污染耕地、地块安全利用率持续提升,森林覆盖率、人均公园绿地面积持续提升。胡冬雯上海市环境科学研究院低碳经济研究中心高级工程师发展绿色金融,上海有天然禀赋以上基本给大家分享一下十四五上海的生态环境的发展的趋势。然后就想谈一下如何在上海十四五的生态环境保护大格局中,找到绿色金融的角色。实际上在十四五整个环境治理和绿色发展中,绿色金融是必不可少的。前两天我们上海吴青副市长在接受新华社采访的时候,对上海绿色金融的发展趋势做了非常明确的表达,上海会在十四五做怎样的部署,为什么上海在绿色金融上面一定要去推,而且是力推。首先,上海本身是有天然的禀赋,上海对于自己的定位是金融中心,拥有非常发达的金融市场。记得去年年底发布的世界金融中心指数里面,上海排名第三,超过了东京,从全球来看也是有可观的国际影响力。同时,上海的金融市场交易十分活跃,去年一整年,上海金融交易市场的交易额要达到2275万亿元,整个交易总额要占到到全国投融资总额的88%。其次,上海是一个非常外向性的城市,有很好的对外合作基础。举例来讲,今年上海交易所跟联合国签署了可持续交易的框架,首先代表我们国家出去做可持续发展的一个表态。另外,上海本身云集了大量的外资金融机构,目前在沪外资金融机构有30%是外资机构。这些机构有比较先进的企业文化,在绿色金融和ESG的实践方面。第三,在碳金融方面,上海在全国来说还是非常有地位的。上海早在2012年就成立了上海环境能源交易所,当时是全国成立的第一个基于环境交易的平台,后来作为上海本地的碳交易的一个主要承载平台,今年国家已经明确了由上海环境能源交易所来承接全国碳交易运转。这件事情会给整个碳金融在上海聚集带来非常大的利好。所以,在这三大禀赋下,上海在发展绿色金融方面还是很有优势。金融机构迫切需要企业环保信用评价结果我这边想给大家分享一下这个表,去年国务院两办发表发了现代环境治理体系的实施指导意见以后,近期可能会出台一个落指导意见的三年行动计划,是针对2021至2023年的重点任务。对上海来说,去年也发布了关于加快构建现代环境治理体系的实施意见,实施意见里面有28个重点任务,其中有9个跟绿色金融有关系。我给大家分享一下这几个相关任务:第一,要制定企业环境信息强制披露制度。上交所这边对上市公司一直以来都是要求是披露的,但是做的并不好,去年出台一个上市公司的强制披露的管理办法后,从主管部门来说,会对信息披露的的执行情况做监管,从而牵涉到企业是不是因为信息披露做不到位而受到信用评级的惩处,会对那些不开展信息披露的企业有很大的一个制约作用。第二,推出上海市企事业单位环境信用评价实施办法。我们跟很多金融机构打交道,包括人民银行上海总行,他们一个非常迫切的需求就是需要得到环保信用评价的结果,可以运用于开展业务指导工作。这个东西国家层面也在研究出台,上海也会跟国家同步研究,主要是来对接金融机构的一些需求。第三,污染强制责任险的落地。国家在十二五期间出了试点办法以后,上海当时没有参加试点,但上海已经有两个污染强制责任险了。一个是船舶污染责任险,我们对所有的过境船只都要求买保险,是强制性的污染责任险,对水上船只污染进行保障托底。还有一个是危化附加险,上海所有的危化品生产存储运输企业,在安全部门强制买危化险的基础上,还必须再买一个附加险,附加里面是包括了第三方环境污染险。所以说,实际上上海强制污染责任险一直是存在。今年生态环境部出一个方案,这个方案我们也已经看到征求意见稿,可能会牵涉到更大范围的强制投保内容,这将会对我们整体的绿色保险形势会带来很大的推动。第四,建立土壤污染防治基金,这个可能是迄今为止,上海唯一由财政部门发起的绿色基金。这个资金是要求在2022年之前建成,主要支持土壤调查、修复、再利用等资金需求。土壤污染和土壤修复这件事情,在整个的环保行业里面是一个资本量非常巨大的行业。所以土壤污染防治基金的建立主要是为了解决土壤的治理需求上面的一个资本紧张的情况。第五,推进绿色供应链管理示范试点,这个是上海非常有特色的一件事情。上海是第一个开展全国绿色供应链管理示范的城市,2013年就开始试点了。上海为什么要做这个事?因为上海就是一个总部经济非常发达的地方,它对产业的辐射力,特别是对长三角产业的辐射力十分明显。最近大家比较关注棉花的事情,这也不是第一次了,这种基于国际贸易绿色壁垒的事情跑出来,上海是逃不掉的。为什么要做自己的绿色供应链,就是为了将这些生态环境的话语权掌握在我们国家自己手里面,不要在国际贸易和国际政治比较动荡的时候,被外国有心人士利用我们的环境问题去钳制经济发展权,所以这个事情国家非常重视,也是赋予上海的很大的寄望。第六,开展环保领跑者制度建设。刚才何主任也提到了,十四五的国家的规划纲要里面提了能效领跑者,水效领跑者,其实环保领跑者也在我们的十三五的规划纲要里面提出过,但是始终没有做起来。所以这个是在十四五期间会去做的。为什么它跟绿色金融有关系,环保领跑者制度的配套政策最后会落地在金融金融政策上面。第七,搭建长三角的绿色技术产权交易服务平台。长三角一体化这个事情已经比较明确了,是国家到地方特别重视的一个事情。目前我们在上海成立了一个叫绿色技术银行,绿色技术银行本身是一个辐射长三角,让技术成果转化和金融挂钩的一个平台。第八,刚才说的碳排放交易系统,我这边再多啰嗦几句,目前我们碳排放的交易系统放在上海,但是配额的登记和最后的清算放在了湖北。这也体现了国家对碳交易体系建设的定位和想法。上海的目标除了做全国碳市场交易的这样的平台以外,还会大力发展CCER市场,特别是基于普惠型碳金融制度的平台域。最后就是落实到整个绿色金融体系,人民银行、银保监、金融机构都非常关注如何打造出整个服务于十四五绿色发展的金融政策体系。上海将鼓励企业积极开展ESG信息披露目前上海正在编制十四五国际金融中心建设规划,规划里面提出的三个和绿色金融相关的主要任务:一是要创新绿色金融标准体系。引导金融资源向碳中和领域倾斜,鼓励企业和金融机构积极开展ESG信息披露。积极参与国际绿色金融标准研究和制定,加强绿色金融领域国际合作,借鉴国际经验,推动绿色金融标准体系创新。二是激发绿色金融市场活力。支持符合条件的绿色产业企业上市融资。鼓励商业银行大力发展绿色信贷。鼓励金融市场发展绿色股票指数、绿色保险、绿色基金、绿色信托、绿色债券等。三是优化绿色金融支持政策。配合国家金融管理部门完善绿色金融业绩评价、考核等政策措施,引导金融机构增加绿色资产配置,支持经济社会绿色发展。充分发挥国家绿色发展基金作用,促进长江经济带沿线绿色低碳可持续发展,在推动绿色发展中发挥好示范带动作用。我给大家交流自己工作当中得到的一些讯息,本人也是在一边学习一边实践,也想听听大家的意见和建议,对上海未来绿色金融的发展一些好的想法。我的分享就到这里。谢谢大家。

疗养院

上海市环境科学研究院党委副书记、院长夏德祥接受监察调查

据上海市徐汇区纪委监委消息:上海市环境科学研究院党委副书记、院长夏德祥涉嫌严重违法,目前正接受上海市徐汇区监察委员会监察调查。

苏洵

唱响美丽中国(73)丨上海市环境科学研究院版《让中国更美丽》来了

2020年六五环境日以来全国各地持续唱响六五环境日主题歌《让中国更美丽》↓↓今天,让我们一起欣赏上海市环境科学研究院环保人演唱的作品04:24近期重点文章推荐唱响美丽中国(72)丨江苏南通版《让中国更美丽》来了唱响美丽中国(71)丨陕西咸阳版《让中国更美丽》来了唱响美丽中国(70)丨广东湛江版《让中国更美丽》来了唱响美丽中国(69)丨青海生态环境监测中心版《让中国更美丽》来了唱响美丽中国(68)丨江西版《让中国更美丽》来了唱响美丽中国(67)丨新疆版《让中国更美丽》来了编辑:王颖毅点击“阅读原文”,在生态环境部官网下载《让中国更美丽》歌曲伴奏

不知端倪

精细化专题调研 助推精确化科普宣传

根据《国务院关于加快建立健全绿色低碳循环发展经济体系的指导意见》中的重要指示精神,为加强再生资源回收利用,推进垃圾分类回收与再生资源回收“两网融合”,做好针对低价值可回收物的宣传科普工作。上海市资源利用和垃圾分类管理事务中心赴上海市环境工程设计科学研究院开展了低价值可回收物专题调研,就本市低价值可回收物现况等问题进行探讨和交流。会上,环科院的毕工首先讲解了目前本市低价值可回收物的回收现状,并介绍了如利乐包、玻璃、泡沫塑料等低价值可回收物的材质性质、回收技术、回收方式、处理工艺案例等。同时,对在投放时容易混淆的干垃圾如“薄型塑料”、水果网袋、奶茶杯、外卖盒、PLA吸管等的利用价值进行了探讨和分析。下一步,市分类中心将继续围绕“源头减量、资源利用”,不断加强针对再生资源回收、可回收物的相关调研工作。同时,针对市民在生活垃圾分类中出现的易混淆干垃圾、低价值可回收物投放难题,市分类中心将不断加强调研深度、广度,运用精细化专题调研助推精确化科普宣传,不断提升宣传工作的普适性,促进市民提升精确化垃圾分类意识,为接下来的宣传科普工作打好基础,为本市生活垃圾源头减量和资源化利用提供助力。【来源:上海市绿化市容局】声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 邮箱地址:newmedia@xxcb.cn

王其无它

日本核废水排海 专家:“就像潘多拉魔盒被打开”

来源:中国新闻周刊13:48原标题:日本核废水排海,专家:“就像潘多拉魔盒被打开”放射性核素通过食物链最终将进入人体日本政府4月13日召开相关阁僚会议,正式决定向海洋排放福岛核电站的核废水。据悉,这批核废水总量超过100万吨,排放工作预计在两年后开始。虽然日本方面表示,在正式排入大海前会对核废水进行过滤并稀释,但依旧引发巨大争议。纵观人类历史,还从未出现过将处理核事故的核废水排入大海的先例,此前切尔诺贝利和三里岛核事故,都是大气释放。日本此举不仅仅关系本国安危,更将对全球的海洋环境、食品安全和人类健康产生深远的影响。专家表示,日本将核废水排入大海,如同潘多拉的魔盒被打开了。海洋生物对放射性核素会产生富集作用,即在其生命周期中不断吸收核素。长此以往,这些海洋生物中的放射性核素就会比海水里的浓度要高。而人类处于食物链顶端,最终也将影响到人体健康。“理应再储存更长时间”2011年,日本“3·11”大地震导致福岛核电站发生核泄漏,4个核反应堆不同程度受损,其中3个反应堆发生堆芯熔毁。核电站不得不引入海水冷却受损堆芯,海水与渗入反应堆的地下水及雨水,形成了大量放射性核废水。目前,超过120万吨的核污水被暂时存放在上千个大型储水罐中。而且,福岛每天仍在产生约140吨核废水。东京电力公司表示,预计到2022年秋季,核废水将达到储水设施137万吨容量的极限。4月13日,日本政府召开相关阁僚会议,正式决定向海洋排放福岛核电站的核废水,排放工作预计在两年后开始。事实上,世界上有部分国家的核设施曾向海洋或者以其它方式排放核废水,为何日本此举引发高度关注?多位核安全方面专家表示,核电站排放的废水与福岛核电站事故之后的废水完全不同,二者不可混为一谈。国家电力投资集团有限公司核能总工程师郑明光告诉中国新闻周刊,总体上来说,正常核电运行情况下的中低放射量废液排放,只要满足国际排放标准,不会对环境造成任何影响。然而日本这次由于有燃料破损,大量高放射性核素进入水中。根据东京电力公司数据,核废水中包含63种放射性物质。2019年,美国伍兹霍尔海洋研究所称,核污水中含碘-129、锶-90、钌-106、碳-14等放射性元素。其中,碘-129可以导致甲状腺癌,锶-90更被世界卫生组织列入一类致癌物清单,易致白血病。2020年有环保组织指出,福岛核污水中的放射性同位素碳-14和其他放射性物质的含量之高相当危险,存在损害人类DNA的潜在危险。根据东京电力公司目前已经披露的排放计划,在排放前会对核废水进行处理,绝大部分放射性元素都可以清除,但是“氚”没有办法彻底清除,到时会将核废水中的氚浓度稀释至日本国家标准的1/40(即1500贝克勒尔/升),是国际卫生组织设定饮用水标准10000贝克勒尔/升的1/7,不会对海洋造成污染。事实真是如此吗?不能低估放射性核素衰变的时间很显然,目前公布的信息并不能打消外界的担忧。一位国内核安全专家质疑目前的数据不够公开透明。他告诉中国新闻周刊,核废水排入大海后的具体影响,要根据排放时的具体体量、含量数据再作进一步的判断。这就要求日本政府在排放过程中更加公开透明。郑明光表示,日本需尽最大努力,本着负责任的态度尽量降低长寿命放射性核素的排出。同时在排放过程中应该接受国际原子能机构的检测、监督,特别是邀请周边的成员国对其过程与后果进行评估。除了直接排放入海,核废水处理就没有别的办法吗?前述核安全专家表示,蒸发释放和地下掩埋是较为常见的做法。“但蒸发释放工期长、费用高;而地下掩埋则因为日本国土面积狭小且地震多发,有发生二次泄漏的可能,所以排污入海对日本来说是最便宜、工期最短的方法。”然而,日本虽然省钱了,却将对全球产生深远影响。德国海洋科学研究机构指出,福岛沿岸拥有世界上最强的洋流。从排放之日起57天内,放射性物质将扩散至太平洋大半区域,10年后蔓延至全球海域。绿色和平组织核专家指出,日本核废水所含碳14在数千年内都存在危险,并可能造成基因损害。上海海事大学海洋科学与工程学院海洋环境专家朱文武告诉中国新闻周刊,放射性污染物和其他传统污染物不同,许多放射性元素如碘、钌、铑、碲、钴和锶是无法消除的。朱文武进一步表示,“放射性核素衰变的快慢是由原子核内部自身决定的,与外界的物理和化学状态无关。以氚为例,它的半衰期约12年,也就是说过了12年,虽然有一半的氚原子核衰变而无害,再经过12年,还有四分之一的氚仍然有害。再比如,‘铯-137’这种同位素,半衰期约30年,如果放到自然环境中,要想实现99%衰变,则需要几百年的时间。”清华大学环境学院教授、核环境工程教研所所长王毅在接受媒体采访时表示,海洋是整个人类的共同财产,不是日本一个国家的,不是它的“后池塘”,尤其是对中韩两国作为邻居来讲,必须要打招呼。另外,应该由中韩等有能力进行检测的国家,对日本核废水的真实数据进行核验,这是最起码的。再有,整个排放过程,比如每年排放的流量以及排放的地点都必须公开透明,在环太平洋国家的监督之下进行,这才是一个国家该有的负责任的态度。放射性核素通过食物链最终将进入人体那么对于大众来说,排入太平洋的核废水会对海洋生物和人造成什么样的影响?海鲜还能否继续吃?据相关分析,日本东海岸有日本暖流,它会源源不断把日本排泄的污水汇入北太平洋暖流,洋流会带着污水在整个北太平洋循环,沿岸国家和地区有十余个。而且,核废水会顺着洋流在北太平洋绕一圈,最后也会到达我国台湾地区附近。不过在朱文武看来,核废水就像潘多拉魔盒。放射性核素一旦投入海洋,就会被海洋生物所吸收。在生态系统中,海洋生物对放射性核素会产生富集作用,即在其生命周期中不断吸收核素。长此以往,这些海洋生物中的放射性核素就会比海水里的浓度要高。而人类处于食物链顶端,最终也将影响到人体健康。中国环境科学研究院教授张金良告诉中国新闻周刊,目前获得的信息是,预排放废水中残留的放射性物质包括氚、铯-134 、铯-137、钴-60 和锶-90等多种放射性核素,其可进入到水生生物体内,通过被污染水产品的摄入进入人体造成内照射,可危害吸入者的健康。因此有分析认为,面对这种现状,全世界渔业都会受到影响。日本渔业团体4月13日发声明:“我们无法容忍这个做法,这是一个让人遗憾的决定。”日本全国渔业协同组合联合会认为,一旦核辐射污水排入大海,势必导致水产品安全性遭质疑。目前多个国家已开始酝酿是否要禁止日本水产品进口。我国是水产品消耗大国,上世纪90年代开始,我国海鲜产品的消费量,呈现出快速上涨的趋势。据联合国粮农组织预测,2020年中国人均海鲜消费量将达到约36公斤。2020年,我国海鲜进口量为127亿美元。不过据媒体报道,我国海产品十大进口来源地分别为俄罗斯、厄瓜多尔、印度、加拿大、越南、美国、印度尼西亚、澳大利亚、挪威以及泰国,日本并未在列。此外,我国海洋渔业或许也将受到影响。据中国渔业统计年鉴数据显示,2019年我国海洋捕捞产量为1000.15万吨,总产值为2116亿元。“放射性核素不像其他常见的海洋污染物,它是一种同位素,属于原子层面,不可能像分子一样简单过滤,处理也需要非常专业的设备,因此渔业对此是‘防无可防’的。”朱文武建议,相关检测部门今后要加强对我国近海海水及海产品放射性核素含量的监测监管。目前市场普遍认为,将核废水倒进太平洋,在季风和洋流作用下,将对我国海域的海洋生物造成一定影响。受此消息影响,国内水产养殖企业受到资本市场追捧。连日来,A股水产养殖股持续走高。

冬之祭

面向国家高性能计算环境的虚拟数据空间系统

面向国家高性能计算环境的虚拟数据空间系统秦广军1, 肖利民2,3, 张广艳4, 牛北方5,6, 陈志广71 北京联合大学智慧城市学院,北京 1001012 北京航空航天大学计算机学院,北京 1001913 软件开发环境国家重点实验室,北京 1001914 清华大学计算机科学与技术系,北京 1000845 中国科学院计算机网络信息中心,北京 1001906 中国科学院大学,北京 100190摘要:高性能计算环境是支撑国家科技创新、经济发展、国防建设的核心信息基础设施,世界高性能计算强国纷纷建设基于多超算中心资源的广域高性能计算环境。然而,高性能计算环境中资源种类繁多且地域分布广,无法有效发挥资源的聚合效应,难以满足大型应用对广域分布数据的统一管理和高效访问需求。为此,提出了一套可用于构建广域全局虚拟数据空间的完整技术体系,包括虚拟数据空间模型、跨域虚拟数据空间构建、广域环境中数据高效迁移、广域环境中存算协同调度、跨域高并发数据聚合处理等技术,并研发了一个可运行于国家高性能计算环境的虚拟数据空间系统,可有效支撑广域分散异构存储资源的统一高效访问,实现广域环境中分布数据的跨域共享和协同处理。目前,该软件系统已在国家高性能计算环境实验性部署,并验证了分子对接、全基因组关联分析、天气预报模式3类典型大型应用。验证结果表明,所研虚拟数据空间构建方法和系统可有效聚合广域分散的存储资源,满足大型应用的数据空间需求。关键词:高性能计算环境 ; 大型计算问题 ; 虚拟数据空间 ; 广域分布式存储 ; 统一命名空间论文引用格式:秦广军, 肖利民, 张广艳, 等. 面向国家高性能计算环境的虚拟数据空间系统[J]. 大数据, 2021, 7(2): 101-122.QIN G J, XIAO L M, ZHANG G Y, et al. Virtual data space system for national highperformance computing environment[J]. Big Data Research, 2021, 7(2): 101-122.1 引言高性能计算环境是支撑国家科技创新、经济发展、国防建设的核心信息基础设施,世界高性能计算强国纷纷建设基于多超级计算中心(以下简称超算中心)资源的广域高性能计算环境。美国建立了跨域的极限科学与工程发现环境(extreme science and engineering discovery environment,XSEDE),旨在建设单一的虚拟系统,世界各地的科学家可以通过系统共享计算资源、数据和专业知识;欧洲建立了跨域的欧洲网格基础设施(European grid infrastructure,EGI),目的是通过整合数字功能、各界资源和专业知识为科学研究和基础设施建设提供开放的解决方案;我国建立了中国国家网格(China national grid,CNGrid),通过资源共享、协同工作和服务机制,有效地支持科学研究、资源环境、先进制造和信息服务等应用。高性能计算水平体现了一个国家的科技综合实力,整合广域分散的高性能计算资源,建立广域高性能计算环境,对于国家高性能计算技术的领先发展、国家安全与高性能计算地位的提高至关重要。与XSEDE和EGI相比,CNGrid不仅要能够支持科学研究,更强调对多领域应用的支持。这些应用除了需要高性能计算能力,还需要支持对异地、异构数据进行存储、访问、交换和处理的能力。然而,在广域高性能计算环境中,各超算中心往往地理位置分散,资源自治管理,数据跨域分散存储,这使得资源和数据难以统一管理、调度和互访,应用系统间相互孤立,难以满足大型计算应用对全局资源空间的需求。因此,如何在广域高性能计算环境中实现跨域资源统一管理与使用,有效支撑大型计算应用,一直是各高性能计算领域的重要研究课题,这迫切需要新技术、新系统来支持资源共享,提高资源利用率,发挥分散资源聚合效应。CNGrid目前已经支持全局计算资源管理和作业调度,但存储和数据资源仍然不能得到有效的全局统一管理、调度和访问。本文针对国家高性能计算环境广域分散存储资源的聚合需求及大型计算应用对跨域全局虚拟数据空间的实际需要,对标高性能计算环境广域存储系统EGI OneData和XSEDE GFFS,从跨域虚拟数据空间构建、广域数据共享、全局存算协同调度、跨域并发数据聚合处理、CNGrid环境对接等几个主要方面出发,建立了一套可用于构建广域全局虚拟数据空间的完整技术体系,并研发了一个可运行于国家高性能计算环境的虚拟数据空间系统,旨在为在国家高性能计算环境中建立虚拟数据空间提供技术手段、应用经验、人才储备,支撑建设资源共享、统一管理、高效协同的国家高性能计算环境,促进我国高性能计算环境的应用和可持续发展。2 国内外研究现状国家级广域高性能计算环境是支撑国家科技创新、经济发展、国防建设的核心信息基础设施,是大国竞争的战略高地,世界高性能计算强国纷纷建设基于多超算中心资源的广域高性能计算环境。美国、欧洲、日本对虚拟数据空间系统及关键技术开展了研究。美国国家科学基金会的TeraGrid计划及其后续的XSEDE计划,以及欧洲的网络基础项目EGI(前身为EGEE),都旨在将广域分散自治的大规模计算系统、科学仪器等互连并广域共享,但TeraGrid需采用专用高速网络,EGI欠缺全局统一管理能力。其中,EGI的基础存储系统是OneData,引入了“空间”和“供给者”的概念,较好地屏蔽了EGI中数据广域分布的复杂性,但是采用紧密的元数据管理方式,元数据维护压力巨大,系统可扩展性较差。XSEDE的基础存储系统是全局联合文件系统(global federated file system,GFFS),采用松散的顶层元数据组织实现了异构存储资源的聚合,但是顶层元数据集中管理,存储集群的元数据分散自治管理,使得顶层元数据极易成为性能瓶颈。麻省理工学院的协作式文件系统(cooperative file system, CFS)、加利福尼亚大学伯克利分校的OceanStore、纽约大学的Kademlia等具有良好的平衡性和扩展性,但均为聚合集中式存储资源的系统。谷歌公司的Spanner实现了在特定硬件支撑下的跨域数据库存储模式,耶鲁大学和谷歌公司联合实现了跨数据中心的CalvinFS系统,加利福尼亚大学河滨分校提出了可跨多云平台的SPANStore系统,德国卡尔斯鲁厄理工学院设计了MetaStorage系统,上述系统可管理分散的存储资源,但主要面向互联网应用(如数据库存储),不适用于高性能计算应用环境。微软公司的WAS (Windows Azure storage)系统通过位置服务器和全局命名空间整合跨域存储集群,但不支持跨域数据共享。美国印第安纳大学实现了跨域的Lustre-WAN文件系统,但需专用网络支持。日本筑波大学提出了跨域网格文件系统Gfarm,但其集中式元数据架构难以适应高性能计算环境的大规模并发数据访问请求。我国对虚拟数据空间系统及相关技术也开展了相关研究,建设了基于多个超算中心的国家高性能计算环境,实现了分散计算资源的统一管理和全局调度,但尚未实现分散存储资源的全局数据空间以及存储与计算全局协同调度。电子科技大学、中国科学院计算技术研究所、浙江大学等采用哈希算法,设计了针对集中式存储资源的聚合系统PeerStore和π-Store等。北京邮电大学、华为技术有限公司、阿里巴巴集团面向互联网应用实现了基于多云存储平台协同的云存储模式。清华大学、北京航空航天大学、中国科学院计算机网络信息中心研究了单一大规模存储聚合系统及跨域存储聚合技术,针对分布性、异构性、动态性的广域网络环境,实现了支持跨域数据驱动型应用的虚拟数据空间及服务协同平台、跨多数据中心的全局虚拟文件系统等。综上,目前国内外都在研究跨域存储资源聚合、广域数据共享等问题,但尚未出现可有效支持广域高性能计算环境的跨域虚拟数据空间。因此,研究在广域高性能计算环境中建立跨域虚拟数据空间的方法和关键技术具有重要的理论意义和应用价值。3 国家高性能计算环境3.1 环境现状我国国家高性能计算环境(原中国国家网格环境)的环境资源种类繁多、异构性强、地域分布广,主要由上海超级计算中心和中国科学院计算机网络信息中心两个南北主节点,国家超级计算无锡中心、国家超级计算天津中心等7个国家级超算中心,以及清华大学、西安交通大学等11个普通节点组成,总计算能力超200 PFlops,总存储容量超160 PB,2020年新增国家超级计算郑州中心和国家超级计算昆山中心。计算资源管理的核心系统软件——超级计算环境(super computing environment,SCE)是中国科学院开发的环境中间件,用户可以通过此中间件使用整个环境中的所有计算资源。SCE主要包括前端服务器(front server,FS)和中央服务器(center server,CS),CS负责汇总FS采集的各类信息,以及作业全局调度与管理服务、数据传输与管理服务、用户与权限服务、资源信息管理服务、安全策略以及计算环境管理;FS负责资源接入与监控、作业局部调度、局部信息管理、一些计算资源的执行控制,收集来自各超算中心的资源信息,并汇报给CS,以及执行来自CS的各种执行请求。存储资源由各超算中心自治管理,使用方式主要分为两类:第一类,在超算中心中将区域划分为计算区和存储区,采用不同的文件系统进行管理并存储在不同的集群上,进行计算作业时,需要将用户的作业及用到的数据提交至计算集群中进行计算;第二类是不划分存储区和计算区,存储和计算由同一个文件系统统一管理,作业直接在用户目录下运行。对于当前两种使用模式,用户数据都汇聚在一个超算中心中,而且是分散自治的,国家高性能计算环境中各超算中心之间相互隔离,无法做到用户数据跨域及统一管理。可见,在当前的国家高性能计算环境中,计算资源可统一管理、全局调度,但存储资源仍广域分散、隔离自治,虽然可全局调度计算资源,但无法有效地实现数据的跨广域统一访问和共享,应用规模的扩展受限于单中心的资源规模,无法构建更大型的、跨广域的应用,更无法实现存储与计算的协同调度,从而导致全系统资源利用率不能有效提高。3.2 大型计算问题对数据空间的需求大型计算问题,诸如生物信息、精准医疗、高能物理、气象预报等类型的应用,由于数据量和计算量都较大,且数据往往跨广域分布,需要在高性能计算环境中形成广域的数据共享、统一的数据空间,从而提高应用的规模,提高全系统资源利用率。例如,生物信息和精准医疗类应用涉及的数据量巨大,存储需求往往达PB级,且需要在跨广域海量样本中进行汇聚处理和挖掘,而单中心局部存储空间不足以满足应用需求,且受到广域网带宽和路由的限制,数据跨广域迁移效率较低,可统一管理的存储空间和高效的广域数据共享将有利于此类应用在数据处理规模上的扩展;高能物理类应用往往需要E级计算,目前单中心的计算能力尚不能有效满足其需求,人为设置的数据和任务布局并不能很好地依据各中心具体的资源提供能力进行优化,实现数据与计算任务的协同布局和调度将有利于此类应用的高效运行;气象预报类应用涉及广泛的数据源,其类型多、分布广,且时效性要求高,同样受到广域网带宽和路由的限制,数据跨域访问性能较低,实现跨广域的多源数据聚合处理也将有利于提高此类应用的性能和时效性。具体来讲,数据空间应满足如下4个方面大型应用的要求。(1)支持跨域存储资源统一管理和访问由于国家高性能计算环境中存储资源广域分散且隔离自治,系统无法对跨域存储资源进行有效的管理和统一访问,导致各数据中心数据的重复存储以及多超算中心无法协同处理数据。大型应用迫切需要将分散的存储资源聚合为全局数据空间,并提供跨域统一管理和访问能力。(2)支持广域数据共享在高性能计算环境中广域数据无法共享,这导致资源闲置、重复建设,数据空间需要提供能够有效整合分散自治、广域隔离的存储资源,汇聚各超算中心开放的数据,为用户提供跨多个节点提取数据的能力,为应用提供一站式的数据共享服务。(3)支持存储与计算协同调度由于高性能计算环境中的存储与计算无法高效协同,广域范围内的计算任务和数据难以实现合理分布,需要设计并开发虚拟数据空间与现有国家高性能计算环境软件的接口,以支持虚拟数据空间与国家高性能计算环境的对接,通过技术集成形成虚拟数据空间系统,提供能够透明实现多节点聚合的机制,且能根据计算特征和数据布局来控制任务与数据的节点选择,从而实现存算协同。(4)支持跨域多源数据聚合处理为了提升典型数据访问模式的跨域访问能力,需要能对数据空间与应用之间的I/O中间层进行优化、对跨域多源高并发数据进行高效聚合处理的方法来有效支持大型计算应用。因此,大型计算问题亟须聚合广域分散的存储资源,形成跨域的高性能计算数据空间,以满足大型计算问题在规模、性能和资源利用率上的要求。此外,从使用者角度考虑,还应该具备如下跨域分布式存储系统的基本功能。● 可跨广域环境进行基本的存储操作,且符合文件系统的标准可移植操作系统接口(protable operating system interface of UNIX, POSIX协议),如重命名、修改、增加、删除等。● 可访问广域环境中的数据集及其子集,且符合文件系统的标准POSIX协议。● 可在广域环境中统一浏览文件目录,且有权限限制。● 可将数据共享给指定的其他或所有用户。● 可将单个或多个数据源数据按需存储到一个或多个超算中心,且能统一浏览和访问。● 可依据数据访问特性进行优化的全局资源分配与数据放置。4 高性能计算虚拟数据空间针对上述大型计算问题对数据空间的要求,笔者在跨域虚拟数据空间的模型、体系结构、资源聚合、管理和访问等方面开展了研究,突破了广域分散自治存储资源聚合、带宽约束下数据高效可靠迁移、计算与数据跨域协同调度、高并发数据流聚合处理等关键技术,形成了完整的虚拟数据空间系统,并已经在国家高性能计算环境中对该系统进行了初步部署和应用验证。4.1 虚拟数据空间体系结构及关键技术4.1.1 虚拟数据空间模型针对广域分散、自治异构的底层存储资源,以及种类繁多、需求各异的上层大型应用,通过分析数据分布需求和应用的数据访问特征,抽象底层存储资源的分布形式,将虚拟数据空间提炼为主体、服务、空间、资源四要素,并构建了多层级的数据空间模型,如图1所示。图1 虚拟数据空间模型各要素的定义及形式化描述如下。● 主体:数据空间服务的对象(如个体用户、群组用户、全体用户及其应用),主体可通过服务的形式使用虚拟数据空间的资源。● 服务:面向主体提供的各种功能服务,如用户管理、区域管理、空间管理、权限管理、访问控制、数据共享、数据迁移等。● 空间:对分散自治的存储资源依次进行物理聚合、局部聚合、全局聚合形成的全局虚拟数据空间。● 资源:广域分散、隔离自治的存储资源。4.1.2 虚拟数据空间表示方法基于上述虚拟数据空间模型,对虚拟数据空间进行层次化表示,形成虚拟数据空间的层次化模型,主要包括资源层、空间层、服务层、主体层,如图2所示。图2 虚拟数据空间的层次化表示● 资源层:包含各超算中心的存储资源,存储资源分布在不同的地理位置上,且通常具有异构性。● 空间层:通过对底层广域分散的存储资源依次采用物理存储资源聚合、局部存储资源聚合、全局存储资源聚合,最终形成全局虚拟数据空间。● 服务层:提供使用虚拟数据空间存储资源所需的基本功能,主要包括用户管理、区域管理、空间管理、权限管理、访问控制、数据共享、数据迁移等,并通过统一接口以服务形式对外提供。● 主体层:主要包含用户及其应用(如数值模拟、大数据、人工智能等典型应用),可通过接口使用虚拟数据空间提供的各种服务。4.1.3 虚拟数据空间软件体系结构基于本文提出的模型和表示方式,将虚拟数据空间体系结构相应地设计为资源层、空间层、服务层、主体层4个层次,如图3所示。图3 虚拟数据空间体系结构● 资源层:处于最底层,主要提供用于构建虚拟数据空间的物理存储资源。该层包含广域分布的存储资源,存储资源分布于不同地理位置的超算中心之中。● 空间层:位于资源层之上,通过聚合底层广域分散的存储资源,形成全局数据空间。该层依次采用物理存储资源聚合、局部存储资源聚合、全局存储资源聚合等资源聚合方法,实现广域存储资源的逐层聚合;同时,采用全局名字空间节点高可用方法实现全局元数据关键组件的高可用。● 服务层:提供虚拟数据空间基本服务,如数据区域划分和管理提供按需区域划分服务;区域空间分配和管理提供区域映射和空间分配服务;区域隔离和权限管控提供区域隔离和数据安全保障;数据访问优化通过元数据访问优化和远程数据缓存提升元数据和数据的访问性能;数据访问带宽聚合服务用来优化频繁访问数据的广域布局,以提高带宽利用率;数据迁移共享通过优化应用I/O与迁移速率、多源与多数据迁移性能提高数据迁移与共享效能;安全可靠传输机制提供构造可靠迁移协议和高效安全迁移服务;存算协同调度提供数据传输、放置及任务布局协同的全局作业调度服务;访问接口服务为不同应用对虚拟数据空间的统一访问提供命令行和文件视图两种接口使用方式,并提供数据聚合处理框架和并行I/O库,以优化大型应用常用的高级I/O接口,并支持复杂数据处理模式,提升数据访问性能。● 主体层:主要包含各类用户及其应用,如天气预报模式、生物信息学、目标协同识别等典型应用,应用可通过调用服务层提供的服务功能,在全局虚拟数据空间中使用资源层中的广域分布存储资源。4.1.4 虚拟数据空间系统关键技术在本文建立的虚拟数据空间理论和模型的指导下,重点从跨域虚拟数据空间模型及构建方法、虚拟数据空间中数据的共享与迁移方法、国家高性能计算环境中的虚拟数据空间运行支撑技术、面向典型应用的虚拟数据空间验证与优化技术4个层面开展研发工作,研发了一套面向高性能计算环境的广域数据存储与共享的技术体系和功能体系,具体涉及的关键技术如图4所示。图4 高性能计算虚拟数据空间关键技术(1)跨域虚拟数据空间构建方法针对广域分散存储资源的统一管理和高效访问需求,笔者依据虚拟数据空间理论模型,将广域分散自治的存储资源抽象为层次化模型,从本地、局域、广域3个层级进行聚合,构建与本地数据空间一致且能可靠地统一访问与管理的跨域虚拟数据空间,并定制化个人、群组、全局多级数据分区安全可靠共享,优化跨域元数据与数据服务能力,以解决跨域分散存储资源的统一管理和高效访问问题,有效发挥资源聚合效应。相比国外同类典型系统的相关技术,本文的跨域虚拟数据空间构建方法比OneData增加了管理数据的高可用能力,比Gfarm增加了管理数据高可用和数据区域划分能力,比CalvinFS增加了数据区域划分、跨域数据共享和账号安全管理能力。在性能测试中,基于本文方法构建的跨域资源聚合层软件模块在聚合访问本地单设备存储资源、本地单超算中心局部存储资源和跨广域全局存储资源方面,分别可达到直接访问存储资源时性能的96%、86.73%和84.3%;客户端元数据时延比基于最近最少使用(least recently used,LRU)的替换策略、基于目录(directory-directed prefetching, DDP)的预取策略、基于概率图(variant probability graph,VPG)的预取策略、基于Apriori关联规则算法的预取策略和基于语义距离算法的预取策略分别减少27.8%、32.5%、19.37%、24.96%、22.17%的平均访问时间;维护数据一致性的开销比Raft-log减少42 ms;每秒查询数(quer ies-per-second,QPS)比Raft-log提升36倍,也优于MaterSlave和Tintri等系统,并且通过数据副本的优化布局,本地副本命中率达到68%,远程副本访问率下降至32%。(2)广域环境中的数据高效迁移方法针对大规模高性能计算数据跨域迁移中的带宽受限问题,笔者研发了可突破广域带宽受限的数据高效迁移方法,将网络拥塞控制过程抽象为可部分观察的马尔可夫决策过程,以动态凸包和迭代加权混洗方法来决策多迁移任务的调度和传输带宽分配,以多TCP流、流水线、并发传输等形式迁移数据,满足了广域带宽受限下的数据高效迁移需求,可有效跨域迁移数据。相比国外同类典型系统的相关技术,本文的广域环境中的数据高效迁移方法基于广域非专用网络,比Gfarm和CalvinFS增加了数据可靠安全迁移能力,比GPFS增加了数据区域划分和多副本能力;相比于盘古系统,本文方法的跨广域数据迁移性能提升2.96倍。实验表明,文件越大,本文方法的传输性能越好,小文件的传输性能也不低于网络传输性能的35%,且网络吞吐量可提高两倍以上。(3)广域环境中的存算协同调度方法针对广域环境中计算任务与存储资源的协同调度需求,笔者研发了广域环境中计算任务与存储资源的联动调度方法,将各中心资源聚合为虚拟队列,按计算任务和数据分布情况、集群队列排队情况进行归一化,并根据时间成本来决策计算作业与存储资源的协同调度,以有效发挥计算与存储资源的联动效应。实验结果表明,本文的广域环境中的存算协同调度方法可有效地提升资源使用率和计算作业的调度性能。相比国外同类典型系统,本文方法创造性地提供了高性能计算环境中存储和计算资源的协同调度及布局能力。(4)跨域高并发数据聚合处理技术针对虚拟数据空间中的资源异构、数据流高并发且多源等特征,笔者研发了面向跨域高并发数据流模式的数据聚合处理技术,以代理方式跨域访问元数据,以高并发异步乱序数据流的细粒度任务调度形式汇聚跨域多源高并发数据流,优化面向跨域环境的I/O接口,满足了跨域作业的高效执行需求,可有效发挥虚拟数据空间对大型应用跨域运行的支撑能力。相比国外同类典型系统,上层应用可基于本文提供的多副本和广域环境中的存算协同调度能力,跨域高并发访问多源数据,实现数据聚合处理。相较于相关技术,上层应用的远程数据请求率可减少38%~71%,命中率比自适应替换缓存(adjustable replacement cache,ARC)和预取方法提升20.7%和28.8%,文件创建的吞吐率提升17%~93%,执行时间减少37%。4.2 虚拟数据空间系统4.2.1 虚拟数据空间系统架构在关键技术研究的基础上,笔者研发了面向高性能计算的虚拟数据空间系统GVDS,技术上覆盖了虚拟数据空间模型和体系结构、分散资源聚合方法、端到端数据传输方法、存储与计算协同调度方法、跨节点数据聚合的I/O接口优化等20多项关键技术,功能上覆盖了全局数据空间、跨域数据存储、数据区域划分、多副本等10多项重要功能。系统的总体架构如图5所示。图5 虚拟数据空间系统的总体架构笔者设计了高性能计算虚拟数据空间系统的操作界面,包括Web和命令行,如图6所示。图6 虚拟数据空间系统界面Web界面展示了运算时间、输入输出带宽、容量信息、服务器、节点数量、用户数量、总体容量等信息,以及部署的节点分布情况。命令行界面包括41条命令,如账户注册命令、区域注册命令、空间映射增加命令、管理员审批命令、用户区域查询命令等,命令的接口见表1。相较国际同类领先系统,GVDS具备更完整的技术体系和功能。在技术体系上,该系统覆盖了数据空间模型、跨域空间构建、广域数据共享等20项关键技术,形成了完整的技术体系;在核心功能上,该系统与对标系统相比,有所超越,涵盖了全局名字空间、跨域数据共享、多数据副本等10项重要功能,形成了完整的功能体系,见表2。所实现的虚拟数据空间符合文件系统的POSIX标准,可通过mount命令直接挂载,并支持多种异构文件系统,目前测试通过的文件系统包括Lustre、Ceph、GPFS、Gluster、MooseFS、ParaStore等符合POSIX标准的文件系统。目前,GVDS已在国家高性能计算环境的6个广域节点上部署,可管理PB级的跨域存储资源,并在典型计算应用上进行了示范应用。初步测试表明,在关键性能上,与对标系统相比,该系统具有较大优势,跨域写数据和读数据性能分别是对标系统的1.3倍和1.6倍。4.2.2 国家高性能计算环境部署目前,笔者研发的系统已和国家高性能计算环境初步对接,虚拟数据空间与计算环境的访问接口采用REST风格的API,提供基于HTTP的国家高性能计算环境访问接口,包括集群节点、环境应用、环境队列等接口,为计算服务平台中的各类服务提供虚拟数据空间数据的查询、访问和传输。部署环境包括3个国家超级计算中心(国家超级计算广州中心、国家超级计算济南中心、国家超级计算长沙中心)、两个国家网格主节点(中国科学院计算机网络信息中心(中国国家网格北方主节点)、上海超级计算中心(中国国家网格南方主节点))。另外,也在北京航空航天大学完成部署,形成了跨广域6个节点测试验证环境。部署情况如图7所示。图7 系统部署情况所有节点各部署一个管理节点,2~3个I/O代理节点,以及一套Lustre文件系统。目前,所部署的验证环境已经汇聚1.57 PB存储空间,汇聚的各中心资源见表3。目前,所研发的Web界面也被集成到中国国家网格门户网站“聚合资源运行支撑环境”AROSE平台中,可以通过AROSE平台进入虚拟数据空间系统的Web界面。AROSE平台集成如图8所示。图8 AROSE平台集成4.3 典型应用验证为了验证虚拟数据空间对应用的支撑效果,笔者在实验床上开展了典型场景和应用的测试验证工作。典型场景包括数据区域的定制化共享、远程大数据集的按需随机访问、广域分布数据的多中心协同处理、工作流作业的透明数据处理4类,典型应用包括生物信息学应用、跨域目标协同识别、天气预报模式等。验证方案如图9所示,主要验证全局统一视图、存储计算协同、广域数据共享等重要的特色功能。图9 验证方案截至目前,已经验证了生物信息学方面的分子对接应用、全基因组关联分析应用,以及天气预报模式应用,跨域目标协同识别应用还在部署中。具体应用情况如下。(1)分子对接应用分子对接应用一般基于高通量计算框架来搜寻与受体大分子具备最佳结合模式的配体小分子,配体小分子则来自多个数据中心的用户共享数据集。针对此场景,在笔者研发的虚拟数据空间系统中,分子对接应用可透明地实现多中心数据聚合能力,将所有分子数据从逻辑上聚合起来,给用户提供统一的数据视图,直接以文件系统的形式访问不同中心的数据,同时也可以利用存算联动机制将计算任务合理分发到对应数据所在的超算中心,以减少数据迁移,实现计算结果的自动规约。具体验证情况如图10所示。图10 分子对接应用验证该应用在验证环境中的4个节点上部署,验证结果表明,吞吐率达到了单个节点的3.07倍,有效提升了分子对接应用的执行效率。(2)全基因组关联分析应用全基因组关联分析需要处理大规模数据,计算过程中会使用多个计算工具,产生大量阶段性计算的中间文件。单个分析数据文件达数百兆,且与基因测序深度和测序人数相关,深度越大,人数越多,数据量越大,一般在几百TB到PB级。实验所用基因数据测序深度为0.1×时,实验中用到的平均单个基因文件约为260 MB,测序100万人的基因组就需要处理100万个基因文件,数据量达几百TB。若将测序深度提高到1×,则数据量可达PB级。此外,分析过程中用到的多个计算工具之间也不可避免地会产生中间文件,用于计算工具衔接和避免程序崩溃,从而在程序崩溃时不必重启全部计算。这就使得在原有数据规模的基础上,文件量又成倍地增加。如此大量的文件访问使得元数据服务器极易拥堵,因为在分布式文件系统中,相比对象存储服务器,元数据服务器更容易成为瓶颈。针对此场景,笔者在部署环境上进行了相关实验,具体如图11所示。图11 全基因组关联分析测试中,虚拟数据空间为超算中心的生物数据库建设提供了支撑,一方面汇聚了各超算中心用户提供的开放数据,可供更多科研工作者共享;另一方面为应用提供了跨多个超算中心提取数据的能力,并针对一些特定的数据查询、匹配操作,采用存算协同机制,将计算任务分发到多个超算中心,以提高并发性。(3)天气预报模式应用天气研究与预报(weather research and forecasting,WRF)模型是典型的中尺度天气预报模式和同化系统,属于计算密集型应用,数据量小,但计算量大,需持续将数据输入计算中心,而将各气象站数据以文件传输方式汇聚到计算中心是一项繁杂的工作。此外,为了更精确地预测气候变化,模式的精度和分辨率需求也在不断提高,这使得模式的计算量大幅增加。验证中采用基于嵌套降尺度的WRF应用,在需要计算的区域嵌套多层、多块不同分辨率的网格,细网格通过相邻粗网格根据细化率进行局部加密得到,从而将中心A和中心B的计算时间重叠,缩短整体计算时间,以更好地利用各中心的闲置资源,协同完成大尺度、高分辨率的天气预报,具体如图12所示。图12 天气预报模式应用虚拟数据空间的全局虚拟视图可将多采集点数据逻辑汇聚到虚拟数据空间,各时序任务从虚拟数据空间获取数据。在交互时,从虚拟数据空间查看所需数据的生成及完整性,传统模式则通过ssh远程查询。通过虚拟数据空间访问远程数据,数据的迁移和读取可由系统自动完成,基于系统提供的存算调度能力,也可以自适应地选择数据向任务迁移,或者任务向数据迁移,以提高资源利用率,避免跨广域的通信开销。4.4 系统性能综合测试为了验证虚拟数据空间系统的可靠性,笔者还开展了性能综合测试,测试模式如图13所示。以国家超级计算济南中心为中心,从国家超级计算长沙中心、国家超级计算广州中心、上海超级计算中心和中国科学院计算机网络信息中心以总负载压力超过1 GB/s的多类型负载压力对国家超级计算济南中心进行了为期25天的不间断访问。图13 测试模式测试采用FIO、DD等压力测试工具,从广域网中不同超算中心的多个客户端产生混合负载,不间断访问远程中心,测试结果如图14所示。图14 稳定性测试测试中,中国科学院计算机网络信息中心到国家超级计算济南中心的吞吐量稳定在105 MB/s左右,上海超级计算中心到中国科学院计算机网络信息中心为50 MB/s左右,国家超级计算长沙中心到上海超级计算中心为35 MB/s左右,这是因为节点对间的物理带宽不一样。测得的节点对间广域网带宽如图15所示。图15 节点对间的广域网带宽由于笔者研发的系统也提供了自适应数据缓存、按需远程访问、数据块级访问等能力,而且也对广域网通信做了大量并发通信方面的优化,测试结果基本上能保持在物理带宽附近。这一方面表明在高负载压力和长时间运行过程中,系统仍然能够较好地保证可靠性和吞吐量的稳定性;另一方面也表明系统在数据访问和广域网带宽优化等方面的关键技术行之有效。5 讨论本文设计的虚拟数据空间系统架构在国家高性能计算环境中,可统一管理和利用国家高性能计算环境计算和存储资源。目前,虚拟数据空间已部署并汇聚了国家高性能计算环境5个超算中心的存储资源,通过统一名字空间进行统一管理。此外,也可在计算时通过存算联动策略选择最佳的用户计算策略,并通过虚拟数据空间对用户的计算作业和数据进行调度,从而实现对国家高性能计算环境的资源汇聚及提升。基于本文研究成果,预期可有效提高跨中心协同工作的效率,并推动国家高性能计算环境中大型应用跨域计算模式的发展,同时提高全系统的资源利用率。无虚拟数据空间下的数据访问方式(即当前的跨域文件访问方式)如图16所示。图16 当前的跨域文件访问方式目前对于跨广域环境的基本文件操作,一般通过FTP、U盘邮寄、网络文件系统、ssh访问等方式实现,导致数据传输量大、时延大,且需要用户手动通过多个账号与各个超算中心进行连接和登录。基于本文的虚拟数据空间,则可以通过一站式登录远程访问并执行与本地访问一致的操作,同时也可实现存储和计算的协同调度及数据和作业合理全局放置,如图17所示。图17 基于虚拟数据空间的应用访问与计算模式例如,在刑侦、安防等大型应用中,搜寻和追踪一个目标时往往涉及跨地域的多计算中心和多数据源,利用虚拟数据空间实现的多中心数据聚合能力,可以给用户提供统一的数据视图,并通过存储计算协同机制将计算任务合理分发到对应数据所在的中心,以减少数据迁移,实现计算结果的自动规约。6 结束语本文针对国家高性能计算环境中聚合广域分散存储资源的技术短板及大型计算应用对跨域全局虚拟数据空间的现实需求,建立了一套可用于构建广域全局虚拟数据空间的完整技术体系,研发了一个可运行于国家高性能计算环境的虚拟数据空间系统。该成果从核心技术层面解决了长期困扰我国高性能计算环境发展的广域存储管理访问瓶颈问题,填补了我国在广域分散存储资源统一管理和跨域访问方面的技术空白,为在国家高性能计算环境中建立跨域虚拟数据空间提供了技术手段和应用经验。对于推动完善我国自主高性能计算环境软件技术体系,支撑建设资源共享、统一管理、高效协同的国家高性能计算环境,促进我国高性能计算环境自主可控和可持续发展具有重要意义。笔者的下一步工作是进一步提升国家高性能计算环境的部署规模和系统的功能扩展,并开展用户推广和宣传工作,推动研究成果与现有国家高性能计算环境的深度融合,高效聚合广域分散资源,充分发挥资源聚合效应,有效支撑大型计算应用,促进我国高性能计算环境及应用的可持续发展。致谢感谢国家重点研发计划“高性能计算虚拟数据空间”项目团队的各位老师和同学,以及为项目研发提供指导的各位项目专家。作者简介秦广军(1977-),男,博士,北京联合大学智慧城市学院讲师,中国计算机学会会员,主要研究方向为高性能计算、存储系统、大数据和机器学习等。作为项目骨干参与了国家863计划项目、国家重点研发计划项目、国家自然科学基金项目、北京市自然科学基金项目等。肖利民(1970-),男,博士,北京航空航天大学计算机学院教授、博士生导师,计算机科学技术系主任,计算机系统结构研究所副所长,中国计算机学会大数据专家委员会委员、高性能计算专业委员会常务委员、容错计算专业委员会委员,中国电子学会云计算专家委员会委员,国家计算机科学技术名词审定委员会委员,国家科技基础条件平台专家组成员,工业和信息化部电子科学技术委员会委员,中国工程院中国信息与电子工程科技发展战略研究中心专家委员会特聘专家。主要研究方向为计算机体系结构、计算机软件系统、高性能计算、云计算、虚拟化技术等。先后获得国家科技进步奖二等奖、北京市科学技术奖一等奖、中国科学院科技进步奖一等奖、原信息产业部信息产业重大技术发明奖、科技部国家重点新产品奖等国家级和省部级科技奖励。张广艳(1976-),男,博士,清华大学计算机系长聘副教授、博士生导师,主要从事大数据存储与分析的理论和方法研究,包括大数据计算、存储系统与分布式处理等方面。研究得到了国家杰出青年科学基金项目、国家重点研发计划项目、国家973项目和国家863项目等的支持。近年来提出了大规模存储系统构建及访问的方法与关键技术,有效提高了存储系统的性能、扩展性和可用性。发表学术论文40余篇,其中在FAST、USENIXATC、ACMTOS、IEEETC、IEEETPDS等计算机系统领域高水平国际会议和期刊发表论文20余篇。近五年以第一发明人获得美国发明专利授权1项、中国发明专利授权7项。牛北方(1978-),男,博士,中国科学院计算机网络信息中心研究员,中国科学院大学岗位教授、博士生导师。中国计算机学会高性能计算专业委员会委员。主要研究方向为高性能计算、数据分析算法与软件技术。陈志广(1984-),男,博士,中山大学计算机学院副教授,主要研究方向为大数据存储与处理、并行与分布式计算、高性能计算与超级计算机。联系我们:Tel:010-81055448010-81055490010-81055534E-mail:bdr@bjxintong.com.cn

非所言也

院士把关 助力打造四川省智慧生态环境管理体系

4月11日,中国工程院院士贺克斌一行莅临四川省生态环境科学研究院开展指导座谈,四川省生态环境厅党组成员、总工程师赵乐晨出席会议,深圳中兴网信科技有限公司、上海地听信息科技有限公司等相关单位代表及大气环境研究所相关人员参加。贺克斌院士听取了大气所关于“四川省空气质量调控综合决策支撑平台”的演示介绍,贺院士对平台实现的决策支撑能力表示充分肯定,并指出,该平台为全国首个进行省级层面顶层设计并实现省市联动业务化应用的空气质量调控综合决策支撑平台,标志着四川省空气质量调控决策智能化建设取得突破性进展,为科学治污、精准治污提供强力支撑。同时,贺院士提出,可继续进一步挖掘、集成“十三五”期间优秀科研成果,吸纳应用于平台,并实际服务于地方十四五期间空气质量改善。赵乐晨总工程师强调,要加强各市(州)数据对接工作,完善基础数据,将平台作为技术支撑、日常业务化技术手段,尽快推广使用,充分体现平台的空气质量调控决策支撑能力。下一步,环科院将结合贺院士及省厅建议,进一步优化系统模块,突出四川特色,充分发挥平台对科学治气、精准治气的支撑作用。【来源:四川省生态环境科学研究院】声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 邮箱地址:newmedia@xxcb.cn

金狗

基于科技成果转化的大学排名,普通大学上榜,很多名牌大学却缺席

评价一所高校实力可以参考多个因素和维度,但科研水平绝对是评价高校实力的一个重要指标。而衡量一所高校科研水平最直接的方法就是看高校的科研产出和科技成果转化,这直接彰显了高校的科研实力和师资水平。那么国内哪些高校的科研实力最强呢?我们一起看看最新发布的中国科技成果转化2020年度报告 (高等院校与科研院所篇),从中一窥国内高校的科研实力。中国科技成果转化2020年度报告 (高等院校与科研院所篇)由科技部科技评估中心(国家评估中心)发布,具有很强的权威性,因而参考价值很大。1.2019年高校院所以转让、许可、作价投资3种方式转化科技成果合同金额前10名评价科技成果的大小最直接的还是看高校或科研院所获得的合同金额,其中主要包含转让、许可、作价投资方式转化科技成果的合同金额,其在一定程度上能反映科技成果的价值。在这个合同金额前十名中,除了中国科学院上海药物研究所、中国科学院深圳先进技术研究院、中国科学院微电子研究所、深圳华大生命科学研究院四家单位为科研院所外,其他四家单位均为高校。其中,暨南大学作为国内华侨的最高学府,位列211大学和世界一流学科建设高校工程,以4380230万元的合同金额位居全国高校的NO.1,可谓“不鸣则已”一鸣惊人。暨南大学能在这一块表现亮眼,与其华侨学校的特殊属性是分不开的,其遍布全球的校友资源在全球各地政、经、商界耕耘多年,这些都让暨南大学在推广和实现自己的科技成果转化上具有很大的天然优势。除了暨南大学以外,中南大学、清华大学、上海交通大学、南方科技大学、上海科技大学等五所高校也位列合同金额排行榜前十,也是十分耀眼。2.2019年高校院所奖励个人现金和股份总金额前10名高效科研的主体还是包括老师在内的科研人员,那么他们所获得的报酬和指标也能在侧面说明高校科技成果转化的多少和效率。又该图可以看出,在排名前十的十家单位中,除了生态环境部华南环境科学研究所、中国农业科学院哈尔滨兽医研究所和中国农业科学院兰州兽医研究所外,其他7家单位均为高校,依次为中南大学、清华大学、南方科技大学、华东理工大学、湖州师范学院、西安交通大学、湖南城市学院。以上7所高校中,中南大学、清华大学、西安交通大学为985、双一流高校;南方科技大学为新兴院校;华东理工大学是211、世界一流学科建设高校…………这些高校科研实力雄厚,排在前列确实“名副其实”。其中最让人吃惊地当属湖州师范学院和湖南城市学院两所“名不见经传”的高校,他们分列第六和第八,确实出人意料。湖州师范学院历史悠久,办学历史可追溯至1916年的钱塘道第三联合县立师范讲习所,是湖州市人民政府举办的一所综合性的全日制普通高等学校。湖州师范学院科研实力可谓“惊人”,拥有有1个省重点科技创新团队、1个省重大科技创新服务平台、1个省重点实验室、1个省工程实验室和1个市重点实验室。湖南城市学院由原益阳师范高等专科学校和原湖南城建高等专科合并组建而成,是湖南省“双一流”高水平应用特色学院和“教育部信息化建设试点单位”。近年来,湖南城市学院在科学研究方面可谓“有声有色”,拥有省社科研究基地2个、省高校社科重点研究基地1个、省应用基础研究基地1个、省高校重点实验室1个、省高校产学研合作示范基地2个和省高校科技创新团队1个;湖南城市学院目前累计获国家自然科学、社会科学基金项目23项,国家社科基金项目优秀成果1项,教育部人文社会科学成果奖1项,省科学技术奖6项(其中省科技进步二等奖2项)等。3.2019年高校院所以转让、许可、作价投资方式转化科技成果的平均合同金额排名前10名由于各高校、科研单位的规模、科研人员的数目不同,因而只比较科研成果转化的合同总金额意义并不大,所以我们来看看平均合同金额的相关数据。在该项指标中,高校变动较大,仅有长春大学、上海科技大学、沈阳药科大学三所高校入榜,除了上海科技大学入围过第一个榜单,长春大学、沈阳药科大学都是”新晋“入围,着实不易。长春大学和沈阳药科大学都位于东北地区,两者一所为吉林省省属综合类大学,一所为医药类特色高校,都非常具有科研实力。4.结语根据以上三个榜单,我们可以看出高校在科研实力和科技成果转化方面有以下三个特点:第一,传统理工类强校实力犹存,依然高校引领科技创新和科技成果转化的方向;第二,南方科技大学、上海科技大学等新兴高校“后发制人”,依靠自己的国际化优势,科研实力不容小觑;第三,一些普通类院校在科学研究方面也很有建树,说明国内高校的科研水平都有普遍提升。对此,大家又有什么看法呢?欢迎大家在留言区留言讨论。

落地点

理科生550分,上海这5所二本高校值得报考:专业特色强 好就业

马上就要高考了,如果这次高考在550分,而且想去上海读大学,而且是理科专业,那么上海这5所大学你可以试着填报一下。这5所高校均是本科二批,录取分数均在550分左右。而且每一所学校都有自己的特色专业,毕业就业率高,毕业生遍布于各个行业。下面昌鸿老师带大家一起来简单了解一下这6所高校。01 上海海关学院上海海关学院(Shanghai Customs College)位于上海市浦东新区,是经教育部批准设立的具有高等学历教育招生资格的全日制普通高等学校,入选上海高等学校一流本科建设引领计划、上海高等学校一流研究生教育引领计划。学校校园占地面积521亩,下设苏州分校,占地133亩,占地面积312250平方米,教学科研仪器设备总值8853.60万元;设有8个教学院(系、部),设置10个本科专业,2个硕士专业学位授权点;学校教师总数147人,其中教授19人,在校生总规模为2710人。特设专业:海关管理、02 上海第二工业大学上海第二工业大学(Shanghai Polytechnic University),简称“二工大”,成立于1960年,是以工科为主,管经文理艺多学科协调发展的市属普通高等学校;教育部“卓越工程师教育培养计划”高校、教育部“双万计划”、教育部高职高专师资培训基地、国家级大学生创新创业训练计划。设有12个二级教学、科研单位;有2个硕士专业学位授权点,46个本科专业,31个高职专业;在校全日制学生共计13124人(其中普通本生10412人、专科生2294人,预科生43人,硕士生293人,留学生82人),夜大(业余)学生7416人;有教职工1119名,其中专任教师818名。特设专业:材料科学与工程、环境科学与工程、热功能材料实验室。03 上海立信会计金融学院上海立信会计金融学院,简称“立信”,上海立信会计金融学院由原上海立信会计学院和原上海金融学院合并组建而成。学校有松江、浦东和徐汇三个校区,占地总面积1200多亩;设有15个二级学院;有38个本科专业,1个硕士专业学位授权点;全日制在校学生近20000人,其中研究生200余人;有教职员工1500余人,其中专任教师1000余人。特色专业:工商管理、应用经济学04 上海体育学院上海体育学院(Shanghai University of Sport),简称“上体”,是由国家体育总局和上海市人民政府共建共管的体育类普通高等学校,国家首批世界一流学科建设高校,上海市高水平地方高校试点建设单位。学校设有杨浦、徐汇2个校区,占地面积600余亩;设有10个教学单位,开设本科专业23个;拥有博士学位一级学科授予点1个,博士学位二级学科授予点7个,硕士学位一级学科授予点4个,硕士学位二级学科授予点11个,硕士专业学位授予点4个;拥有教职工近700人,具有高级职称的教师259人;在校各类学生6000余人。特色专业:体育学05 上海商学院上海商学院,简称“上商”,是一所以商科为特色、多学科协调发展的的上海市属公办本科普通高校。学校有奉浦、徐汇、国权路三个校区和福州路一个办学点,建有中东欧海外教育基地;设有10个二级学院、30个本科专业、2个高职(专科)专业;全日制在校生近10000人;教职工759人,其中专任教师456人;有3个国家级一流本科专业建设点,1个上海市级一流本科专业建设点,9个上海市级应用型本科试点专业,4个ACBSP国际认证专业;有1个上海市Ⅱ类高原学科,1个上海市教委重点学科,1个上海高校一流学科(B类)培育学科。特色专业:商务传播学、商品流通学写在最后,在即将到来的高考,希望同学们可以努力在冲刺,争取考入自己理想中的大学。加油。

豳风

院士把关助力打造四川省智慧生态环境管理体系

4月11日,中国工程院院士贺克斌一行莅临四川省生态环境科学研究院开展指导座谈,四川省生态环境厅党组成员、总工程师赵乐晨出席会议,深圳中兴网信科技有限公司、上海地听信息科技有限公司等相关单位代表及大气环境研究所相关人员参加。贺克斌院士听取了大气所关于“四川省空气质量调控综合决策支撑平台”的演示介绍,贺院士对平台实现的决策支撑能力表示充分肯定,并指出,该平台为全国首个进行省级层面顶层设计并实现省市联动业务化应用的空气质量调控综合决策支撑平台,标志着四川省空气质量调控决策智能化建设取得突破性进展,为科学治污、精准治污提供强力支撑。同时,贺院士提出,可继续进一步挖掘、集成“十三五”期间优秀科研成果,吸纳应用于平台,并实际服务于地方十四五期间空气质量改善。赵乐晨总工程师强调,要加强各市(州)数据对接工作,完善基础数据,将平台作为技术支撑、日常业务化技术手段,尽快推广使用,充分体现平台的空气质量调控决策支撑能力。下一步,环科院将结合贺院士及省厅建议,进一步优化系统模块,突出四川特色,充分发挥平台对科学治气、精准治气的支撑作用。【来源:绵阳市生态环境局】声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 邮箱地址:newmedia@xxcb.cn