欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
科研战“疫”:90后博士生建冠状病毒资源数据库勾魂手

科研战“疫”:90后博士生建冠状病毒资源数据库

图为孙庆荣。中国药科大学供图摄中新网南京3月26日电 (徐珊珊 通讯员 姜晨 姜佳彤)中国药科大学26日消息,该校基础医学与临床药学学院2018级药理学专业博士生孙庆荣带领其团队成功开发了一个冠状病毒资源数据库。据了解,这是一个专为冠状病毒科研工作者开发的资源数据库平台,旨在使学者可以便捷迅速地查找冠状病毒(包括新冠病毒)的相关研究文献,准确掌握并深入了解冠状病毒的起源、研究历史、研究进程、研究热点等。尽管从建立到完善仅32天,但数据库中整合的文献资源数却不容小觑。截至3月22日,数据库里共收集了9556篇英文研究文献、3052篇中文研究文献、25个英文数据资源平台、6个中文数据资源平台以及18个与病毒学相关的主要分析工具等。值得一提的是,数据库中的研究报告和综述性论文均以时间轴为核心编排展开,从最早的1965年起开始追踪,直到2020年,时间跨度长达55年,从而最大限度地方便科研工作者基于时间顺序查阅相关文献资料,快速了解冠状病毒在每个年份的研究状况和进程,以此追根溯源,深入探究。冠状病毒资源数据库。中国药科大学供图 摄谈及数据库的开发初衷时,孙庆荣坦言,灵感主要来源于自己的导师。由于是跨领域研究,孙庆荣坦言,在研究过程中发现自己对病毒的前期研究和分析不那么娴熟。于是,在导师来茂德的鼓励下,他便萌生了开发创建一个整合冠状病毒资源和相关研究数据库的想法,方便病毒学专业以外的科研人员从事相关研究。于是,在各自居家隔离的情况下,孙庆荣与来自药学、临床药学、中药学、生物制药等多个专业的11位本科生迅速组建了团队。孙庆荣坦言,冠状病毒资源数据库的建立是一个并不轻松的过程,在数据库服务器基础环境的构建、数据整合、信息展示等环节都曾遇到过各种各样的困难。面对诸多的“拦路虎”,孙庆荣通过对数据板块合理的规划,高效带领团队进行数据收集和整合。“虽不能到前线,但作为一名药学科研工作者,希望能利用专业所长为疫情防控尽自己的一份绵薄之力。”孙庆荣说。

鄙哉

90后博士生创建数据库平台助力科研抗疫

中国青年报客户端讯(姜晨 中青报·中青网记者 李润文)疫情面前,科研不止。为了给国内外各领域专家学者查阅冠状病毒相关科研资料提供便利,中国药科大学基础医学与临床药学学院2018级药理学专业博士生孙庆荣带领其团队“CPU-病毒组”,专为冠状病毒科研工作者开发了一个资源数据库平台,Coronavirus Resource Bank(简称“CRB”,网址为http://cov.cpu.e.cn/)。据悉,该数据库平台全面整合了目前国内外有关冠状病毒的相关文献资料、病毒相关数据以及病毒研究相关分析工具,旨在使广大学者可以便捷迅速地查找冠状病毒(包括新冠病毒)的相关研究文献,促进药学、化学、生物学等多学科的交叉融合,助力国内外科研工作者早日攻破新冠病毒,造福人类健康。据了解,孙庆荣是中国药科大学药理学专业博士生,师从德国科学院院士、中国药科大学校长来茂德教授。孙庆荣博士期间外派至浙江大学基础医学院生理病理中心进行结直肠癌转移过程中基因突变的研究,主攻方向为肿瘤生物信息学大数据。尽管从建立到完善仅仅32天,但数据库中整合的文献资源数却非常丰富。截至3月22日,数据库里共收集了9556篇英文研究文献、3052篇中文研究文献、25个英文数据资源平台、6个中文数据资源平台以及18个与病毒学相关的主要分析工具。数据库的建立并轻松,但这段经历却让孙庆荣有了更多启发,“了解病毒的机制才是药物研发的开始。只有通过对病毒机制的大量研究,才能加速推进药物筛选疫苗研发,造福人类健康事业。”据悉,数据库中的研究报告和综述性论文均以时间轴为核心编排展开,从最早的1965年起开始追踪,直到2020年,时间跨度长达55年。面对海量文献研究资料,孙庆荣博士团队并不是简单地进行全盘收纳,而是有的放矢,剔除一些评论性以及策略性文章,只保留学术研究、学术综述、病例解析、数据平台、分析工具等相关内容,集中有效学术资源,为冠状病毒科研工作服务。“虽不能到抗“疫”前线,但作为一名药学科研工作者,希望能利用专业所长为疫情防控尽自己的一份绵薄之力。”孙庆荣希望,通过数据库的建立能把其他领域的思维转化到病毒学领域,推动各领域科研工作者对冠状病毒进行全方位、多角度的深层次研究和探讨,助力国内外科研工作者早日攻破新冠病毒。(来源:中国青年报客户端)

依依惜别

全球科研项目数据库上线收录多国基金项目数据

中国科学院兰州文献情报中心16日披露,由该中心开发建设的“全球科研项目数据库(ProjectGate)”正式上线,旨在为系统了解全球主要国家科技部署和科研项目信息提供信息支持和决策支撑。“全球科研项目数据库(ProjectGate)”汇聚了全球主要国家重要基金组织2006年以来的科研项目数据180多万条,涵盖中、美、英、德、加、法、日、澳、欧盟等10多个重点国家和组织,收录23个重要基金组织如NSFC、NSSFC、NSF、NIH、NASA、EPA、DOE、DFG、RCUK、InnovateUK、WellcomeTrust、ANR、JSPS等近10年资助的项目数据,提供项目、项目主持机构、项目主持人、项目成果的关联检索与浏览,支持检索或浏览结果的批量下载,科研项目信息的订阅等服务。据中国科学院兰州文献情报中心介绍,如何全面快速发现全球科研项目信息一直是科研用户信息获取的瓶颈问题。全球科研项目数据库融会项目信息集成检索发现与即时统计分析功能,有效补充了科技信息保障体系中项目信息缺失与快速分析难等问题,同时支持基于基金项目的统计分析,如年度基金项目资助领域/主题分布,基金项目资助主题趋势/热点分析,国别基金项目资助领域/主题分布,国家/机构项目布局国际对标分析,基金组织资助领域/主题分布,Top项目主持机构、Top项目主持人等,可为科研项目申报、领域科研热点态势分析、国家与机构科研布局分析和科研评价等项目分析提供支撑。“全球科研项目数据库(ProjectGate)”在测试阶段已面向中科院科研用户开展项目信息检索服务,为科研人员项目申报、发现国外相关领域项目部署情况,捕获相关领域研究热点等提供支持,并支撑了《中国气候变化研究近10年资助项目分析》《海洋科学领域美、英、德、日、中科研项目布局统计》和《世界主要国家基金资助重点态势分析(2007—2017)》等分析工作。(文章来源:中国新闻网)

不敬

研究生科研的必备工具有哪些?

作为一名研究生,在科研的过程中必不可少的会使用一些工具辅助写论文和搞研究。所谓“工欲善其事,必先利其器 ”。小编从自身经历,从论文检索、论文下载、论文写作等三个方面介绍一下在科研过程中常用的工具吧!当然,office、pdf、PPT等这类的基础必备工具就不介绍了。一、 论文检索1,百度学术&谷歌学术:百度学术和谷歌学术其实都差不多,国内外的文献都能查,但有的时候百度学术搜不到的,谷歌学术可以。现在谷歌学术国内不能用,但是可以通过镜像网站搜索。每次小编检索论文的时候,喜欢在百度学术检索关键词,找好文章后,然后再去下载。2,WEB OF SCIENCE:这是用来查询国外文献的,是全球最大的、学科覆盖最多的信息资源库,是全世界公认的科研必备数据库。二、论文下载1、中文文献下载找中国知网:知网是中国国家知识的基础设施,国内搞科研的童鞋用得最多网站,没有之一。就是翟大博士不知知网为何物而被打假的那个知网,所以搞科研的朋友们,记住知网!2、SCI下载找Sci-Hub: 它的诞生就是为了避免下载论文所需支付的高昂费用,即可以免费下载SCI论文,小编通常是找好文章名字之后,直接来这里下载。三、论文写作1,参考文献管理:写过文章的同学知道,文章的参考文献管理最麻烦了,文章出现增减,就得导致所有的参考文献重新捋一遍,为此小编推荐两个不错的辅助软件。撰写中文文章的时候,推荐NoteExpress,国内开发的软件,免费使用,兼容性不错;撰写英文文章的时候,推荐Endnote,这个软件比较智能,引用格式也比较的全,因为正版需要收费,所以需要破解,对中文文献的格式支持不够好。2、流程图绘制:小编主要是使用VISIO,十分希望大家推荐一下其他好用的软件。当然,偶尔有些简单的,小编都是在PPT上绘图。3,数据统计与分析:小编是理工科,有一定的编程功底,基本是Matlab和python分析,这方面基础薄弱的推荐SPSS软件,易上手。4,英文文章翻译:谷歌翻译,并使用CNKI翻译助手查询一些专业名词,在通过自己整理后,用Grammarly软件修改语法和拼写错误。小编极力推荐Grammarly软件,真心给了小编写论文极大的帮助5,文章排版:很多人向小编推荐过Latex软件,号称全网最强大、最专业的排版软件,然而小编还没有开始用,下篇文章开始用,等亲测效果以后再来分享。以上就是小编在科研过程用到过的工具,除了Latex软件安装了未用之外,其他都是亲测过的,希望对广大研友们有一定的帮助,同时,非常期待科研大佬们分享一些自己常用的辅助工具,给小编也减减负,欢迎大家留言(图片来源于网络,如有侵权请务必联系删除)

无拘无束

基于临床科研大数据平台研究

利用人工智能技术建设临床科研大数据平台。采用了Openstack作为数据平台私有云的解决方案,应用层使用Docker容器化的方案,数据库使用了开源数据库软件PostgreSQL,平台的应用主要由科研数据中心、临床大数据治理平台、智能科研检索、临床科研采集系统、全院级科研随访系统五部分组成。通过该平台临床研究人员获取数据将更便捷、科研管理更高效、探索新的研究方向更容易。基于临床科研大数据平台,能为医院各专科提供有效的科研服务,实现科研、论文和核心技术等方面的突破提升。随着医疗体制改革的深入,科研水平成为衡量医院发展水平的重要因素。科研大数据平台作为医院科研、教学工作的一个重要组成部分,在提高临床科研水平和培养医学研究人才方面发挥着十分重要的作用。如何为临床科研人员搭建平台,以有限的资源发挥最大效应,实现资源共享,最大限度地发挥科研支撑平台的作用,是目前大型综合性医院亟需解决的课题。研究背景 2017年国务院发布的《新一代人工智能发展规划》中提出要大力推广应用人工智能治疗新模式新手段,建立快速精准的智能医疗体系。随着大数据和人工智能的运用,国内外涌现了一大批借助医学信息学和机器学习技术进行临床研究数据分析挖掘,取得了丰硕成果。通过对医疗电子化数据的建模、分析、挖掘,并且基于数据二次利用所形成的进一步应用,已经成为医疗信息化、精准化、智能化的下一个核心发展方向。我国健康大数据和医疗人工智能行业尚处于起步阶段,基础薄弱。目前国内最有代表性的医疗人工智能产品,在于基于医疗影像的人工智能自动筛查和诊断系统,对胸片、皮肤照片、脑部影像等医学影像进行自动分析,并生成相应的影像诊断报告。但在其他人工智能的技术领域,例如自然语言处理、语音识别,以及通用的机器学习方法,目前在中国形成可落地的产品尚不多见 。基于临床科研大数据平台的架构与应用目前大部分医院已经建立了较为全面的医疗信息化支撑体系,无论是电子处方、医嘱套餐,还是临床路径、电子病历,在提高临床效率服务上下足了功夫,但由于临床数据分散在多个应用系统中(如EMR、LIS、PACS等),且都是非结构化的海量数据。本文通过人工智能技术的应用进行探讨,为有兴趣致力于研究大数据的临床科研工作者提供一点思路。技术架构研究采用了Openstack作为数据平台私有云的解决方案。通过使用Openstack搭建私有云平台,既可以获得类似阿里云等公有云的灵活、弹性、扩展性等云计算的优势,又可以降低安全风险。在应用层使用Docker容器化的方案。通过使用Docker容器化部署,每个服务运行在了一个独立的环境之中,互不干扰,也不会影响宿主机的环境,解决了长久以来生产环境与开发测试环境不一致导致的各种问题。同时,通过Docker提供的集群化以及资源分配功能,提供了更高的可用性,并提供了不停机升级的特性。数据库使用了开源数据库软件PostgreSQL。PostgreSQL作为当前最先进的开源关系型数据库管理系统,体现了极高的性能与稳定性,支持python、perl、c、R、Java、Javascript、PL/PgSQL等多种语言编写存储语言及扩展,支持多种特殊索引结构、支持自定义的数据结构、支持机器学习库以及GPU并行计算等。基于临床科研大数据平台的应用基于临床科研大数据平台的应用主要由以下几部分构成:科研数据中心、临床大数据治理平台、智能科研检索、临床科研采集系统、全院级科研随访系统等应用(表1)。在此治理和科研采集的基础之上,未来可支持科研统计分析及临床辅助决策。在人工智能支撑下,通过临床辅助决策应用到电子病历等业务系统中,将治疗评价、风险预测贯穿在诊疗流程,基于医院原有临床数据进行实时决策支持,最终实现临床采集-科研分析-指导临床的闭环。表1 临床科研大数据平台应用全院级专病科研数据中心通过将原有院内临床数据中心CDR,未充分结构化的病历、报告等文本数据,经过人工智能技术处理形成高质量、多维度的结构化数据,以满足科研检索、临床数据收集、统计分析的需要。结合科研采集、随访管理等系统采集的数据,进一步丰富“以患者为中心”的科研数据库。临床大数据治理平台基于自然语言处理、知识图谱、机器学习等AI引擎的大数据治理平台,实现各类临床数据的结构化、标准化和归一化等处理。针对数据驱动的临床研究场景,能够将医院积存的海量临床数据自动结构化、标准化成可被临床研究直接分析、利用的科研数据。治理后的结果为后续的临床应用提供了良好的数据基础。智能科研检索提供多维度、多病种符合专病模型的检索功能,从病历、诊断、用药医嘱、检验、检查报告、体征等结构化及非结构化文本中提取检索点位,个性化定制专病检索模型。支持通过入选和排除等集合运算实现研究人群的精确筛选,实现自动发现满足条件的新病人并自动入组,实时精准从海量病历中定位研究人群。临床科研采集系统在数据治理基础上,满足科研所需的病例报告表(CRF)设计与数据采集、科研项目管理、团队管理与多中心、权限设置与隐私、数据核查与质疑、数据导入导出等常见功能模块。高度结构化、规范化的病历数据,利于病例报告单(CRF)自动填写,科研流程管理支持研究全过程协同。全院级科研随访系统可有效解决院内外数据整合、患者依从性差、失访率居高不下的难题,在全面提升随访专业度、保证科研项目的顺利推进的同时,极大地提升科研人员的工作效率。随访平台从患者管理和科研需求出发,整合随访计划提醒、随访量表填写、智能科普患教、在线病情咨询、患者报告结局(ePRO)信息采集等功能;自动问答功能为患者提供准确的知识问答和健康建议,实现个性化健康宣教和科普。同时为满足临床科研需要,可将患者采集结果便捷地返回给专病科研库,实现对患者离院后健康信息的全量收集。结论与展望智能化的临床科研支持系统不仅能对历史病历数据进行快速检索浏览,而且能便捷地将临床数据应用于具体研究中,成为医院各科室开展临床研究提供高效的工具,加速推进学术研究及成果转化,释放积压的大量医疗数据潜在学术价值。同时在全院级临床科研大数据平台与应用平台上,实现了各业务系统历史数据及实时数据的整合、治理。经过治理后的数据保障临床科研数据质量,在此基础上各科室临床研究人员获取数据将更便捷、科研管理更高效、探索新的研究方向更容易,从而实现科研效率整体提升,不断提升学术研究能力,实现医院临床学术研究质和量提升。【引用本文:朱明宇. 基于临床科研大数据平台研究[J]. 中国数字医学,2020,15(7):17-18,35.】新媒体部: 010-81138718;81138717

硕人

“90后”博士生创建冠状病毒资源数据库平台助推科研

中国江苏网3月26日南京讯(通讯员 姜晨姜佳彤)疫情面前,科研不止。为了早日战胜新冠病毒,国内外各领域专家学者都在争分夺秒地研究冠状病毒相关专业知识,为抗击疫情贡献力量。然而,不可否认的是,当下网络平台上关于冠状病毒繁多冗杂的页面信息可能会降低科研工作者查找新冠病毒专业信息和相关研究文献的效率。中国药科大学“CPU-病毒组”团队全体成员3月26日,记者从中国药科大学获悉,该校基础医学与临床药学学院2018级药理学专业博士生孙庆荣带领其团队“CPU-病毒组”成功开发了一个冠状病毒资源数据库Coronavirus Resource Bank(简称“CRB”,网址为http://cov.cpu.e.cn/)。这是一个专为冠状病毒科研工作者开发的资源数据库平台。正如网站首页介绍的那样,该数据库平台全面整合了目前国内外所有冠状病毒的相关文献资料、病毒相关数据以及病毒研究相关分析工具,旨在使广大学者可以便捷迅速地查找冠状病毒(包括新冠病毒)的相关研究文献,准确掌握并深入了解冠状病毒的起源、研究历史、研究进程、研究热点等,从而推动各领域科研工作者对冠状病毒进行全方位、多角度的深层次研究和探讨,促进药学、化学、生物学等多学科的交叉融合,助力国内外科研工作者早日攻破新冠病毒,造福于全人类健康。中国药科大学“90后”博士生孙庆荣在家远程访问数据库服务器时间为轴,贯穿中外追溯冠状病毒相关文献横跨50余年记者了解到,冠状病毒资源数据库(CRB)尽管从建立到完善仅仅才32天,但数据库中整合的文献资源数却不容小觑。截至3月22日,数据库里共收集了9556篇英文研究文献、3052篇中文研究文献、25个英文数据资源平台、6个中文数据资源平台以及18个与病毒学相关的主要分析工具等等。海量的冠状病毒数据信息虽说全面详实,但也会带来分类整理的难题。为了让国内外科研工作者在浩如烟海的数据库中不至于晕头转向,孙庆荣博士团队特意将数据库页面以中文和英文分别展示,清晰划分为两大板块,即“国内冠状病毒研究”和“国际冠状病毒研究”。在这两大板块下又设有多个子栏目,这些子栏目分别涵盖了冠状病毒发现至今的所有相关研究报告和综述性论文、冠状病毒所有数据资源系统(平台)、与病毒学相关的分析工具以及冠状病毒相关专利信息等。值得一提的是,数据库中的研究报告和综述性论文均以时间轴为核心编排展开,从最早的1965年起开始追踪,直到2020年,时间跨度长达55年,从而最大限度地方便科研工作者基于时间顺序查阅相关文献资料,快速了解冠状病毒在每个年份的研究现状和进程,以此追根溯源,深入探究。一个资源数据库的建立并不是资料盲目整合的过程,开发者需要对资料进行筛选,冠状病毒资源数据库(CRB)也不例外。记者了解到,面对从20世纪60年代至今的海量文献研究资料,孙庆荣博士团队并不是简单地进行全盘收纳整合,而是有的放矢,剔除了一些评论性以及策略性文章,只保留了学术研究、学术综述、病例解析、数据平台、分析工具等相关内容,这样能够更好地集中有效学术资源,既精准覆盖又全面科学,真正为冠状病毒科研工作服务。不负师恩,迎难而上“你时刻在脑子中惦记着科研,它才会时常给你惊喜”为什么要开发创建冠状病毒资源数据库(CRB)?当谈及数据库的开发初衷时,孙庆荣博士坦言,这一开发灵感主要来源于自己的导师。据了解,孙庆荣是中国药科大学药理学专业博士生,师从德国科学院院士、中国药科大学校长来茂德教授。孙庆荣博士期间外派至浙江大学基础医学院生理病理中心进行结直肠癌转移过程中基因突变的研究,主攻方向为肿瘤生物信息学大数据。在教学过程中,来茂德教授时常勉励他的学生:“对于一名科研工作者,要时刻在脑子中想着科研,因为你时刻惦记着它,它才会时常给你惊喜。”正是出于对新冠肺炎疫情的时刻惦记,来茂德教授从医药大数据的角度出发鼓励学生们多进行新冠病毒的相关研究,包括基础的多序列比对、进化分析以及新冠病毒重要靶点ACE2蛋白的分析等。由于是跨领域研究,孙庆荣坦言在研究过程中发现自己对病毒的前期研究和分析策略不能做到像在研究肿瘤方面那么娴熟。于是,在导师来茂德教授的鼓励下,他便萌生了开发创建一个整合冠状病毒资源和相关研究数据库的想法,方便病毒学专业以外的科研人员从事相关研究。于是,在疫情形势严峻、各自居家隔离的情况下,孙庆荣博士与来自中国药科大学药学、临床药学、中药学、生物制药等多个专业的11位志同道合的本科生迅速组建了“CPU-病毒组”团队,大家一起查阅文献、整理资料、搭建网站,开始了冠状病毒资源数据库的组建工作……孙庆荣博士坦言,冠状病毒资源数据库(CRB)的建立是一个并不轻松的过程,在数据库服务器基础环境的构建、数据整合、信息展示等环节都曾遇到过各种各样的困难。“数据库服务器基础环境建设需要相关专业人员才能实现,数据的整合需要人工检索、筛选,工作量巨大。还有一些图书馆资源的问题,也需要专业人士的帮助。除此之外,疫情期间均需要各自居家工作,由于团队成员家庭网络的差异,大家的网络最优时段也不同,协调统一会有点难度。”面对诸多的“拦路虎”,孙庆荣博士并没有退缩。他通过对数据板块合理的规划,高效引领着团队进行数据收集和整合。对于国内资源,由于数量相对较少,他们采用人工检索为主的方式对中国知网和万方数据库进行逐一排查;对于国外资源,他们采用API和人工检索相结合的方法,实现数据的整合及入库。为了让大家更方便快捷地看到信息,他们解析了其他数据平台的数据传递接口,以建立平台直达原始数据库的快捷通道。团队不少小伙伴克服了种种现实困难,实现了异地协调统一,高效率地完成了每天的工作任务。此外,孙庆荣博士特别感谢导师来茂德教授与该校图书与信息中心老师们的悉心指导和大力支持。“团队的建立、基础环境构建、数据库的测试,若是没有老师们的帮助,我们根本完成不了的。”践行初心,永不止步“虽不能到抗疫前线,但希望助力早日攻破病毒”当记者问及整合这些庞大数据是否觉得枯燥时,孙庆荣博士微微一笑:“因为喜欢所以快乐,不会枯燥。”据了解,中国药科大学是孙庆荣梦想开始的地方,也是他的初心所在。凭借着自己对药学科研的孜孜追求和不懈努力,孙庆荣一路考研考博,现正在专攻自己最感兴趣的专业方向。“我真的很幸运,因为药大提供了优越的科研条件,导师给予了我悉心指导和热情帮助,学院和辅导员又提供了无微不至的关怀和照顾,才使我一路追梦,从没放弃。”孙庆荣表示,这次开发数据库的经历给了他在药物研究方面很深的启发。不仅深入了解了冠状病毒发展史,更在学科融合的过程中开拓了视野,收获了自己在肿瘤生物信息学大数据研究领域内的新思路。“了解病毒的机制才是药物研发的开始。只有通过对病毒机制的大量研究,才能加速推进药物筛选疫苗研发,造福人类健康事业。”孙庆荣感叹道,自己虽不能到抗“疫”前线,但作为一名药学科研工作者,希望能利用专业所长为疫情防控尽自己的一份绵薄之力,希望把其他领域的思维转化到病毒学领域,从而推动各领域科研工作者对冠状病毒进行全方位、多角度的深层次研究和探讨,助力国内外科研工作者早日攻破新冠病毒,也希望全世界人民都能尽快渡过难关、战胜疫情。据悉,下一阶段,孙庆荣博士团队将不断对数据库平台进行资源更新,并加入更多数据分析以及与冠状病毒相关药物的数据资源。

血统

多中心临床数据库在科研中的应用

导读:医院信息化的发展和建设带来丰富的患者资源,如何将这些已存在的患者资源转化为有效的临床研究数据是现今临床科研人员所面临的机遇和挑战。而多中心临床数据库可处理临床病例资料,并实现跨多中心的临床科研协作。以广州医科大学附属第一医院的多中心临床数据库为例,对其在科研应用中的优势、潜在问题及对策进行探讨。随着医院信息化不断深入发展和建设,医院信息系统正存储越来越多患者的病例资料,而且这些患者资料无疑是符合“容量大、增长快、种类多”标准的大数据,倘若可以联合多家医院的患者资源,这将是一个非常可观的临床研究数据宝库。如何将这些已存在的患者资源转化为有效的临床研究数据是现今临床科研人员所面临的机遇和挑战。而多中心临床数据库作为一个集约化的数据仓库,既可以跨信息系统、全面有序地处理临床病例资料,同时又可以共享多家医院的数据资源,满足跨多中心临床科研协作的需求,为临床科研提供有力的支撑。因此,在2017年5月开始建立多中心临床数据库以提高临床数据在科研中的应用水平。将以我院为例探讨多中心临床数据库在科研应用中的优势、潜在问题及对策。多中心临床数据库的建立背景多中心临床数据库早已在国内外兴起。国外早已开始建设多中心临床数据库,实现多地区临床数据的共享。美国癌症研究所早在1973年将几个地区的肿瘤登记站联合组成监测、流行病学和最终结果数据库(Surveillance, Epidemiology and End Results, SEER),现在SEER数据库是美国最具代表性的大型肿瘤登记数据库之一,目前1975-2014年的所有资料已经发布在网上(http://www.seer.cancer.gov)。在2000年,日本建立了日本心血管外科数据库,并且在2010年又建立了包含以上数据库的国家临床数据库(National Clinical Database, NCD)。 而我国的多中心临床数据库发展起步相对较晚,大多数尚处于起步阶段,进展较缓慢。比如,虽然我国早已在1963年于上海开展肿瘤发病登记工作,但由于全国各地的推进工作进展缓慢,直到2002年才成立全国肿瘤登记中心,并建立了中国首个肿瘤防治数据库,对外开放了免费查询的网站(http://cancernet.cicams.ac.cn),但因网站长期未更新,无法获得实时更新的信息;国内最大的骨与软组织肿瘤数据库由北京积水潭医院在20世纪90年代开始构建,从第一代dBase单机版历经几代的发展,直到2013年才发展为网络数据库,该数据库除了可供内部人员登录使用,还开通了可让公众免费查询的网站(http://www.sarcoma-jst.net),虽然是单中心开发,但在研发时已规划为可供多中心使用;中国首个前列腺癌临床数据库(PC-Follow)从2008年9月至2014年12月经历了3个版本的构建,终于升级成了在线版的网络数据库,并且在2015年招募全国12家泌尿外科中心进行运行培训及测试。这表明了我国正逐步提高对多中心临床数据库的认识,并加快多中心临床数据库的建设。我国的人口基数庞大,这一人口资源可为临床研究提供大量可靠、高质量的临床数据。而多中心临床数据库可整合多家医院多个地区的临床数据,实现临床资源的有效利用,促进临床资源的共享,从而推进临床数据库的规模化。因此,为了集中高效地利用临床数据来提升临床研究水平,开始建立多中心临床数据库。多中心临床数据库的架构和功能系统架构综合考虑软件开发技术、费用与软件平台的可扩展性等因素后,与专业的信息技术服务商进行合作开发。数据库虽然以单中心研发,但规划时可供多中心使用,在技术方面采用了Apache Web服务器+Java语言+MongoDB数据库+Hadoop大数据框架等多种核心技术, 这共同构成典型的B/W/D(浏览器/Web服务器/数据库服务器)三层体系结构模式。数据库总体的系统架构为:信息系统如电子病历系统HIS、检验检测系统LIS和影像系统PACS之间通过有效集成形成大量临床数据,再对照字典转换编码为统一标准的数据存储在数据库中,同时从其他医院/研究所以及国外临床数据中心等合作单位进行对接获取相关的肿瘤数据经转码后存储至数据库。多中心临床数据库的系统架构如图1所示。图1 多中心临床数据库的系统架构模块功能数据录入与导入模块本模块的录入功能虽然仍为手工录入,但可通过选择下拉框或多选框,对照字典转换编码为统一标准的数据,极大减轻了数据录入时的工作量。而导入功能则可将现有的表单、影像学图像等资料上传至数据库中。数据查询与导出模块根据使用者的科研目的,自定义查询条件,即可浏览所指定的查询结果,而且可将这结果以EXCEL表格的形式导出。角色管理与字典管理模块数据库的管理者通过账号注册可成为系统管理人员,这一角色有权对其他多个角色进行设置和管理,比如可设置分中心负责人和科室医生等角色,并对他们开放不同模块的权限。字典管理模块仅对授权的角色可见,授权的角色可根据需要修改增减字典中的字段。多中心临床数据库在科研应用中的优势整合多中心的临床资源,扩大科研样本量联合建库是突破资源制约、满足临床科研“多中心、大样本”的病例信息需求和建设高质量病例数据库的主要途径。数据库联合了多地区的临床资源,促进临床资源实时共享,提高临床资源的利用水平,并且在一定范围内扩大样本量。提高临床数据的完整性,提高数据的可挖掘性数据库的数据采集来源于多个信息系统,这些原始数据保留了患者所有的诊疗信息。同时,由于需要尽可能保留所有患者的信息,字典转码实际上属于数据的分类整理,这进一步提高了数据的完整性。除此之外,无法转码的内容也会存储在数据库中,以便满足日后科研的需要,提高了数据的可挖掘性。提高数据的检索效率,方便管理随访患者数据查询模块中所提供的自定义查询可进行多维条件的快速筛选,提高了数据的检索效率。而且,数据库会根据术后患者的随访安排筛选随访到期的患者,形成随访提醒,避免造成失访,方便科研人员跟踪管理随访患者。多中心临床数据库在科研应用中的可能出现的问题及其对策原始数据对照字典转码的过程仍需人工转录,这种人工输入不仅繁琐费时,还易出错。因此,为了尽量减少这种输入错误,需要建立数据质量控制制度,录入或导入的数据需通过审核后才能发布。数据库需要通过网络实现多中心共享数据,需要考虑网络安全性及患者信息保密性的问题。数据库具有统一的身份认证系统,需要通过账号密码登录角色,而且不同角色有不同的访问权限。同时,数据库对患者基本信息加密,使共享的患者隐私信息以非明文显示。数据库的及时更新和长期运营均需要专业人员进行维护和管理。而与专业的信息技术服务商建立起长期战略合作伙伴的关系,在医院内共同逐步培养一支既精通业务、又掌握信息化技术的复合型两栖人才队伍来维护和管理数据库,且在此之前,他们将会继续提供技术维护服务。当今世界,仅凭单中心研究已远远不能胜任科研的需求,多中心研究甚至跨国研究已成为一种趋势。多中心临床数据库是临床转化研究的核心,它在科研应用中有诸多优势:可整合多中心的临床资源,扩大科研样本量,帮助科研人员在大数据中进行挖掘,形成有用的科研数据,有助于提高医院的科研水平。目前,该数据库已基本建成,下一步将进行数据调试,需要在调试中进一步调整数据库,同时加强数据库管理的人才队伍培养,以期早日将其应用于科研当中。文章来源:《中国数字医学》杂志2018年第12期,作者及单位:李丹玲 张志强 潘辉 沈建飞 何建行,广州医科大学附属第一医院转化医学实验室 广州医博信息技术有限公司数据研究院 浙江省台州医院心胸外科。戳这里!!!关于召开2019中华医院信息网络大会(CHINC)的第一轮通知“2018年度全国医院信息化杰出领导力和创新力人物”评选表彰活动2019中华医院信息网络大会(CHINC)征文通知传播数字医学领域发展最新动态,关注医疗卫生信息化相关资讯。长按扫码关注我们

六趣

一个神奇的论文检索网站,整合了国内外数据库,文献下载超方便

给大家推荐一个神奇而强大的论文检索网站吧,尤其是在英文文献这一块,在国内是做得最好最到位的,不论是老手还是小白用起来非常的方便,可以节省大把的时间,提升科研效率。这个网站叫:掌桥科研一站式科研服务平台(地址:zhangqiaokeyan.com/LZHH-2020042007)从上图中可以看到他的核心是“一站式”服务,也意味着方便,快捷!文献呢,中外文加起来有1.3亿+篇,且月更新数量近500万篇,可以说在数量这一块是非常可观的。今天就单独说一下它的外文文献方面。掌桥科研这个平台上的外文文献有5400多万篇,包含,外文期刊、外文会议、外文学位、外文OA文献、美国政府科技报告、外军国防报告及美国卫生研究文献、新冠肺炎专题文献等。这么多文献都来自哪里呢?它整合了国外众多名站的数据库,比如IEEE、AIAA、Springer、Elsevier、Wiley、Taylor等知名数据库,并且可直接获取原文下载服务,也就是说只用一个网站,便可检索到众多论文网站的数据库中的内容,是不是很方便?除了检索方便外,还有一个更方理贴心的功能,尤其是对英文水平较差的同学来说,简直就是福音,为啥呢?检索到了英文文献,一眼看去都外文,不是母语,在阅读上肯定有障碍,自然浏览的速度就便了下来,而这里,只要检索出来,标题等信息,就自动机译成中英文对照显示了,你说是不是很方便。在上图中,可以看到下载的方便有两种,一种是原文传递,另一种是原文传递并翻译,如果你想翻译成中文阅读,那就选择第二种,而且翻译可以中英对照哦,保留原文格式,导出还可以选择Word格式。是不是很方便呢?以前在十几个网站之间来回转换检索查找,现在一个网站搞定,简直是perfect!

“全球科研项目数据库”正式上线

“全球科研项目数据库”正式上线每日甘肃网兰州讯(甘肃日报·每日甘肃网记者秦娜)由中科院兰州文献情报中心开发建设的“全球科研项目数据库(ProjectGate)”日前正式上线,该数据库可向科研用户提供全球主要国家科技部署和科研项目信息并进行分析。科研项目信息反映了一个国家的科技部署、科研实力以及研究重点的变化、科技创新的轨迹。全球科研项目数据库汇聚了全球主要国家重要基金组织2006年以来的科研项目数据180多万条,能够提供项目关联检索与浏览,支持检索或浏览结果的批量下载,以及科研项目信息的订阅等服务。同时,该平台融会了项目信息集成检索发现与即时统计分析功能,有效补充了科技信息保障体系中项目信息缺失与快速分析难等问题,能够支持基于基金项目的统计分析,如年度基金项目资助领域、主题分布等,可为科研项目申报、领域研究热点态势分析、国家与机构科研布局分析和科研评价等项目分析提供支撑。据悉,该数据库在测试阶段已面向中科院科研用户开展项目信息检索服务,并支撑了《中国气候变化研究近10年资助项目分析》等工作。

万物循生

科研神器操作系列——信号通路查询工具KEGG(系列一)

原来是一颗彩蛋呀!没错,今天我们就来认识这颗蛋What is KEGG?KEGG is a database resource for understanding high-level functions and utilities of the biological system, such as the cell, the organism and the ecosystem, from molecular-level information, especially large-scale molecular datasets generated by genome sequencing and other high-throughput experimental technologies.(官网的简介)英文名:Kyoto Encyclopedia of Genes and Genomes中文名:京都基因与基因组百科全书从名字就能看出来,这是日本人开发的。没错,这个平台是由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立(ps:所以它的网站有日文和英文两个版本,莫名的羡慕)。KEGG是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。KEGG是一个从分子水平信息,特别是基因组测序和其他高通量实验技术产生的大规模分子数据集,了解细胞、有机体和生态系统等生物系统的高级功能和效用的数据库资源。2020年4月1日,官网更新到了94.0版本。这是官网的样子,还算挺简洁的。When is it used ?①当你想查某个分子的信息时;②当你想按照某个分子查通路信息时;③当你想按某个疾病查分子时;④当你想按某个药物查分子时;⑤当你高兴时。How to use it ?以小编以前做过的NMDAR1为例:问题一:查找小鼠中NMDA1的基因信息?问题二:查找NMDAR的亚单位?结果显示NMDAR有7个亚单位:NMDA1,NMDA2A-2D,NMDA3A-3B。问题三:查找NMDAR有关long-time potentiation的pathway?其实,小编这里提供的都是最简单的查找方式。这个网站还可以做很多检索,例如:查蛋白的结构,链接到 GenomeNet Database Resources等。最后,送给大家一句话,最好的技能习得就是实践。话不多说,开始吧!