欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
基于临床科研大数据平台研究古今不代

基于临床科研大数据平台研究

利用人工智能技术建设临床科研大数据平台。采用了Openstack作为数据平台私有云的解决方案,应用层使用Docker容器化的方案,数据库使用了开源数据库软件PostgreSQL,平台的应用主要由科研数据中心、临床大数据治理平台、智能科研检索、临床科研采集系统、全院级科研随访系统五部分组成。通过该平台临床研究人员获取数据将更便捷、科研管理更高效、探索新的研究方向更容易。基于临床科研大数据平台,能为医院各专科提供有效的科研服务,实现科研、论文和核心技术等方面的突破提升。随着医疗体制改革的深入,科研水平成为衡量医院发展水平的重要因素。科研大数据平台作为医院科研、教学工作的一个重要组成部分,在提高临床科研水平和培养医学研究人才方面发挥着十分重要的作用。如何为临床科研人员搭建平台,以有限的资源发挥最大效应,实现资源共享,最大限度地发挥科研支撑平台的作用,是目前大型综合性医院亟需解决的课题。研究背景 2017年国务院发布的《新一代人工智能发展规划》中提出要大力推广应用人工智能治疗新模式新手段,建立快速精准的智能医疗体系。随着大数据和人工智能的运用,国内外涌现了一大批借助医学信息学和机器学习技术进行临床研究数据分析挖掘,取得了丰硕成果。通过对医疗电子化数据的建模、分析、挖掘,并且基于数据二次利用所形成的进一步应用,已经成为医疗信息化、精准化、智能化的下一个核心发展方向。我国健康大数据和医疗人工智能行业尚处于起步阶段,基础薄弱。目前国内最有代表性的医疗人工智能产品,在于基于医疗影像的人工智能自动筛查和诊断系统,对胸片、皮肤照片、脑部影像等医学影像进行自动分析,并生成相应的影像诊断报告。但在其他人工智能的技术领域,例如自然语言处理、语音识别,以及通用的机器学习方法,目前在中国形成可落地的产品尚不多见 。基于临床科研大数据平台的架构与应用目前大部分医院已经建立了较为全面的医疗信息化支撑体系,无论是电子处方、医嘱套餐,还是临床路径、电子病历,在提高临床效率服务上下足了功夫,但由于临床数据分散在多个应用系统中(如EMR、LIS、PACS等),且都是非结构化的海量数据。本文通过人工智能技术的应用进行探讨,为有兴趣致力于研究大数据的临床科研工作者提供一点思路。技术架构研究采用了Openstack作为数据平台私有云的解决方案。通过使用Openstack搭建私有云平台,既可以获得类似阿里云等公有云的灵活、弹性、扩展性等云计算的优势,又可以降低安全风险。在应用层使用Docker容器化的方案。通过使用Docker容器化部署,每个服务运行在了一个独立的环境之中,互不干扰,也不会影响宿主机的环境,解决了长久以来生产环境与开发测试环境不一致导致的各种问题。同时,通过Docker提供的集群化以及资源分配功能,提供了更高的可用性,并提供了不停机升级的特性。数据库使用了开源数据库软件PostgreSQL。PostgreSQL作为当前最先进的开源关系型数据库管理系统,体现了极高的性能与稳定性,支持python、perl、c、R、Java、Javascript、PL/PgSQL等多种语言编写存储语言及扩展,支持多种特殊索引结构、支持自定义的数据结构、支持机器学习库以及GPU并行计算等。基于临床科研大数据平台的应用基于临床科研大数据平台的应用主要由以下几部分构成:科研数据中心、临床大数据治理平台、智能科研检索、临床科研采集系统、全院级科研随访系统等应用(表1)。在此治理和科研采集的基础之上,未来可支持科研统计分析及临床辅助决策。在人工智能支撑下,通过临床辅助决策应用到电子病历等业务系统中,将治疗评价、风险预测贯穿在诊疗流程,基于医院原有临床数据进行实时决策支持,最终实现临床采集-科研分析-指导临床的闭环。表1 临床科研大数据平台应用全院级专病科研数据中心通过将原有院内临床数据中心CDR,未充分结构化的病历、报告等文本数据,经过人工智能技术处理形成高质量、多维度的结构化数据,以满足科研检索、临床数据收集、统计分析的需要。结合科研采集、随访管理等系统采集的数据,进一步丰富“以患者为中心”的科研数据库。临床大数据治理平台基于自然语言处理、知识图谱、机器学习等AI引擎的大数据治理平台,实现各类临床数据的结构化、标准化和归一化等处理。针对数据驱动的临床研究场景,能够将医院积存的海量临床数据自动结构化、标准化成可被临床研究直接分析、利用的科研数据。治理后的结果为后续的临床应用提供了良好的数据基础。智能科研检索提供多维度、多病种符合专病模型的检索功能,从病历、诊断、用药医嘱、检验、检查报告、体征等结构化及非结构化文本中提取检索点位,个性化定制专病检索模型。支持通过入选和排除等集合运算实现研究人群的精确筛选,实现自动发现满足条件的新病人并自动入组,实时精准从海量病历中定位研究人群。临床科研采集系统在数据治理基础上,满足科研所需的病例报告表(CRF)设计与数据采集、科研项目管理、团队管理与多中心、权限设置与隐私、数据核查与质疑、数据导入导出等常见功能模块。高度结构化、规范化的病历数据,利于病例报告单(CRF)自动填写,科研流程管理支持研究全过程协同。全院级科研随访系统可有效解决院内外数据整合、患者依从性差、失访率居高不下的难题,在全面提升随访专业度、保证科研项目的顺利推进的同时,极大地提升科研人员的工作效率。随访平台从患者管理和科研需求出发,整合随访计划提醒、随访量表填写、智能科普患教、在线病情咨询、患者报告结局(ePRO)信息采集等功能;自动问答功能为患者提供准确的知识问答和健康建议,实现个性化健康宣教和科普。同时为满足临床科研需要,可将患者采集结果便捷地返回给专病科研库,实现对患者离院后健康信息的全量收集。结论与展望智能化的临床科研支持系统不仅能对历史病历数据进行快速检索浏览,而且能便捷地将临床数据应用于具体研究中,成为医院各科室开展临床研究提供高效的工具,加速推进学术研究及成果转化,释放积压的大量医疗数据潜在学术价值。同时在全院级临床科研大数据平台与应用平台上,实现了各业务系统历史数据及实时数据的整合、治理。经过治理后的数据保障临床科研数据质量,在此基础上各科室临床研究人员获取数据将更便捷、科研管理更高效、探索新的研究方向更容易,从而实现科研效率整体提升,不断提升学术研究能力,实现医院临床学术研究质和量提升。【引用本文:朱明宇. 基于临床科研大数据平台研究[J]. 中国数字医学,2020,15(7):17-18,35.】新媒体部: 010-81138718;81138717

乡原

1分23秒带你了解药研社的创新型临床研究解决方案

6月1日,药研社品牌宣传片正式发布,全片1分23秒诠释创新型临床研究解决方案。01:23近年来,专利期满的仿制药竞争激烈以及药品价格的严格控制,越来越多的药企进入创新药研发赛道,临床研究作为新药研发的关键环节,亟待提高效率,缩短研发周期。药研社以人才为主体,数据和技术作为驱动的“一体两翼”核心战略贯穿临床研究全程,是实现让医药研发更高效的关键所在。在这一战略引领下,临床研究入口平台Trial.Link为临床研究各方提供找中心、找数据、找患者等一站式服务,帮助研发项目搜寻和判断匹配的合作伙伴,提高临床研究效率。特色SSU,“多快好省”质量与效率兼具药研社凭借“人才+数据+技术”的核心优势,打造“多快好省”的SSU,加速临床研究进程。覆盖全国的人力资源网络,通过平台化运营提升人力的可及性;全面的临床试验数据库智能筛选合适的研究中心,启动快、质量好;本地化的机构专员快速收集信息、补充数据,节约时间和差旅成本。打造特色的SSU,药研社通过系统化培训中心办事攻略,避免流程反复,缩短周期;独立的SSU项目管理系统,制定中心筛选、机构立项、伦理审查、遗传办、合同等工作的SOP,提供知识图谱和工作清单,降低项目执行难度,提高人员执行能力,项目经理实时掌握项目进度和执行情况,系统智能评估风险,实现中心快速启动。多渠道患者招募,定制化随访工具保障依从性和数据采集药研社与阿里健康合作,面向公众招募合格的受试者,患者可在支付宝、手机淘宝等大流量平台主动报名参加临床试验,帮助患者寻找受益的临床研究项目。结合智能硬件,药研社在临床研究应用场景中率先推出远程临床研究新模式,让随访变得简单高效。在药物运输上,由具备药物运输资质的物流供应商将试验药品以全程控温的方式送达,确保用药的持续性。以受试者为中心,药研社提供持续的受试者关怀与健康教育。通过定制化的移动随访管理工具定时提醒随访,推送疾病相关咨询,帮助受试者用药等,保持与受试者的关注与沟通,确保受试者的依从性和数据采集。标准化流程管理,让参与各方协作无间药研社深度结合业务,把项目管理再造为标准化的系统操作流程,最大程度地复制成功经验,保证项目各节点的风险可控,提供高效率、低成本、标准化的临床研究服务。运用技术和数据对临床研究项目执行过程进行有效的线上整合,执行人员根据知识图谱指导工作,降低执行难度。清单化执行流程全程留痕、可追溯,管理者精准掌握项目进程和执行情况,依据汇总数据辅助决策,保障项目的质量和进度。所有信息在加密环境下实时传输共享,临床试验参与各方协作无间、打破时空的限制实现高水平合作与交流,共同提高临床试验的经验和水平。

魂魄

临床大数据的产品应用与变现(二):药企

大数据在各行各业的应用,给业态带来了颠覆式的改变。那么医疗行业中,药企可以通过临床大数据实现什么产品应用与作用呢?这是临床数据应用系列的第二篇文章,主要针对于药企讨论临床大数据的应用与变现情况。当前临床大数据非常火热,但实际情况却是商业模式不清晰、盈利困难。在上一篇文章中从法律原因、历史原因、产业原因三个方面讨论了临床数据应用困难的原因。针对药企而言,制药企业不同于医院,它是一个企业属性的机构,企业的最终目的是盈利,所以临床数据对于药企而言,必将参与到其商业模式中。药企对于临床大数据的应用可以说是一个正向的推动力,只有具备商业利益的模式才是一种稳定的模式,也会将临床数据应用推向新的高度。药企是临床数据重要的服务对象,对于药企而言无非是2个方面的价值:其一是有利于药品研发;其二有利于是药品营销。药品研发企业相对资金比较雄厚,对上述两个方面有价值的产品或服务,企业则有兴趣继续沟通。临床大数据的服务也围绕着药品研发与药品营销2个方面展开。药物研发阶段可做的工作很多:首先药物研发分为临床前阶段、临床阶段、上市阶段。本文只讨论临床大数据的应用,所以临床前阶段不在讨论范围之内。对于临床阶段而言,由于该阶段的大量研究属于前瞻性研究,数据需要基于试验设计进行入组采集分析。在临床阶段,已有的临床数据对于前瞻性研究利用价值有限,但通过已有数据寻找患者入组确是非常有效的。其次,通过临床数据是确定药物立项的有力证据。包括是否需要开展新药研发立项,是否对新品种进行引入(Licence In)等。药物营销阶段,临床数据有充分的用武之地,包括药物上市后评价、真实世界研究、营销知识图谱、健康监控与随访等。例如通过真实世界研究得到某款药物的有力证据,不但可以公开发表,甚至可以写入该药物的说明书中。这些对于药企营销具有莫大的好处。一、药物研发药物研发分为两个过程,药物临床前研究与药物临床研究,如下图所示。对于临床前研究,主要是处于实验室阶段,临床数据能够发挥的余地很小。在新药临床阶段,主要以前瞻性研究为主,即为了完成一个临床终点而招募一批患者进行入组实验。在药物临床实验中,所有的数据基本都是新产生的,这样我们已有的临床数据对于新药临床实验本身并没有太大价值。但是,对于临床实验而言,入组人群往往具有较高要求,临床数据可以帮助研究机构寻找合适的入组受试者。1.临床试验入组临床试验入组有多重方式,当前主要的方式有以下几种:(1)应确保受试者符合伦理已批准的最新方案所规定的所有入选标准,且不符合任何一项排除标准;(2)招募广告:可以通过张贴已获得伦理委员会书面批准的招募广告;(3)对所有就诊患者进行普遍筛选;(4)在门诊等待合格受试者前来就诊;(5)建立专科、专病门诊这些方式总体来讲是一种招募行为,缺乏精准性,效率也较低。通过临床数据可以较为精准的检索到患者的相关信息,可以提高招募受试者的效率。但是由于我国电子病历数据互通性很差,区域内很难进行电子病历的融合,在规范用语方面也很难统一,使得数据零散难以检索。二、药物营销1.真实世界研究药物上市后,最重要的问题就是药品营销。药物上市后临床研究,以及真实世界研究对药企的最大利益,就是能够促进该类产品在市场中的地位。所有药企的研究方向一定是希望获得自身有力的结果,如果得到不利证据也会积极调整公司策略,尽可能的避免损失。所以从药企利益的方面考虑,将这部分内容将在药物营销中进行讨论。不过真实世界研究并不是只针对药物,在医疗费用控制、医疗质量方面也有相应的研究路径。但是为什么当前会有这么多与药品有关的真实世界研究?原因很简单,有商业模式的研究工作才是一个稳定的模式。由于与药品相关的研究与药企商业利益直接相关,这些研究费用会被药企买单,如此这般,当前市场上有关真实世界研究的项目大多与药品相关。真实世界研究还有一个大方向是医疗费用控制,当前医保压力很多,所以国家也在医保控费方面投入了大量研究金费。不过在医保控费方面,真实世界研究并没有与商保企业产生相对明确的商业模式,所以自然研究情况没有药品丰富。临床大数据与保险有关的内容将在下一篇文章中讨论。所谓真实世界研究,学界有两种不同的划分方法。第一种意见认为所有回顾性研究都属于真实世界研究,简而言之就是对所有医疗或医疗周边产业产生的数据的研究,都属于真实世界研究。这些数据是在诊疗过程中自然产生的,而不是通过人为设计某种实验而得到的。第二种意见认为真实世界研究是所有传统临床医学研究之外的部分。传统医学研究是随机对照实验、队列研究、病例对照研究、横断面研究等教科书里传统临床研究类型之外的研究。针对上述两个学界的看法,笔者更倾向于第一种学界的看法。在笔者看来,真实世界研究的本质是数据的来源问题。经过严格的实验对象筛选获得的数据(例如,传统临床实验),则不称为真实世界研究。只有在非刻意性的基础上获得数据,才能称为真实世界研究。所以真实世界研究没有研究对象的评选标准,所有数据完全是在现实中产生。在FDA的指南中,对“真实世界数据”的定义强调了两个点:定期收集(routinely collected),数据来源多样(from a variety of sources)。(1)优效、等效、非劣效研究药物疗效验证是药企最感兴趣的项目之一,为了验证自己的药物在医疗环境中的地位,药企愿意投入大量资源开展真实世界研究工作。所谓优效性试验是为了验证药物是否优于另外一种药物;等效性试验,即检验一种药物是否与另一种药物具有相同的疗效;非劣效试验,即验证一种药物不差于另外一种。药物优效、等效、非劣效研究属于传统研究范畴,可以通过试验设计进行试验。不过从本质上而言,该实验更适用于真实世界研究。只有在实际诊疗中产生的数据才能较好的做出客观评价。通常来讲,进行该类试验应该选取一款市场上广泛认可的药物作为阳性对照药,通过与该药物的对比,得到优效、等效、非劣效的相关结果。由于被选中阳性对照的药品,通常都是较强的竞争对手,所有企业自然希望得到优效的结果。对于优效性试验而言,其假设检验为:其中是一个临床具有意义的数值,称为优效性界值。为测试药物的总体有效率,为对照药物的总体有效率。优效性的主要目的就是需要确定测试药物疗效需要超过对照药物的优效性界值,且不能低于0点。对于等效性试验而言,其假设检验为:公式中的相关指标与前文中的一致。在等效性实验中,需要测试药物与对照药物的有效性在一个界值中间,即可从统计学上判断两者的等效性。等效性更多的用于仿制药与原研药物的一致性评价中。对于非劣效试验而言,其假设检验为:非劣效实验重点在于确定测试药物与对照药物的疗效之差不低于下界,单侧检验就可以确定非劣效。下图很形象的说明了三种实验的关系。如果测试药物的疗效低于对照药物疗效的下限界值,那么则无法得出结论。在传统的生物统计中,以上三种试验可以通过人为设计、招募受试者等方式完成。对于真实世界研究,我们需要完全采用真实产生的数据而并非利用人为设计试验数据。完成以上工作有2个难点:第一是如何选择数据,第二是如何制定临床指标。首先讨论如第二个问题,定临床指标从来都是一个难题,选大了会使得区间变大使得测试药物优效性可能降低,或达不到等效的药物被判定为等效;如果选的较小,则会增加相反概率发生的可能性。具体情况还需要针对药物适应症因素确定。常用的指标有生化指标、生物等效性(EB)等。第一个问题是如何选择数据,这对于真实世界研究非常重要。选择数据有2种情况:一种是针对于已有的医疗数据进行回顾性研究;另一种情况通过对服用2种药物的人群进行随访获得数据,属于一种前瞻性的研究。从药企角度出发,通常希望快速得到相应的结论,不但可以解决成本,对药品营销推广也有好处。回顾性研究的问题在于临床数据是已经产生的数据,这些数据质量较差并且获得困难,并不一定能够达到对应的试验目的。前瞻性研究的问题在于随访时间周期长,花费成本巨大,药企很难长时间支持这样一个只投入无结论的项目。当前临床数据遇到最大挑战是数据转换(ETL)及合并,也可以说是数据治理的内容。在回顾性的真实世界研究中,什么样的临床数据才是有价值的,作者给出三条建议:明确临床事件的发生顺序明确患者身份标识使用统一的编码规范明确临床事件的顺序在于确定患者的病程及处理情况,大量临床数据无法得到应用的原因在于无法看到一个患者,在一段时间内的临床处置及相应的结果。临床数据应用,并不一定要求在同一时间段内的患者,但需要明确顺序因素与时间间隔。明确患者身份标识,这一点很好理解。我们做真实世界研究大多数以患者为单位进行,即使研究某个药物或疗法,也需要根据患者个体进行分析。使用统一的临床编码规范,这是一个医疗数据老生常谈的问题。在这里不进行过多的讨论,希望不同地方各医院能够尽量遵守。上述三个基本要求如图所示。对于真实世界的研究结论,良好的结论药企可以写入自己的说明书中,不利的结论企业应该立刻调整自己的市场布局,躲避不利因素。(2)药物不良反应监测与药物警戒药物不良反应监测更多的是一种责任与义务。在国外很多不良反应监测工作由药企完成,在国内更多的是由政府及相关部门进行监控。药物不不良反应监测更多的是一种企业责任,特别是在新药上市之后,可以通过不良反应监测根据完善药品说明书,用药更加安全。从药企利益的角度考虑,药企更应该主动进行药物不良反应监测,以降低由于不良反应而产生的高昂赔偿费用。药物不良反应的发生机理药物不良反应的发生机理是比较复杂的,归纳可分为甲型和乙型两大类,前者是由于药物的药理作用增强所致,其特点是可以预测,一般与药物剂量有关,其在人群中的发生率虽高,但死亡率低。后者与正常药理作用完全无关的一种异常反应,通常很难预测,常规毒理学筛选不能发现。常用的流行病评价方法同样也有回顾性研究与前瞻性研究两种,这两者分别对应了病例对照研究与队列研究。前者是已知发生了某不良反应后,追查由某药物引起的可能性大小。后者是对研究对象追踪随访一段时间,比较暴露于药物的研究对象中不良反应的发生率是否较不暴露于药物的研究对象更高。药物不良反应往往从真实世界数据中发现,通过传统临床试验等方法确认。药物不良反应与药物警戒在全球已经研究了很多年,不仅提出了多种算法,数据分析种类也由医疗数据分析转向医疗数据、社交数据共同分析的方法。当前大数据、机器学习等多种算法都应用于药物不良反应信号的发现。在药物不良反反应与药物警戒中,有两项核心工作:药物不良反应数据库构建,不良反应数据挖掘。药物不良反应数据库是一个多数据源的数据库,也就是说其并不只来源于临床中产生的数据,还包括蛋白、靶点等药物数据。当前的不良反应数据大多数以不良反应上报为主,在未来的发展中,可以借助人工智能等技术手段构建疑似不良反应数据库。该数据库直接来自于临床过程产生的数据,将一些临床症状与用药情况叠加进行判定,主动挖掘一些不良反应事件。药物不良反应算法方面研究也同样非常深入。主要分为三个大类:比例失衡分析算法(DPA)、逻辑回归算法(LRM)、关联规则挖掘算法(ARM)。在AI与机器学习发展的今天,决策树、聚类、神经网络等算法都会用作药物不良反应的挖掘工作。具体的算法内容本文不进行细节展开。探索药物不良的试验方法有四种:差异法、协同法、共变法、类比法。这四种方法也可以作为临床数据研究的理论依据。差异法就是从相同中寻找不同的因素,这种不同的因素就有可能是引起医学事件的原因。例如有一人群患有心律失常,当应用传统的抗心律失常药物无效时,停药后又改用胺碘酮,结果有部分患者不仅原有的心律失常未得到控制,却又发生了扭转性室速。同属一组人群,在使用胺碘酮前和后可找出的不同因素正是胺碘酮,因此,可以假设胺碘酮会引起扭转性室速。据此,便可再作进一步的分析性研究。协同法适用于在不同的时间、不同的空间或不同人口统计学的人群中的某些人出现了同一种医学事件,就可以采用这一方法提出假设。例如调查食物中毒就可以使用这种方法。共变法适用于某种医学事件的发生频率,随着某种客观因素的数量变动成正比地相应变动,这种数量变动的客观因素就可能是引起医学事件的原因。轰动全世界的“反应停事件”就是通过这一方法提出假设的,研究者们巧妙地将相关年代反应停的市场销售信息与医学事件联系起来,绘出一个销售总量与病例数的时间分布曲线图。类比法是把原因不明的医学事件和另一个十分清楚的客观因素进行比较,如有相似之处,说明这种客观因素可能就是引起医学事件的原因。例如瑞氏综合征(Reye’s syndrome)的研究中,有人发现水杨酸中毒的临床和组织学改变很类似该综合征,于是通过逻辑推理提出了假设。药企可以借助临床数据对药物不良反应进行主动性研究。首先确定使用本公司某种药物的相关人群。对于人群中发生的任何相关的临床现象进行聚类,按照诊疗的事件数据进行分。药物不良反应的研究成果,一般以平台或系统形式呈现。该平台可以进行不良事件检索、不良事件相关药物检索以及相关的不良事件组合检索。2.药物情报知识图谱药物营销之前依靠医药代表,现在各个医院对医药代表管理严格,各大药企的药物推广更多的变更为专家型营销方式,通过对医生、患者的教育,使他们了解自己公司的产品,以知识的方式传递营销思路。现在的医药代表往往会手持一个pad,里面有药物的所有资料以及相关的临床证据,甚至是一些医药有关的问答系统。这样一个医药知识的检索平台或者说问答系统就可以利用知识图谱技术进行构建。针对药企而言,在营销方面医疗知识图谱可以说是一个最直接的应用,针对药物临床、临床前的学术检索,也是知识图谱的一大应用场景。医学知识图谱构建技术归纳为五部分,即医学知识的表示、抽取、融合、推理以及质量评估。通过从大量的结构化或非结构化的医学数据中提取出实体、关系、属性等知识图谱的组成元素,选择合理高效的方式存入知识库。医学知识融合对医学知识库内容进行消歧和链接,增强知识库内部的逻辑性和表达能力,并通过人工或自动的方式为医学知识图谱更新旧知识或补充新知识。知识图谱的数据来源非常多样,临床数据只是知识图谱数据来源的一个方面,下图就表现了知识图谱数据来源的多样性。从变现方面来讲,知识图谱更多的是以知识库的形式提供服务,当然可以扩展为问答机器人等业务应用。知识图谱在企业内部可以提高药企的营销水平,协助营销人员更好的推介产品。知识图谱对外是一套知识库体系,可以通过售卖账号获取年费进行变现。#专栏作家#白白,人人都是产品经理专栏作家。医药行业资深产品专家,负责人工智能行业类产品综合架构与技术开发。在行业云产品架构,药物设计AI辅助、医疗知识图谱等领域有深入研究。本文原创发布于人人都是产品经理。未经许可,禁止转载。题图来自Unsplash,基于 CC0 协议

可不察与

多中心临床数据库在科研中的应用

导读:医院信息化的发展和建设带来丰富的患者资源,如何将这些已存在的患者资源转化为有效的临床研究数据是现今临床科研人员所面临的机遇和挑战。而多中心临床数据库可处理临床病例资料,并实现跨多中心的临床科研协作。以广州医科大学附属第一医院的多中心临床数据库为例,对其在科研应用中的优势、潜在问题及对策进行探讨。随着医院信息化不断深入发展和建设,医院信息系统正存储越来越多患者的病例资料,而且这些患者资料无疑是符合“容量大、增长快、种类多”标准的大数据,倘若可以联合多家医院的患者资源,这将是一个非常可观的临床研究数据宝库。如何将这些已存在的患者资源转化为有效的临床研究数据是现今临床科研人员所面临的机遇和挑战。而多中心临床数据库作为一个集约化的数据仓库,既可以跨信息系统、全面有序地处理临床病例资料,同时又可以共享多家医院的数据资源,满足跨多中心临床科研协作的需求,为临床科研提供有力的支撑。因此,在2017年5月开始建立多中心临床数据库以提高临床数据在科研中的应用水平。将以我院为例探讨多中心临床数据库在科研应用中的优势、潜在问题及对策。多中心临床数据库的建立背景多中心临床数据库早已在国内外兴起。国外早已开始建设多中心临床数据库,实现多地区临床数据的共享。美国癌症研究所早在1973年将几个地区的肿瘤登记站联合组成监测、流行病学和最终结果数据库(Surveillance, Epidemiology and End Results, SEER),现在SEER数据库是美国最具代表性的大型肿瘤登记数据库之一,目前1975-2014年的所有资料已经发布在网上(http://www.seer.cancer.gov)。在2000年,日本建立了日本心血管外科数据库,并且在2010年又建立了包含以上数据库的国家临床数据库(National Clinical Database, NCD)。 而我国的多中心临床数据库发展起步相对较晚,大多数尚处于起步阶段,进展较缓慢。比如,虽然我国早已在1963年于上海开展肿瘤发病登记工作,但由于全国各地的推进工作进展缓慢,直到2002年才成立全国肿瘤登记中心,并建立了中国首个肿瘤防治数据库,对外开放了免费查询的网站(http://cancernet.cicams.ac.cn),但因网站长期未更新,无法获得实时更新的信息;国内最大的骨与软组织肿瘤数据库由北京积水潭医院在20世纪90年代开始构建,从第一代dBase单机版历经几代的发展,直到2013年才发展为网络数据库,该数据库除了可供内部人员登录使用,还开通了可让公众免费查询的网站(http://www.sarcoma-jst.net),虽然是单中心开发,但在研发时已规划为可供多中心使用;中国首个前列腺癌临床数据库(PC-Follow)从2008年9月至2014年12月经历了3个版本的构建,终于升级成了在线版的网络数据库,并且在2015年招募全国12家泌尿外科中心进行运行培训及测试。这表明了我国正逐步提高对多中心临床数据库的认识,并加快多中心临床数据库的建设。我国的人口基数庞大,这一人口资源可为临床研究提供大量可靠、高质量的临床数据。而多中心临床数据库可整合多家医院多个地区的临床数据,实现临床资源的有效利用,促进临床资源的共享,从而推进临床数据库的规模化。因此,为了集中高效地利用临床数据来提升临床研究水平,开始建立多中心临床数据库。多中心临床数据库的架构和功能系统架构综合考虑软件开发技术、费用与软件平台的可扩展性等因素后,与专业的信息技术服务商进行合作开发。数据库虽然以单中心研发,但规划时可供多中心使用,在技术方面采用了Apache Web服务器+Java语言+MongoDB数据库+Hadoop大数据框架等多种核心技术, 这共同构成典型的B/W/D(浏览器/Web服务器/数据库服务器)三层体系结构模式。数据库总体的系统架构为:信息系统如电子病历系统HIS、检验检测系统LIS和影像系统PACS之间通过有效集成形成大量临床数据,再对照字典转换编码为统一标准的数据存储在数据库中,同时从其他医院/研究所以及国外临床数据中心等合作单位进行对接获取相关的肿瘤数据经转码后存储至数据库。多中心临床数据库的系统架构如图1所示。图1 多中心临床数据库的系统架构模块功能数据录入与导入模块本模块的录入功能虽然仍为手工录入,但可通过选择下拉框或多选框,对照字典转换编码为统一标准的数据,极大减轻了数据录入时的工作量。而导入功能则可将现有的表单、影像学图像等资料上传至数据库中。数据查询与导出模块根据使用者的科研目的,自定义查询条件,即可浏览所指定的查询结果,而且可将这结果以EXCEL表格的形式导出。角色管理与字典管理模块数据库的管理者通过账号注册可成为系统管理人员,这一角色有权对其他多个角色进行设置和管理,比如可设置分中心负责人和科室医生等角色,并对他们开放不同模块的权限。字典管理模块仅对授权的角色可见,授权的角色可根据需要修改增减字典中的字段。多中心临床数据库在科研应用中的优势整合多中心的临床资源,扩大科研样本量联合建库是突破资源制约、满足临床科研“多中心、大样本”的病例信息需求和建设高质量病例数据库的主要途径。数据库联合了多地区的临床资源,促进临床资源实时共享,提高临床资源的利用水平,并且在一定范围内扩大样本量。提高临床数据的完整性,提高数据的可挖掘性数据库的数据采集来源于多个信息系统,这些原始数据保留了患者所有的诊疗信息。同时,由于需要尽可能保留所有患者的信息,字典转码实际上属于数据的分类整理,这进一步提高了数据的完整性。除此之外,无法转码的内容也会存储在数据库中,以便满足日后科研的需要,提高了数据的可挖掘性。提高数据的检索效率,方便管理随访患者数据查询模块中所提供的自定义查询可进行多维条件的快速筛选,提高了数据的检索效率。而且,数据库会根据术后患者的随访安排筛选随访到期的患者,形成随访提醒,避免造成失访,方便科研人员跟踪管理随访患者。多中心临床数据库在科研应用中的可能出现的问题及其对策原始数据对照字典转码的过程仍需人工转录,这种人工输入不仅繁琐费时,还易出错。因此,为了尽量减少这种输入错误,需要建立数据质量控制制度,录入或导入的数据需通过审核后才能发布。数据库需要通过网络实现多中心共享数据,需要考虑网络安全性及患者信息保密性的问题。数据库具有统一的身份认证系统,需要通过账号密码登录角色,而且不同角色有不同的访问权限。同时,数据库对患者基本信息加密,使共享的患者隐私信息以非明文显示。数据库的及时更新和长期运营均需要专业人员进行维护和管理。而与专业的信息技术服务商建立起长期战略合作伙伴的关系,在医院内共同逐步培养一支既精通业务、又掌握信息化技术的复合型两栖人才队伍来维护和管理数据库,且在此之前,他们将会继续提供技术维护服务。当今世界,仅凭单中心研究已远远不能胜任科研的需求,多中心研究甚至跨国研究已成为一种趋势。多中心临床数据库是临床转化研究的核心,它在科研应用中有诸多优势:可整合多中心的临床资源,扩大科研样本量,帮助科研人员在大数据中进行挖掘,形成有用的科研数据,有助于提高医院的科研水平。目前,该数据库已基本建成,下一步将进行数据调试,需要在调试中进一步调整数据库,同时加强数据库管理的人才队伍培养,以期早日将其应用于科研当中。文章来源:《中国数字医学》杂志2018年第12期,作者及单位:李丹玲 张志强 潘辉 沈建飞 何建行,广州医科大学附属第一医院转化医学实验室 广州医博信息技术有限公司数据研究院 浙江省台州医院心胸外科。戳这里!!!关于召开2019中华医院信息网络大会(CHINC)的第一轮通知“2018年度全国医院信息化杰出领导力和创新力人物”评选表彰活动2019中华医院信息网络大会(CHINC)征文通知传播数字医学领域发展最新动态,关注医疗卫生信息化相关资讯。长按扫码关注我们

少者哭之

“基因+临床”数据处理成精准医疗未来趋势,医基云已迈出一大步

过去的6年是精准医疗蓬勃发展的黄金期。基于新一代基因测序技术(NGS)的基因检测技术为临床分子检测带来了革命性的变化。基因检测正在成为从科研到临床不可缺失的一部分。但目前大多数医院的信息化系统中,由于种种原因,并没有包含完整的基因检测数据。这就使得临床精准诊疗的数据源出现了空缺,而只有将基因数据真正与临床数据融为一体,才能得到真正可用于精准医疗的大数据。基因检测进入临床是大势所趋狭义的精准医疗包含了精准检测和精准治疗。作为精准检测的核心组成部分,基因测序的发展使得精准医疗迈出了跨时代的一大步。以肿瘤靶向治疗为例,并不是所有的肿瘤患者对某一款靶向药物都有应答,患者在用药前通常需要接受一次靶向药物伴随诊断,让患者得以在用药前就进行一次初步预判。当然在这个过程中受益的不仅仅是肿瘤患者,医院的诊疗信息一直是药物研发的重要支撑,基因大数据加持下的医疗数据会使得药企的药物研发变得更加精准。一方面,临床诊疗方面精准度的提升,终将推动医院的临床决策的质量。越来越多的医院把基因数据纳入临床诊疗的依据。从2010年至今,临床级基因检测出现了爆发式增长,各医疗机构以及院外的第三方检测机构积累了海量的基因数据。基因检测在临床上已经为各类患者提供了真实有效的辅助诊断和用药指导。但在另一方面,在临床中不乏出现基因检测显示可以使用某靶向药,但服用后却没有任何效果用药有效性问题的案例。基因测序在临床的渗透越深,人们就越发地意识到基因与表型对应关系的复杂性。越来越清晰的认知是,精准检测的组成不应当单单只是基因检测,基于各种临床和基因的医疗信息的整合,必将推动医疗行业更加快速地进入精准医疗时代。医基云数据研究院执行院长何新军“我认为在基因和临床信息的整合中,将有很多信息可以挖掘。”医基云数据研究院执行院长何新军表示,“这些信息可以指导临床诊疗、助力药物研发。”在临床组学与基因组学数据处理的探索队伍中,医基云是独特的存在。在基因信息融入临床诊疗的关键历史节点,医基云建立了临床和基因数据处理的智慧医疗平台,致力于回馈临床诊疗。基因数据是医疗大数据的一部分进行基因数据与临床数据处理的最终目的是为临床诊疗提供精准支撑。也就是说,不论是基因数据还是临床数据,这些最后的形式并不是独立存在,而是将成为医疗大数据的一部分。在这个多维度的数据中,很大一部分基因数据将来自第三方检测机构,但临床数据一定来自院内。在多年信息化的推动下,医疗机构的临床系统积累的数据标准化程度比较高。但在现阶段,基因数据来自医院外,系统多种多样,数据处理标准不统一,数据质量各种各样,这就造成了基因数据的多元异构化。“这使得由基因数据出发来处理临床数据的路径变得非常困难。”何博士告诉动脉网。且不说数据质量问题,目前基因突变与疾病之间的对应关系也并不十分明确,这些因素进一步增加了通过基因数据处理临床表型数据的难度。基于多年的工作经验,在他看来,从医疗机构已有的临床数据平台出发,基于院内数据处理院外的生物样本库和基因数据是比较有效的路径。这也是医基云与其他同类项目的最大的区别。“医基云走的是这条路,在医疗机构实现这种智慧处理,帮助临床机构发掘医疗大数据潜能,实现数据呈现、疾病模型建立、药物不良反应的监测等。”他说道。规范是第一步相比其他数据,基因数据是比较“年轻”的存在,无论是数据规范还是数据质量,都有所欠缺。何博士强调,涉及到这类数据的处理,第一步必须去伪存真。数据规范化处理后,才能进行下一步的应用。“这个工作就好比是修高速公路,做的是基础工作,但需要很大的人力和资源的投入。”他这样比喻。数据清洗后,下一步就是价值的挖掘与分析。基因与疾病之间存在一定的对应关系,但临床表型并不只接受基因的调控。生活环境、饮食结构、生活习惯、社会经济条件都会影响最终的临床表型。因此,将患者疾病史、日常习惯等数据与基因信息的结合,就有可能对疾病的影响因素有更多的发现。但各组学间的信息的关系非常复杂,且数据量级庞大。要对这些信息进行进一步的挖掘和分析,是人力几乎不可能完成的任务。因此,要进行大规模的处理,必须依靠人工智能的力量。“这是精准医学发展到这个阶段的需求。”何新军博士表示。在这个过程中,医基云将技术平台与人工智能技术结合起来,依靠深度学习与算法的力量对医疗大数据的深层价值进行挖掘。价值发现医基云的定位是通过深度处理来沉淀临床信息,最终为医疗机构提供支撑,实现精准诊断和治疗。基于对基因和临床数据的深度挖掘,不仅能为医院的诊疗提供更多证据,还能在临床科研中给到研究人员更深度、更真实的科研灵感,帮助医生在临床科研中取得具有更具行业影响力的成果。同时,医疗大数据也能够支持药厂的药物研发。目前很多靶向药物研发是围绕基因突变的靶标进行的。但正如前文所提,临床上不乏有基因检测结果显示存在突变,但服药无效的案例。深层次的信息挖掘能够对这一现象解释,从而进一步指导临床用药和药企的药物研发,精准医疗的精准程度将进一步得到提升。“肿瘤靶向治疗离开基因检测是不成立的,靶向治疗需要有伴随诊断。”何博士表示,“院外检测获取的基因信息多局限于样本,在那个基础上做外延非常难。”精准诊断不仅仅包含基因信息,还需要考虑临床表征、疾病史等维度。在医基云的团队中,不仅包含了生物信息、前后端,还有相当一部分医学背景的成员。何博士认为,基因与临床数据的处理是个跨学科工程,只有跨学科背景的团队才能对市场需求和产品有更好的理解。他告诉动脉网,尝试将基因数据与临床数据处理的企业很多,但只有真正接触到临床需要才能见识到这个工程的复杂性。“数据模型和呈现方式等都需要与临床沟通,理解转化他们的需求。”他这样表示。通过对此前医疗大数据平台的分析,何博士认为医基云的最终产品应该作为一个工具而存在,帮助医院进行数据的清洗等。时间越久,这些信息所释放的能量也就越大。据了解,目前医基云已经完成了底层平台的开发,正式进入部分国内一流医院开始信息处理工作。在可预见的未来里,基因数据融入临床将成为趋势,而基于对行业的理解和在数据挖掘上的优势,医基云已经迈出了一大步。

无极

临床科研一体化数据采集系统的设计与实现

导读:为解决上海长海医院临床诊疗数据与科研数据各自独立采集,采集工作量大,以及人工采集造成的数据缺失、前后数据不一致的情况。医院对电子病历、检查报告等做了相应改造。病种库管理系统可根据制定的科研病种CRF表单内容,有效地自动抽取科研病历数据。实现诊疗数据、科研数据同步采集,提升医院的科研能力,提高医学科研工作者的效率。随着科学技术的不断进步及社会竞争的日趋激烈,医院如何进一步加强学科建设,推动医院整体医疗水平的发展,是当今医院管理的关键问题。科研管理作为医院管理中的重要环节,对医院科学技术水平的提升、核心竞争力的形成至关重要。强化临床科研工作,提升临床科研能力,对于推动临床新思路、新技术的提出和延伸,促进基础医学和临床医疗的有力结合,以及提升医务工作者的诊疗水平具有重要意义。临床科研步骤大致分为选题、查阅文献、确认研究的变量、假设形成、科研设计、原始资料的收集、科研资料的整理和分析、撰写论文。其中医生在原始资料的收集、科研资料的整理和分析即临床科研数据采集步骤中耗费了大量的时间和精力。如何在满足科研数据同步采集需要的同时,减轻数据采集记录的庞大工作量是目前临床科研迫切需要解决的关键问题。传统临床科研数据采集存在的问题随着长海医院科研项目的开展,科研数据采集的巨大工作量已成为困扰科研医生的一大难题。医院目前科研数据采集的现状还是以传统的手工或半手工方式为主,医生根据每个病种所需数据进行人工补录,即事后记录。由于科研的数据收集与临床诊疗工作不同步,往往滞后于临床诊疗,于事后对所需的科研数据进行记录,难免丢失了重要的过程性数据。并且在进行转录的过程中需要大量的人工核对,难免产生因人工失误造成的科研数据与诊疗数据不一致的情况。随着医院科研任务的增加,对临床科研数据采集的准确性、完整性及采集效率要求越来越高,传统的数据采集方式已不能满足要求。临床科研一体化数据采集随着长海医院信息化的发展,医院各业务系统中累计了大量的医疗数据,为满足医院各病种科研需求,更好地为临床和科研教学工作提供优良有效的数据支持,减轻数据采集记录的庞大工作量,医院对电子病历、检查报告等做了相应改造,正逐步实现临床医疗、科研数据同步采集以及临床科研一体化。数据采集步骤为解决医院临床诊疗数据与科研数据各自独立采集,采集工作量大,以及人工采集造成的数据缺失、前后数据不一致的情况。医院对五个试点科研病种的数据采集工作分为几个步骤进行尝试实践。具体步骤、流程如图1所示。图1 数据采集步骤、流程采集元素确定试点科研病种的科室将所需科研数据按场景、时间进行分解,明确每个环节中需要采集的元素名称、元素内容,并制定科研病种的CRF表单。需明确采集元素的来源具体为病历文书、检查报告或检验报告等。医院五个试点科研病种中约2 300个研究元素需结构化。病历模板结构化医院的病历模板为半结构化模板,结构化内容以病历元素的形式保存在病历模板中,为满足科研需求,科室根据CRF表单内容,对科研病历模板中的元素进行高度结构化,利用标准化的医学术语设计科研病历模板,保证不同时期、不同业务记录的相同数据项内容表达一致。医院五个试点病种共包含86个科研病历模板、高度结构化近2 000个病历元素。研究型病例入组建立科研诊断、手术编码库,按照科研要求制定科研病历入组标准。科室收治患者时,根据患者入科诊断判断是否需将患者收治入组。患者入组后医生使用结构化的科研病历模板完整、准确地记录科研所需数据。患者相关检查亦需使用结构化的检查模板出具检查报告。数据对应及采集数据对应及采集工作分前期数据对应和后期数据采集。前期数据对应分为两部分,一为检查、检验报告数据对应。即升级改造试点科研病种涉及的检查报告系统,报告内容以数据库字段形式保存。检验报告数据已为结构化数据,无需再次改造。医院新上线的病种库管理系统可将检查、检验报告中数据对应到CRF表单中。二为病历文书数据对应。医院电子病历为半结构化病历,需导成XML格式进行结构化数据解析。病种库管理系统可通过XQUERY将XML格式的半结构化病历拆分成字段节点,并根据节点内容与CRF表单做对应。完成前期数据对应后,可进行数据采集工作。为实现多中心数据共享,医院将检查报告、检验报告等业务数据和XML病历文书存入CDR中。病种库管理系统根据已制定的CRF表单,定位到具体科研患者,从CDR中将患者的科研病历文书、检查报告和检验报告中的数据取出并展示在CRF表单中。数据质控医院数据质控为事后质控。医院定期将医生书写的科研病历导出为XML格式并导入到CDR中,由病种库管理系统抽取数据并将数据在CRF表单中展示。数据在CRF表单中展示后医生才可核查书写的病历是否符合CRF表单要求。一般此过程时间较长,无法在患者在院期间对医生进行预警提示。 检查报告结构化医院检查报告数据保存为大段文本形式,其中与科研相关的必要指标性数据尚未进行保存,不能完整记录科研方面的检查数据。因部分报告系统无法支持结构化报告,需对报告系统进行升级改造。结构化后的报告将以自然语言方式录入的报告数据按照医学术语的要求对科研要素项进行精准描述,并以数据库字段的形式保存。目前医院已完成放射、超声、病理、消化内镜、膀胱镜检查报告结构化。实施效果病种库管理系统可根据制定的科研病种CRF表单内容,有效地自动抽取科研病历数据,实现诊疗数据、科研数据同步采集。不仅减少数据采集的工作量,而且避免了人工采集造成的数据缺失、前后数据不一致的情况。医院于2017年9月至2017年12月期间通过病种库管理系统共采集符合试点科研病种需求人数约1 500人,共自动抽取约40 000份病历数据。此部分数据既可进行全病种分析,也可根据科室需求筛选特定数据。科室可针对同一病种,设置不同研究方向,进而定制个性化CRF表单。此系统大幅提升了医院的科研能力,提高了医学科研工作者工作效率。病历的结构化程度提高后对医生书写病历的要求也随之提高,由于历史病历数据未做高度结构化,导致历史病历数据无法根据此方式采集。长海医院目前还存在事后质控、无预警、历史病历数据无法精确采集等问题。后期考虑通过自然语言处理技术对病历进行后结构化处理,即利用中文分词、命名实体识别和语义关联抽取等技术对病历文本进行信息抽取和智能分析[5]。通过后结构化,可在保持医生书写习惯和思考逻辑的基础上,实现对病历数据结构化处理,从而提高数据质控效率,满足科研数据采集需求。文章来源:《中国数字医学》杂志2019年第2期,作者及单位:吴乐乐 高白 张燕 李菊阳 王志勇,海军军医大学附属长海医院信息科。传播数字医学领域发展最新动态,关注医疗卫生信息化相关资讯。

望夫石

瑞德西韦临床研究数据公布,到底是不是特效药?本文为你详解

4月10日,《新英格兰医学杂志》刊登了瑞德西韦同情用药的一项研究结果,从研究结果看,在样本数为53人的新冠病毒感染重症患者中,有68%的患者在用药后症状得到了改善,13%的患者在用药疗程结束后死亡。对于这样的一个临床同情用药的试验结果,到底能说明什么,有没有什么缺陷和不足,我们今天就来简单的分析探讨一下。首先要强调的一点是,此次的同情用药是用于“重症患者”的,因此,不要看到13%的死亡率就对这个药物嗤之以鼻了。要知道,根据世卫组织的统计数据,重症患者,发展为需要通气治疗的情况下,死亡率一般高达50%左右。但是不是这说明瑞德西韦就对新冠病毒感染重症明确有效呢?我们还是看具体的试验数据和试验情况来具体分析。在同情用药的53名重症患者中,按照治疗方案,应用瑞德西韦的疗程为10天,随后的随访时间为18天。这53名患者中,有34人实施的是有创呼吸机,7人使用的无创呼吸机,10人采用的低流量吸氧治疗,2人属于自然环境呼吸,随访过程中出现症状改善的总数为36人,其后痊愈出院的有25人,治疗后死亡人数为7人,其余人症状未有明显改变。而在用药不良反应方面,53名用药者中,有30人出现了药物不良反应,类型包括转氨酶升高、腹泻、皮疹、高血压、肾功能损伤等,其中有12人出现了严重的不良反应,包括其中包括多器官多器官功能障碍综合征、败血性休克、急性肾脏损伤和高血压,当然这些副作用是单纯由于用药所引起,还是与病毒感染合并引起,也还值得进一步研究确认。从上述研究结果来看,虽然样本数量较小,但瑞德西韦的临床有效性和安全性还值得继续研究和探讨,从明显改善的患者中,34个最严重的有创插管患者,出现症状改善人数为19人,出院人数为8人,也就是说,目前仍然有15人虽然症状有改善,但仍然尚未出院,这些未出院的病人,病情会不会出现反复,还应该在随后的随访中予以继续确认,这项研究并没有采集病人的初始病毒负荷和用药后病毒负荷的变化情况,因此仅仅是从症状改善的情况来确认药物的有效性,而无法从病人体内病毒存活数数据上证明瑞德西韦的抗病毒有效性。从用药安全性上来说,瑞德西韦的不良反应发生率高达60%,严重不良反应发生率也高达20%以上,这个情况也值得我们注意,到底这个药物的用药安全性有多高,在改善新冠病毒感染的过程中的健康获益与不良反应风险到底哪个更大,相信也需要更多的研究数据来确认和证明。瑞德西韦毕竟是一个还没有获批上市,大范围经过临床用药的在研药物,因此,想要确认药物对于新冠病毒感染的有效性和安全性,还需要更多的临床数据支持,从目前的这样一个小样本研究数据来看,这个药物对于新冠病毒肺炎的治疗作用和用药安全,都还不是特别明确,后续到底会不会在临床上大范围应用,也还是未知数。

斗牛犬

唤醒临床研究数据价值,Trial.Link让医药研发更高效

新药研发的征途包含多个复杂的关键节点,需要“过五关斩六将”。新产品上市面临的竞争越来越激烈,空前的挑战对于处在复杂市场环境下的制药企业提出了更高的要求。然而由于信息不对称,申办方与临床试验机构之间交互不畅影响临床试验的效率、成本和质量。为打破信息隔墙,唤醒临床研究数据价值,药研社在2019年推出Trial.Link临床研究入口平台,高效连接申办方、医院/机构、研究者、从业者和患者,一站式满足找中心、找数据、找研究者、找患者等临床研究需求。双向精准匹配,为项目合作抢占市场先机截止2020年6月,Trial.Link平台已入驻500多家医院/机构和300多家医药企业/申办方,覆盖行业5万从业者。申办方可以全面浏览入驻的500多家机构发布的研究需求,结合Trial.Link的智能数据库快速查询临床试验机构的多维信息数据,进行市场竞争的智能分析,发现更多与项目匹配的机构;申办方可在Trial.Link平台完成与机构快速对话、可行性调研,根据研究者研究意向、研究领域专长和项目需求进行双向精准匹配和智能推荐,为临床研究项目的合作赢得市场先机。让数据跑腿替代人力跑腿,中心选择更省心对于大部分临床研究项目来说,中心选好就是成功的一半。过往中心选择依靠传统的线下调研,数据收集耗时长,人力成本高,高度依赖经验判断,不可控因素多,交付周期长。Trial.Link平台的临床研究数据中心脱敏采集36万条临床试验信息、1万多位主任级研究者、53万名医生和全国9000多家医院等信息,通过结构化、标准化、可视化的中心、研究者各维度的数据信息查询,进行快捷的市场竞争情况分析,摆脱传统线下收集整理,依靠经验判断或咨询他人的方式,实现让数据跑腿替代人力跑腿,节约时间和人员差旅成本。申办方可快速检索结构化的研究者数据临床试验数据、药物临床试验机构数据等海量数据,智能化筛选数据库,呈现可视化的临床试验竞争力分析,提供筛选机构、遴选研究者、选择临床试验发起时机等的精准推荐,为申办方和研究者的临床研究提供数据决策。以中心启动为例,药研社利用Trial.Link平台对适应症、药物、申办方、PI等信息进行智能BI分析匹配出合适的中心相关信息,同时可快速获知该中心的流程信息,中心机构、伦理、遗传办、合同、文件格式及模板相关数据,快速推进后续项目的快速开展中心启动等,缩减中心调研、筛选、启动时间。与阿里健康合作,激活患者资源加速招募进程随着国家政策的支持,以及国家多中心对国际多中心项目的放开,中国市场拥有了更多国外创新药物临床试验的机会。与之相对应的是,临床试验机构对于受试者的需求量也水涨船高,患者招募成了大难题。药研社与阿里健康合作,申办方在Trial.Link临床研究入口平台发布招募信息,支付宝、淘宝平台审核后自动展示试验信息,患者可以在线主动报名参加临床试验。同时,Trial.Link临床研究入口平台覆盖1万多位主任级研究者和500多家临床试验机构,研究者、研究机构也可根据临床试验项目推荐患者。借助Trial.Link平台的开放与共享性,让更多患者获得相关信息,缩短研究者和患者匹配搜索相关临床试验的时间,让患者让患者通过临床试验获益更多,让更多创新药及早上市。

故曰无言

梅奥诊所推出“临床数据分析平台”,利用AI加快新药研发进度

雷锋网消息,2020年1月13日-1月16日,第38届摩根大通医疗大会(JP Morgan Healthcare Conference)在旧金山召开,作为业内规模最大的医疗投资研讨会,大会每年吸引近500多家医疗企业的近万名参会者,堪称未来一年医疗行业的“风向标”。 14日,梅奥诊所(Mayo Clinic)医学中心在摩根大通医疗大会上推出其Mayo Clinic Platform的首个AI项目“临床数据分析平台”,主要用于加快梅奥诊所医学中心在药品行业的研发速度。该项目的合作伙伴是位于马萨诸塞州的Nference。Mayo Clinic Ventures主席Andy Danielsen在摩根大通医疗大会采访中表示:此次合作将专注于确定新药的靶标和生物标志物、为患者匹配最佳治疗方案和发掘现实世界数据(例如药品标签扩展、上市后监测和用药目的)。项目通过减少临床试验失败,降低药物生产成本。其中,AI的作用在于解决临床数据效率低下的问题。Nference联合创始人Venky Soundarajan在摩根大通医疗大会上表示:例如在需要调查服用pembrolizumab(一种新型治疗癌症的药物)的肺癌病人是否康复的时候,研究人员需要查阅大量的医生的笔记、放射学报告、病理数据,还要与大量病理科和影像科的医生和护士沟通,这需要一个研究人员几个月的时间。在此次AI项目研发过程中,作为全球最著名的医学中心,Mayo Clinic把保证病人数据隐私安全放在了首位。Andy表示,此次Mayo Clinic之所以选择Nference作为其临床数据分析平台合作伙伴,是因为Nference在合作中特别注意保护数据安全。Mayo Clinic的临床数据分析平台保护数据安全的具体做法是,仅使用脱敏之后的患者数据;使用联邦学习模型避免数据重新利用;保留了全部数据集,仅将结果发送给参与者; 与所有合作过程机构签订协议,禁止将Mayo Clinic数据与其他数据源(例如消费者财务或地理位置数据)合并进行商业化。未来,Nference将作为Mayo Clinic在生物制药行业独家分析服务供应商。据雷锋网了解,Mayo Clinic Platform由梅奥诊所在2019创立的,旨在利用人工智能、智能医疗设备和自然语言等新兴技术创建新的医疗平台,目前由Mayo Clinic数字医疗总裁John Halamka负责。John Halamka在摩根大通医疗大会上表示:“平台商业模式已经成为许多行业的一股颠覆力量,医疗的快速数字化正在为我们提供一个解决全球范围内医疗问题的机会。”Mayo Clinic是全球顶级的医疗保健系统,包括门诊、医院、医学研究及医学教育机构,总部位于美国明尼苏达州罗彻斯特(Rochester),是明尼苏达第二大的非营利性组织,2017年营业利润达7.07亿美元,营收120亿美元。2019年,《美国新闻与世界报道》将其评为美国最佳医院。Nference是专注于研发生物医学领域的深度学习企业,研发领域涵盖临床记录、病例报告、科学文献、病理图像、心电图波形和基因组序列,上周刚刚宣布获得6000万美元的B轮融资,其中的大部分资金来自梅奥诊所的Mayo Clinic Ventures。此前,Nference和梅奥诊所成立了一家合资企业Qrativ,通过从公开的数据库和梅奥诊所的研究中合成和分析基因组和临床数据,为梅奥诊所的药物发现提供帮助。此次公布的“临床数据分析平台”正是双方成果的一部分。

名者

干货!药物临床试验信息收集方法汇总

干货!药物临床试验信息收集方法汇总来源:药智咨询要说今年关注度最高的事情肯定要数新冠疫苗了,随着康希诺披露它的腺病毒载体疫苗进入临床之后,康希诺的股价就蹭蹭的不断上涨。临床试验真有这么大的作用?那么怎么才能收集到相关药物的临床试验信息呢?其实要弄明白这个问题我们还是回到什么是临床试验上面来,临床试验(Clinical Trial),指以人为对象的前瞻性研究,预先将受试者或受试人群分配至接受一种或多种医疗干预,以评价医疗干预对健康结局的影响。其中“医疗干预”包括但不仅限于药物、细胞及其他生物制品、外科治疗、放射治疗、医疗器械、行为疗法、治疗过程的改变、预防保健等。包括第1阶段到第4阶段的试验。临床试验一般分为I、II、III、IV期临床试验,具体情况见下表:一、临床试验主要登记平台《赫尔辛基宣言》是目前普遍遵循的人体医学研究的基本伦理准则,其2008年版新增明确要求:“每个临床试验必须在招募第一例受试者前在公开可及的数据库中注册”。所以每个临床试验都必须在公众可及的数据库中登记并且相关信息向公众发布是基于科学、伦理和道义层面的社会责任。下面就来简单介绍一下国际上比较有影响力的临床试验登记平台。1. WHO临床试验登记平台在2004年11月于墨西哥的墨西哥市召开的卫生研究部长峰会之后,与会者要求WHO促进“一个连接国际临床试验登记网络的平台,以确保一个单一的存取点和试验的明确识别”的建立。在此之后世界卫生组织国际临床试验注册平台(WHO ICTRP)便开始逐步建立。该网站的特点是涵盖范围广,包含全球大部分地区开展的临床试验,并且是可以使用包括中文等多种语言访问。其访问网址为:https://www.who.int/ictrp/zh/2. 美国临床试验登记平台美国临床试验登记平台是根据1997年《食品和药物管理局现代化法案》(FDAMA)创建的。为检验实验药物的安全性和有效性,FDAMA要求NIH(美国国立卫生研究院)创建有关食品药品管理局(FDA)监管的某些临床试验的公共信息资源。因此NIH和FDA共同开发了该网站,并于2000年2月向公众开放。其访问网址为:https://clinicaltrials.gov/ct2/home美国临床试验登记平台是一个在国际上比较权威的临床试验信息发布中心,其发布的内容不仅限于美国地区开展的临床试验信息,还包世界上其他国家开展的临床试验,笔者认为是一个较好的寻找临床试验信息的途径。3. 中国临床试验登记与信息公示平台2012年11月1日,原国家食品药品监督管理局(现国家药品监督管理局)药品审评中心通过其官网发表新闻“药审中心网站开通《药物临床试验登记和信息公示平台》(试运行)”,首次向社会公告了平台项目并成为平台的诞生日。中国临床试验登记与信息公示平台基本上是在中国开展的临床试验,少有在国外医疗机构开展的试验在中国临床试验登记平台进行登记。目前许多药企开展的仿制药一致性评价也可以在上面进行相关的信息收集。其访问网址是:http://www.chinadrugtrials.org.cn/index.html4. 其他地区临床试验登记平台当然在世界上还有其他较多的临床试验登记平台,比如欧洲临床试验登记注册中心。访问网址https://www.clinicaltrialsregister.eu/5. 药智网-临床试验数据库药智数据临床试验数据库,是药智网下属的一个多功能、实用的临床试验检索平台,囊括了多个国家的临床试验登记数据。最主要的一个特点是药智数据对相关数据进行了标准化加工处理,将临床试验的重要信息字段拆分出来直观的展示给用户,能够使得用户高效便捷的检索到自己想要的临床试验信息。其访问网址是:https://db.yaozh.com/clinical二、临床试验结果信息查询虽然临床试验的试验设计等基本信息可以在注册登记平台上面进行查询,但是关于临床试验的结果却是许多人很头疼的事情。其实反过来想想就能够理解了,一般药物临床试验的开展都耗费巨大资金,并且涉及到公司的商业机密,所以一般情况是很难直接获得相应的临床试验结果。在这里可以给出一个获取临床试验结果的方法,一般而言开展临床试验之后相关人员会进行论文发表,我们可以通过相关文献的溯源来找到临床试验结果,而且在一些试验登记平台上面会给出包含试验登记号的相关文献。