新京报讯(记者 张秀兰)3月26日,由中国医学影像AI产学研用创新联盟牵头的《中国医学影像AI白皮书》发布。白皮书指出,AI产品属于新生事物,无先例可循,准证审批规则有待成熟,仍需要数据标准及辅助诊断性能评价标准等。就医学影像AI相关问题,白皮书对全国2135家医院的5142名医生进行了调研,其中三级医院占比59%,二级医院为38%,白皮书同时还调查了120人次的研究者。调研结果显示,中青年医生、高年资医生和放射科管理者普遍更关注AI技术,目前大多数医院AI研究院或成果转化部门相对缺失,只有1%的受访医院建立了AI研究部门。大部分医生认为,所在领域最大的问题是缺乏行业标准和AI相关知识。白皮书对医学影像AI在骨关节疾病、心血管疾病、神经系统影像、超声等领域的临床应用进行了解析。以心血管疾病AI技术临床应用为例子,中国心血管病患病率及死亡率处于上升阶段,现患人数2.9亿,死亡占居民疾病死亡构成的40%以上,居首位,每5例死亡中就有2例死于心血管病。目前,人工智能可智能识别影像中的心脏结构,通过人工智能来增加传统危险分层中的预后信息,综合评估患者术前术后风险,提高心血管事件风险预测能力。 在乳腺疾病诊断中,AI技术能精准分割乳房与致密腺体组织,并精准量化乳腺密度,客观评估乳腺癌风险,精准检测、定位肿块与微钙化灶,提升病灶检出率。2016年5月,国家发展改革委、科技部、工业和信息化部、中央网信办发布《“互联网+”人工智能三年行动实施方案》,明确提出到 2018 年国内要形成千亿元级的AI市场应用规模。规划确定了在包括资金、系统标准化、知识产权保护、人力资源发展、国际合作和实施安排等六个方面进行支持AI的发展。2017年3月,在十二届全国人大五次会议的政府工作报告中,“人工智能”首次被写入政府工作报告。AI在医学影像的应用近几年蓬勃发展,在学术上和商业化上成果不断涌现,但是也出现了很多泡沫和乱象。针对医学影像AI面临的挑战、机遇等,白皮书指出,AI产品属于新生事物,无先例可循,目前存在影像质量参差不齐的现状,存在不同疾病、不同场景数据量不均衡及数据孤岛等问题,准证审批规则仍有待成熟、放宽,在市场准入方面,目前行业公司多,但落地项目少,也仍需训练数据标准、辅助诊断性能评价标准及AI测试方法和标准等。中国医学影像AI产学研用创新联盟理事长、中华医学会放射学分会候任主委刘士远表示,目前中国AI影像辅助诊断技术的创新发展始终保持世界领先行列,AI医疗影像辅助诊断作为新一代医疗器械设备也应纳入“国产设备”的推广政策中。相信在政策的辅助下,AI医疗会有更广阔的前景。编辑 岳清秀 校对 何燕
深度学习在医学影像中的研究进展及发展趋势王丽会1,2, 秦永彬1,21 贵州省智能医学影像分析与精准诊断重点实验室,贵州 贵阳 5500252 贵州大学计算机科学与技术学院,贵州 贵阳 550025摘要:医学影像是临床诊断的重要辅助工具,医学影像数据占临床数据的90%,因此,充分挖掘医学影像信息将对临床智能诊断、智能决策以及预后起到重要的作用。随着深度学习的出现,利用深度神经网络分析医学影像已成为目前研究的主流。根据医学影像分析的流程,从医学影像数据的产生、医学影像的预处理,到医学影像的分类预测,充分阐述了深度学习在每一环节的应用研究现状,并根据其面临的问题,对未来的发展趋势进行了展望。关键词:深度学习 ; 医学影像 ; 图像处理 ; 人工智能 ; 卷积神经网络论文引用格式:王丽会,秦永彬. 深度学习在医学影像中的研究进展及发展趋势[J]. 大数据, 2020, 6(6): 83-104.WANG L H, QIN Y B. State of the art and future perspectives of the applications of deep learning in the medical image analysis[J]. Big Data Research, 2020, 6(6): 83-104.1 引言医学成像已成为临床诊断的重要辅助手段,其包括计算机断层扫描(computed tomography,CT)成像、磁共振成像(magnetic resonance imaging,MRI)、正电子发射断层扫描(positron emission tomography,PET)成像、超声(ultrasound, US)成像、X射线(X-ray)成像等。如何借助大数据和人工智能技术,深入挖掘海量的医学图像信息,实现基于影像数据的智能诊断、智能临床决策以及治疗预后,已成为目前的研究热点。深度学习属于机器学习的分支,是目前实现人工智能技术的重要手段。随着深度学习技术在图像处理和计算机视觉领域的广泛应用,利用深度学习技术辅助临床诊断和决策已成为医学图像分析领域的研究重点。医学影像智能诊断的流程可大致分为3个步骤,首先获取大量高质量的图像数据,然后对图像进行预处理,最后挖掘图像信息,进行分析预测。其具体环节如图1所示。其中海量、高质量的图像数据是深度学习训练的基础,图像预处理(如配准、感兴趣区域提取)是后续分析准确度的基本保障,挖掘信息、建立预测模型是临床智能决策的关键。因此,本文将分别围绕这3个方面,阐述深度学习在医学图像处理分析流程中每个环节的主要应用现状,最后总结深度学习在医学影像研究中的发展趋势。图1 医学图像处理分析过程2 医学图像复原、重建与合成2.1 医学图像复原与重建海量、高质量的医学图像数据是利用深度学习技术实现影像精准诊断的基础。然而,由于成像设备和采集时间等因素的限制,在医学成像的过程中不可避免地会受到噪声、伪影等因素的影响。同时,针对某些成像方式,需要在成像分辨率和采集时间上进行折中,例如在CT成像中,为了降低辐射的影响,需要减少投影采集数目;在磁共振成像中,为了减少患者运动或者器官自身运动引起的伪影,需要降低K空间的采样率以减少采集时间,然而低采样率会严重影响图像的重建质量。为了获得高质量的采集图像,经常需要进行图像降噪、图像超分辨率重建、图像去伪影等复原与重建工作。下面将分别阐述深度学习在这几方面的研究现状。2.1.1 医学图像降噪基于深度学习的医学图像降噪主要应用在低剂量CT图像中。卷积降噪自动编码器(convolutional neural networkdenoise auto-encoder,CNN-DAE)是早期用于医学图像降噪的深度学习模型。该模型通过一些堆叠的卷积层,以编码和解码的方式从噪声图像中学习无噪图像,其鲁棒性较差,对噪声类型变化较为敏感。随后,Chen H等人提出RED-CNN降噪模型,将残差网络与卷积自动编码器相结合,通过跳跃连接形成深度网络,实现低剂量CT图像的降噪。同年,Kang E等人首先对低剂量CT图像进行方向小波变换,然后将深度卷积神经网络模型应用于小波系数图像,实现降噪,并使用残差学习架构加快网络训练速度,提高性能。虽然这些网络结构的降噪性能相较于传统方法得到了显著的提升,但是其网络训练均以复原CT图像与相应正常剂量CT图像之间的均方误差最小为优化目标,使得降噪图像存在细节模糊和纹理缺失等问题。为了解决这一问题,研究者提出改进损失函数和模型结构的方法来优化低剂量CT图像的降噪效果。WGAN-VGG模型通过引入感知损失,采用WGAN(Wasserstein generative adversarial network)模型进行降噪,利用Wasserstein距离和感知损失提高降噪图像与真实图像的相似性。基于WGAN-GP(gradient penalty)的SMGAN (structurally-sensitive multi-scale generative adversarial net)模型将多尺度结构损失和L1范数损失结合到目标函数中,并利用相邻切片之间的信息降噪,其结果优于WGAN-VGG模型。但是梯度惩罚的使用削弱了生成式对抗网络(generative adversarial network,GAN)的表示能力。为了解决这个问题,Ma Y J等人提出基于最小二乘生成对抗网络(least-square GAN,LS-GAN)的残差生成器结构,通过引入结构相似度和L1范数损失来提高降噪能力,生成器负责学习噪声,降噪图像为生成器的网络输入与网络输出的相减结果。除了生成模型,为了提高降噪效果,Yin X R等人同时在投影域和图像域采用3D残差网络进行降噪,并利用滤波反投影重建算法,实现投影域和图像域的相互转化,通过迭代的思想实现图像降噪。Wu D F等人提出一致性神经网络模型,实现了无监督的图像降噪方法,其不需要无噪图像标签,仅利用有噪图像对模型进行训练,从而获得降噪图像。可以看出,在利用深度学习进行降噪时,常需要利用有噪图像和无噪图像来训练模型,学习噪声类型,或者学习无噪图像与有噪图像之间的对应关系,进而实现图像降噪。这种方式具有一定的局限性,在临床的某些应用上,很难获得真实的无噪图像。因此,如何采用无监督或者自监督模型,仅利用有噪图像实现医学图像降噪将是未来研究的主要方向。2.1.2 医学图像超分辨率重建高分辨率的医学图像可以提供更多的临床诊断细节,然而由于采集设备的限制,临床上高分辨率图像较难获取。因此,如何利用深度学习技术从一幅或者多幅低分辨率医学图像中获得高分辨率图像成为当前主要研究热点之一。随着深度学习模型在自然图像超分辨率重建中的成功应用,采用深度学习模型进行医学图像超分辨率重建的研究逐渐开展起来。然而,医学图像与自然图像有本质的区别,其超分辨率重建不仅需要在图像切片平面上进行,还需要在切片之间进行,如图2所示。图2 医学图像超分辨率图像示意图(此图部分来自参考[9] )除了将自然图像中的超分辨率重建模型直接应用到医学图像,Oktay O等人采用深度残差卷积网络从多个2D心脏磁共振(magnetic resonance,MR)图像中重建出3D高分辨率MR图像,提高了层间分辨率。Pham C H等人将SRCNN模型拓展到3D,以实现脑部MR图像的超分辨率重建。McDonagh S等人提出对上下文敏感的残差网络结构,可以得到边界和纹理清晰的高分辨率MR图像。Zheng Y等人提出多个Dense模块和多路分支组合的MR高分辨重建模型,该模型具有较好的重建结果和泛化能力。Zhao X L等人提出通道可分离的脑部MR图像高分辨率重建模型,一个通道采用残差结构,一个通道采用密集连接结构,实现了特征的有效利用,从而提高高分辨率图像的重建质量。Tanno R等人结合3DSubpixelCNN和变分推论实现了磁共振扩散张量图像的超分辨率重建。Peng C等人提出空间感知插值网络(spatially aware interpolation network,SAINT),充分利用不同切面的空间信息提高超分辨率图像的重建质量,该模型在对CT图像进行2倍、4倍和6倍分辨率重建时,均取得了较好的结果。Shi J等人提出一种多尺度全局和局部相结合的残网络(multi-scale global local resial learning,MGLRL)模型,实现了MR图像的超分辨重建,该模型可以增强图像重建细节。Lyu Q等人采用GAN实现了多对比度MR图像的超分辨率重建。与医学图像降噪相似,基于深度学习的超分辨率图像重建需要低分辨率图像样本和高分辨率图像样本对对网络进行训练。通常采用下采样的方式进行高/低分辨率图像样本对的构造。然而针对不同模态的医学成像,其成像原理大不相同,高分辨率和低分辨率之间的对应关系也不尽相同。因此,采用人工下采样的方式获得训练数据,学习低分辨率图像与高分辨率图像的对应关系,很可能与实际采集中低分辨率图像与高分辨率图像的对应关系不相符,进而导致重建的高分辨图像无意义,因此如何构建符合实际的高/低分辨率图像样本对是利用深度学习进行超分辨重建的难点。2.1.3 医学图像重建医学图像重建是指将采集的原始数据重建为临床上可视图像的过程,如CT采集的原始数据为投影图像,MR采集的原始数据为K空间数据,需要重建算法才能获得临床上用于诊断的图像。在实际应用中,由于一些采集条件的限制(如在CT中尽量减少投影数目,缩短采集时间,以降低辐射影响;在MR成像中,减少K空间填充数目,缩短采集时间,以避免患者的不适或者由患者运动带来的图像伪影),需要降低原始数据的采集率。然而,降低原始数据的采集率必然会影响图像的重建质量。因此,研究合适的重建算法,保证在原始数据低采样率下仍能获得高质量的重建图像,成为医学图像重建中的研究重点。目前采用深度学习模型进行医学图像重建的方法主要分为两类:一类是从原始数据直接到图像的重建,另一类是基于后处理的方式提高重建图像的质量。第一类方法的代表模型有:ADMM-Net,其用深度迭代的方式学习传统交替方向乘子(alternating direction method of multipliers,ADMM)优化算法中的超参数,可以直接从欠采样的K空间数据中重构出MR图像;Adler J等人提出对偶学习模型,用其代替CT重建中的滤波反投影方法,实现了投影数据到CT图像的准确重建;Cheng J等人在此基础上提出原始-对偶网络(primal-al network, PD-Net),实现了MR图像的快速重建;Zhang H M等人提出JSR-Net(joint spatial-Radon domain reconstruction net),利用深度卷积神经网络模型,同时重建CT图像及其对应的Radon投影变换图像,得到了比PD-Net更好的重建结果。第二类方法是目前主要的重建方式,即采用图像去伪影的后处理模型进行重建。用于图像降噪、超分辨重建的模型都可以用于该类型的图像重建,如Lee D等人提出带有残差模块的U-Net模型结构来学习重建图像与原始欠采样图像之间的伪影;随后,他们又提出利用双路U-Net模型对相位图像和幅度图像进行重建,进而提高了MR图像的重建质量;Schlemper J等人采用深度级联的卷积神经网络(convolutional neural network,CNN)模型,学习动态MR图像采集的时序关系,进而在快速采集下提高动态MR图像的重建质量;Han Y等人采用域适应微调方法,将CT图像重建的网络应用到MR图像重建上,可以实现高采样率下的准确重建;Eo T等人提出KIKI-Net,同时在K空间和图像空间域上使用深度学习网络进行重建,提高了MR图像重建的性能;Bao L J等人采用一个增强递归残差网络,结合残差块和密集块的连接,用复数图像进行训练,得到了较好的MR图像重建结果;Dai Y X等人基于多尺度空洞卷积设计深度残差卷积网络,以较少的网络参数提高了MR图像的重建精度;受到GAN在视觉领域成功应用的启发,Yang G等人提出一种深度去混叠生成对抗网络(DAGAN),以消除MRI重建过程中的混叠伪影;Quan T M等人提出一种具有周期性损失的RefinGAN模型,以极低的采样率提高了MR图像的重建精度;Mardani M等人基于LS-GAN损失,采用ResNet的生成器和鉴别器来重建MR图像,获得了较好的可视化结果。图像降噪、图像超分辨率重建、图像重建等均属于反问题求解。因此,其模型可互相通用,本文不对其进行一一阐述。2.2 医学图像合成2.2.1 医学图像数据扩展目前,临床上医学图像合成主要有两个目的。其一,扩展数据集,以获得大量医学影像样本来训练深度学习模型,从而提高临床诊断和预测的准确度。尽管已有很多数据扩展方法,如平移、旋转、剪切、加噪声等,但是其数据扩展方式无法满足数据多样性的需求,在提升深度学习模型的预测精度以及泛化能力上仍有待提高。其二,模拟成像。由于不同模态的医学图像可以提供不同的信息,融合不同模态的医学影像信息可以提高临床诊断精度。然而同一个病人的多模态影像信息很难获取,此时图像合成便提供了一种有效的手段。此外,某些新兴的成像技术对成像设备具有较高的要求,仅少数的医院及科研机构可以满足要求,因此图像合成为获取稀缺的影像数据提供了可能。随着GAN模型在自然图像合成上的成功应用,应用GAN的衍生模型进行医学图像合成已成为近几年的研究热点。在医学图像数据集扩展方面,主要采用无条件的GAN模型进行合成,即主要从噪声数据中生成医学图像。常用的方法是以深度卷积生成对抗网络(deep convolutional GAN,DCGAN)为基线模型进行改进。如Kitchen A等人基于DCGAN模型成功地合成了前列腺的病灶图像;Schlegl T等人基于DCGAN提出一种AnoGAN模型,用来生成多样的视网膜图像,以辅助视网膜疾病的检测;Chuquicusma M J M等人采用DCGAN模型生成肺结节数据,其结果可达到临床放射科医生无法辨别的程度;Frid-Adar M等人使用DCGAN生成了3类肝损伤(即囊肿、转移酶、血管瘤)的合成样本,以提高肝病分类的准确性;Bermudez C等人采用DCGAN的原有训练策略,生成了高质量的人脑T1加权MR图像。尽管DCGAN在医学图像合成上取得了众多有价值的成果,但其仅能合成分辨率较低的图像。为了提高医学图像合成的质量,一些改进的GAN模型被提出,如Baur C等人采用LAPGAN,基于拉普拉斯金字塔的思想,利用尺度逐渐变化来生成高分辨率的皮肤病变图像,该方法生成的图像可以有效地提高皮肤疾病分类的准确性。此外,基于渐进生长生成对抗网络(progressive grow GAN,PGGAN)在高分辨率图像合成方面的优势,Korkinof D等人利用PGGAN合成了分辨率为1 280×1 024的乳腺钼靶X光图像。2.2.2 医学图像模态转换医学图像的模态转换合成可以分成两类。一类是单模态的转换,如低剂量CT到普通计量CT图像的转换提出上下文感知生成模型,通过级联3D全卷积网络,利用重建损失、对抗损失、梯度损失,采用配对图像进行训练,实现了MR图像到CT图像的合成,提高了合成CT图像的真实性。除了级联模型,在多模态图像转换任务中,常采用的深度模型网络架构为编码-解码结构,典型代表为Pix2Pix以及CycleGAN模型。如Maspero M等人采用Pix2Pix的网络结构,实现了MR图像到CT图像的转换,进而实现放化疗过程中辐射剂量的计算;Choi H等人基于Pix2Pix模型,从PET图像生成了结构信息更加清晰的脑部MR图像。尽管Pix2Pix模型可以较好地实现多模态图像的转换,但是其要求源图像与目标图像必须空间位置对齐。这种训练数据在临床上是很难获取的。针对源图像和目标图像不匹配的问题,通常采用CycleGAN模型进行图像生成。Wolterink J M等人使用不配对数据,利用CycleGAN从头部MRI图像合成了其对应的CT图像,合成图像更真实。目前,CycleGAN已成为多模态医学图像转换中广泛采用的手段,如心脏MR图像到CT图像的合成、腹部MR图像到CT图像的合成、脑部C T图像到M R图像的合成等。然而CycleGAN有时无法保留图像的结构边界。Hiasa Y等人引入梯度一致性损失,对CycleGAN模型进行了改进,该损失通过评估原始图像与合成图像之间每个像素梯度的一致性来保留合成图像的结构边界,进而提高了合成图像的质量。3 医学图像配准与分割在很多医学图像分析任务中,获得高质量的图像数据后,经常需要对图像进行配准,并对感兴趣区域进行分割,之后才能进行图像分析和识别。本节分别对深度学习在医学图像配准以及分割领域的应用进行详细的阐述。3.1 医学图像配准图像配准是对不同时刻、不同机器采集的图像进行空间位置匹配的过程,是医学图像处理领域非常重要的预处理步骤之一,在多模态图像融合分析、图谱建立、手术指导、肿瘤区域生长检测以及治疗疗效评价中有广泛的应用。目前,深度学习在医学图像配准领域的研究可以分成3类,第一类是采用深度迭代的方法进行配准,第二类是采用有监督的深度学习模型进行配准,第三类是基于无监督模型的深度学习配准。第一类方法主要采用深度学习模型学习相似性度量,然后利用传统优化方法学习配准的形变。该类方法配准速度慢,没有充分发挥深度学习的优势,因此近几年鲜见报道。本文主要集中介绍有监督学习和无监督学习的医学图像配准。基于有监督学习的配准在进行网络训练时,需要提供与配准对相对应的真实变形场,其配准框架如图3所示。网络模型的训练目标是缩小真实变形场与网络输出变形场的差距,最后将变形场应用到待配准的图像上,从而得到配准结果。在有监督学习的医学图像配准中,变形场的标签可以通过以下两种方式获得:一种是将经典配准算法获得的变形场作为标签;另一种是对目标图像进行模拟形变,将形变参数作为真实标签,将形变图像作为待配准图像。在基于有监督学习的刚性配准方面,Miao S等人首先结合CNN,采用回归的思想将3D X射线衰减映射图与术中实时的2D X射线图进行刚体配准;Salehi S S M等人结合深度残差回归网络和修正网络,采用“先粗配准,再细配准”的策略,基于测地线距离损失实现了3D胎儿大脑T1和T2加权磁共振图像的刚体配准,建立了胎儿大脑图谱;随后,Zheng J N等人采用域自适应的思想,利用预训练网络实现了2D和3D射线图像配准,其设计了成对域适应模块,用来调整模拟训练数据与真实测试数据之间的差异,以提高配准的鲁棒性。在非线性配准方面,模拟非线性变形场比模拟刚性变形场困难很多,因此在基于有监督学习的非线性配准中,大多采用经典方法获得变形场,并以其为标签,对模型进行训练。Yang X等人首先以U-Net网络模型为基线结构,利用微分同胚算法获得变形场,并将其作为标签,实现2D和3D脑部MR图像的端到端配准。因为非线性变形场较难模拟,所以在监督学习中引入弱监督配准和双监督配准的概念。弱监督配准指利用解剖结构标签做配准的标记,学习变形场。Hu Y P等人使用前列腺超声图像和MR图像的结构标记训练CNN模型,学习变形场,然后将变形场施加在灰度图像上,从而实现MR图像和超声图像的配准。Hering A等人采用相似度测量和组织结构分割标签,同时训练配准网络,提高了心脏MR图像的配准精度。双监督配准是指模型采用两种监督形式的损失函数进行训练,如Cao X H等人在进行MR图像和CT图像配准时,先利用生成网络将MR图像转换为其对应的CT图像,将CT图像转换为其对应的MR图像,在配准的过程中,同时计算原始MR图像与生成MR图像之间的相似性损失以及原始CT图像与生成CT图像之间的相似性损失,通过两种损失的优化,提高配准的精度;Fan J F等人结合有监督模型损失和无监督模型损失,实现了脑部MR图像的准确配准。有监督学习的医学图像配准的精度取决于标签的可靠性,因此,如何生成可靠的标签并设计合适的损失函数,是有监督学习的医学图像配准中待解决的难点。图3 有监督深度学习医学图像配准框架随着空间变换网络(spatial transformer network,STN)的问世,利用无监督深度学习模型进行医学图像配准成为研究热点。其配准网络框架如图4所示。Yo o I等人结合卷积自动编码器(convolutional auto-encoder,CAE)和STN模型,实现了神经组织显微镜图像的配准,其中CAE负责提取待配准图像与目标图像的特征,基于该特征计算相似性损失,结果表明,该种损失能取得较好的配准结果。2018年,Balakrishnan G等人提出VoxelMorph网络结构,以U-Net为基线模型,结合STN模块,实现了MR图像的非线性配准;随后,其对模型进行了改进,引入分割标记辅助损失,进一步提高了配准的Dice分数。Kuang D等人提出空间变换模块,用于替代U-Net网络结构,在降低模型参数的前提下,实现了脑部MR图像的准确配准。Zhang J为了进一步提高无监督配准的准确度,除了相似度损失,还引入了变换平滑损失、反向一致性损失以及防折叠损失。其中,变化平滑损失和防折叠损失是为了保证变形场的平滑性。反向一致性损失在互换待配准图像与目标图像时,可保证变形场满足可逆关系。Tang K等人利用无监督网络实现了脑部MR图像的端到端配准,即网络模型同时学习了仿射变换参数和非线性变换参数。除了基于CNN模型的无监督配准,采用GAN模型进行配准也已成为一种研究趋势,即采用条件生成对抗网络进行医学图像配准。其中,生成器用来生成变换参数或者配准后的图像,判别器用于对配准图像进行鉴别。通常在生成器与判别器之间插入STN模块,以进行端到端训练。目前,基于GAN模型的医学图像配准有较多的应用,如前列腺MR图像与超声图像配准,以CycleGAN为基线模型的多模态视网膜图像、单模态MR图像配准,CT图像和MR图像配准等。在基于GAN的医学图像配准中,GAN模型或者起到正则化的作用,用来调节变形场及配准图像,或者用来进行图像转换,利用交叉域配准提高配准的性能。表1总结了典型的无监督配准模型和有监督配准模型。图4 无监督深度学习图像配准网络框架3.2 医学图像分割医学图像分割是计算机辅助诊断的关键步骤,是进行感兴趣区域定量分析的前提。随着深度学习在语义分割中的快速发展,将自然图像分割模型扩展到医学图像已成为主要趋势。在医学图像分割中,采用的主流网络框架有CNN、全卷积网络(full convolutional network,FCN)、U-Net、循环神经网络(recurrent neural network,RNN)和GAN模型。目前常用的医学图像分割模型包括2.5D CNN,即分别在横断面、失状面、冠状面上使用2D卷积进行分割,在节约计算成本的前提下,充分利用三维空间的邻域信息提高分割的准确度。FCN是深度学习语义分割的初始模型,通过全卷积神经网络和上采样操作,可以粗略地获得语义分割结果。为了提高分割细节,采用跳跃连接将低层的空间信息和高层的语义信息相结合,以提高图像分割的细腻度。FCN及其变体(如并行FCN、焦点FCN、多分支FCN、循环FCN等)已被广泛应用到各种医学图像分割任务中,且表现良好。U-Net是由一系列卷积和反卷积组成的编码和解码结构,通过跳跃连接实现高级语义特征和低级空间信息的融合,进而保证分割的准确度。U-Net及其变体(如Nested U-Net、V-Net、循环残差U-Net)在医学图像分割上取得了较好的分割结果,是目前医学图像分割的主流基线模型。RNN类分割模型主要考虑医学图像分割中切片和切片之间的上下文联系,进而将切片作为序列信息输入RNN及其变体中,从而实现准确分割。典型的模型有CW-RNN(clockwork RNN)和上下文LSTM模型,其通过抓取相邻切片的相互关系,锐化分割边缘。在此基础上, Chen J X等人提出双向上下文LSTM模型——BDC-LSTM,即在横断面双向、矢状面双向和冠状面双向上学习上下文关系,其结果比采用多尺度分割的金字塔LSTM模型要好。基于GAN的分割的主要思想是生成器被用来生成初始分割结果,判别器被用来细化分割结果。一般在分割网络中,生成器常采用FCN或者U-Net网络框架,判别器为常见的分类网络结构,如ResNet、VGG等。基于GAN的医学图像分割已经被应用到多个器官和组织的医学图像分割任务中。表2为常见医学图像分割模型所用的数据集以及其分割性能对比。4 医学图像分类及识别4.1 医学图像分类医学图像分类和识别是计算机辅助诊断(computer-aided diagnosis,CAD)的最终目标。在深度学习出现前,常采用人工定义的图像特征(如图像的纹理、形状、图像的灰度直方图等),经过特征选择后,再基于机器学习模型(如支持向量机、逻辑回归、随机森林等)进行分类。典型代表为影像组学方法,其在肿瘤的分型分期、治疗的预后预测方面取得了很多重要的成果。然而,人工定义特征以及特征选择方式很大程度上影响了分类的可靠性和鲁棒性。近年来,深度学习模型的飞速发展,尤其是CNN的广泛应用,使得利用神经网络模型自动提取和选择特征并进行分类成为主流趋势。CNN模型的不同变体已经在基于医学影像的临床疾病诊断中得到了广泛的应用,例如基于Kaggle公司的眼底图像公开数据集,Shanthi T等人使用改进的AlexNet进行糖尿病视网膜病变的分类,其精度可以达到96.6%左右;基于VG G,利用胸片进行肺结节的良恶性分类,其精度可高达99%。目前,在常见的CNN变体中,ResNet和VGG在医学影像分类中的表现最好,因此大多数的肿瘤检测、脑神经系统疾病分类、心血管疾病检测等将这两种模型作为基线模型进行研究。与自然图像数据相比,医学图像数据中满足模型训练需求的数据较少。因此,为了提高临床影像智能诊断的准确性,通过知识迁移来训练医学图像分类模型已成为主流。常见的知识迁移包含自然图像到医学图像的迁移、基于临床知识的指导迁移。在自然图像到医学图像的迁移中,主要有两种方式:一种是固定利用自然图像训练的网络模型的卷积层参数,利用该参数提取医学影像特征,然后利用该特征结合传统的机器学习方法进行分类;另一种是将自然图像训练的网络模型参数作为医学图像训练模型的初始化参数,通过微调来实现医学图像分类。除了自然图像到医学图像的迁移,还可以利用其他医学图像数据集,采用多任务学习的方式进行数据信息共享,弥补数据不足带来的分类缺陷。基于临床知识的指导迁移将临床医生诊断的经验(如医生的经验学习方式、影像诊断方式以及诊断关注的图像区域和特征等)融入模型,根据临床医生诊断的经验,即先掌握简单的疾病影像诊断,再进行复杂疾病诊断,研究者们提出了“课程学习”模型,将图像分类任务从易到难进行划分,模型训练先学习简单的图像分类任务,再学习较难的分类任务。基于该方式的学习可以提高分类的准确度。基于医生诊断的方式(如迅速浏览全部医学图像,再选择某些切片进行诊断),研究者提出基于全局和局部的分类模型,其在胸片和皮肤疾病的诊断上取得了较好的效果。基于诊断时关注的影像区域,带有注意力机制的分类模型被提出,典型的代表有AGCNN(attention-based CNN for glaucoma detection)、LACNN(lesion aware CNN)和ABN(attention branch network),通过引入注意力,网络可以关注某些区域,从而提高分类的精度。此外,根据医生诊断用到的经验特征,如肿瘤的形状、大小、边界等信息,将人工定义的特征与深度模型提取的特征进行融合,提高医学图像的分类精度,也是一种趋势。如Majtner T等人将人工特征分类结果与深度学习分类结果进行融合,提高了皮肤癌分类的准确度;Chai Y D等人将人工特征和深度学习特征进行融合并训练分类器,从而实现青光眼图像的分类;Xie Y T等人将人工提取的特征图像块与深度学习图像块同时作为ResNet模型的输入,实现肺结节的准确分类。如何将深度学习特征与传统人工特征进行有效的融合,是该类模型设计的难点。4.2 医学图像目标识别医学图像目标识别也属于临床诊断的一种,即在一幅图像中标记出可能病变的区域,并对其进行分类,如图5所示。图5 医学图像目标识别示意图传统的人工标记识别费时费力。最初将深度学习模型应用于目标识别时,主要是将图像分成小块,逐块输入由CNN等组成的二分类模型中,判断其是否属于目标区域。随着深度学习模型在目标检测领域的快速发展,尤其是Fast R-CNN模型和Mask R-CNN模型的出现,将整幅医学图像输入模型,即可一次找到所有可能的目标区域。但是在这两类模型中均存在一个区域建议模块和一个分类模块,二者需要进行迭代更新,模型的速度并不能满足临床的实时性要求。YOLO(you only look once)和SSD(single shot multibox detector)模型的问世解决了目标检测的实时性问题。基于此类模型,Lin T Y等人提出RetinaNet模型,并将其扩展应用到病理图像和钼靶图像乳腺肿瘤识别、CT图像的肺结节检测中。上述模型均针对2D图像进行目标检测,忽略了3D图像中切片和切片之间的空间信息。为了提高识别的准确度,基于RNN和LSTM的识别模型被应用到医学图像中。此外,在医学图像目标识别中,同样存在数据不充足的问题。为了解决这个问题,基于迁移学习的医学图像识别逐渐开展起来,如基于ImageNet数据进行模型迁移,实现肺结节、乳腺癌和结直肠息肉的检测。同时,基于临床经验知识指导的迁移学习也被应用到医学图像的目标检测中。典型代表有AGCL模型,其基于注意力的课程学习,实现胸片中的肿瘤检测;CASED (curriculum adaptive sampling for extreme data imbalance)模型,其可检测CT图像中的肺结节;特征金字塔模型(feature pyramid network,FPN),其采用不同对比度的图像,利用多尺度注意力模型实现肿瘤检测。图像分类和图像目标识别是医学影像临床诊断的最终目标,是目前人工智能技术与临床紧密结合的研究方向。笔者仅对分类识别的几种情况进行了阐述,以便掌握其发展方向。表3给出了肿瘤分类中常用的医学图像数据集以及深度学习模型,并对比了其分类性能。5 结束语本文从医学图像数据产生、医学图像预处理,以及医学图像识别和分类等方面,阐述了深度学习模型在医学图像分析领域的应用现状。尽管深度学习模型(如CNN、LSTM、GAN、注意力机制、图模型、迁移学习等)在医学图像分析中已取得众多突破,然而将深度学习应用于临床,辅助临床进行精准诊断和个性化治疗仍受到以下几方面的限制。首先,现有的深度学习模型对影像数目和质量有较高的要求,而临床上带有标记的医学影像数据难以获取,且目前临床诊断预测常使用的方法是有监督学习,数据的不充足势必会影响预测的准确性和稳定性。因此,如何在只有少量有标签数据的情况下,采用弱监督、迁移学习以及多任务学习的思想,提高分类预测的准确度,将是持续的研究热点。其次,临床应用对可解释性要求较高,而目前深度学习模型所学习的特征无法进行有效的解释。尽管现阶段已有研究学者提出采用可视化以及一些参数分析来对模型和结果进行解释,但是与临床需求中要求的形成可解释的影像学标记还有一定的距离。因此,研究深度学习模型的可解释方法将是医学图像领域的研究热点。最后,如何提高模型预测的鲁棒性是待解决的难点。现有深度学习模型多数仅针对单一数据集效果较好,无法在不训练的情况下,较好地预测其他数据集。而医学影像由于采集参数、采集设备、采集时间等因素的不同,相同疾病的图像表现可能大不相同,这导致现有模型的鲁棒性和泛化性较差。如何结合脑认知思想改进模型结构以及训练方式,提高深度学习模型的泛化能力,也是医学图像应用领域中待研究的关键问题。作者简介王丽会(1982-),女,博士,贵州大学计算机科学与技术学院、贵州省智能医学影像分析与精准诊断重点实验室副教授,主要研究方向为医学成像、机器学习与深度学习、医学图像处理、计算机视觉 。秦永彬(1980-),男,博士,贵州大学计算机科学与技术学院、贵州省智能医学影像分析与精准诊断重点实验室教授,主要研究方向为大数据治理与应用、文本计算与认知智能。联系我们:Tel:010-81055448010-81055490010-81055534E-mail:bdr@bjxintong.com.cn
医学影像是人工智能与医疗健康结合中,发展最为迅猛的领域。据不完全统计,国内涉足医学影像AI业务的企业已经多达上百家。以汇医慧影、推想科技、图玛深维为代表的医学影像AI初创公司在过去几年里飞速成长,团队规模不断壮大,均取得了单轮数亿元人民币融资的亮眼成绩。技术层面,医学影像AI已经从前沿概念变成了成熟可用的产品,具备了临床应用的条件。应用边界不断拓展,从最常见的肺结节、眼底逐步延伸到了乳腺癌、骨科、心血管、脑部疾病等诸多领域,产品矩阵不断丰富,并形成了差异化。产品与临床诊疗流程的结合也日益深入,从只能完成单点任务(例如优化结节检出)进阶到能完成以疾病(例如肺癌)或者部位(例如全肺CT影像诊断)为中心的诊疗流程。不管是在产品形态还是临床应用场景的进化上,都已经跨出了重要的一步。填补行业报告的空白医学影像AI发展到今天已经自成一隅,成为医学AI中最为繁盛的分支,值得单独拿出来深入剖析。然而,雷锋网发现目前市面上鲜有重点聚焦医学影像AI的独立行业研报。作为一家跟踪医学影像AI发展长达两年多的专业媒体,雷锋网有责任开风气之先。为此,经过近两个月的企业调研、报告撰写后,雷锋网推出了首份医疗影像AI行业垂直深度报告——《2018医学影像AI行业研究报告》。本报告不拘泥于格式,不堆砌无意义的表格和数据,不做价值较小的常识内容普及,而是深入行业本质,剖析入微。报告内容报告中,我们针对医学影像AI这个庞大市场中相关的各类玩家及其技术、产品和商业化路径进行剖析,试图为大家呈现出医学影像AI的真实面貌,以帮助各位把握这个行业的概况,同时作为投资、创业的参考。概括来说,本报告的主要内容包括:还原医学影像AI领域的发展现状,及行业共同面临的几大挑战分析8大主流赛道的市场需求、技术挑战及代表性企业的产品落地情况对比中美医学影像AI监管思路,介绍中国医学影像AI监管体系的建设情况对行业未来发展趋势的几大判断雷锋网梳理出了目前医学影像AI领域最热门和最具代表性的八条赛道——肺结节、眼底、乳腺癌、宫颈癌、皮肤病、骨龄测试、脑部疾病、靶区勾画,以及每条赛道上最具代表性玩家,将其产品特点及落地情况进行横向对比,力求直观地还原行业现状。同时,医疗作为一个强监管行业,受到国家政策的引导和约束,医疗影像AI产品上市必须先获得相关部门审批。雷锋网在报告中单独辟出一个章节,对中美两国的医疗AI产品监管思路进行了深入对比。从结果来看,在传统医疗器械领域,中国由于起步较晚,和美国的发展存在一定差距,审批要求也有很大的不同。但在医疗人工智能领域,两国起步时间差不多,基本保持齐头并进的态势,监管思路非常接近,有很多可以相互交流和借鉴的地方。雷锋网在医学影像AI行业的积累医学影像AI作为一个多学科交叉领域,需要各方思想的交流和碰撞。过去两年多时间里,雷锋网采访了近百位医学影像AI公司与医疗器械企业高管,73位三甲医院影像科主任、30多位国际知名医学影像分析学术专家、数十位知名医疗投资人,以及监管部门核心负责人,发表了百篇以上的医学影像行业深度报道。与此同时,7大Fellow得主田捷、飞利浦中国CTO王熙、MICCAI 2019大会主席沈定刚、微软亚洲研究院副院长张益肇、斯坦福医学物理系主任邢磊等顶尖医学影像专家均在雷锋网举办的医疗大会中做深度报告。2018年,我们对过去两年多的调研结果进行了重新组织与梳理,同时在近三个月内与产、学、医、投资、监管五界的资深人士再次交流碰撞,从市场需求、技术、资本、监管等多个维度,对医学影像AI的发展进行全景、立体式的展现。报告适宜人群与机构:企业:医疗人工智能从业者与创业者风投:投资医疗AI赛道的风险投资人高校:计算机视觉、图像处理与医学影像研究背景的教授、研究员;欲从事医学影像分析的学生医院:影像科/放射科/病理科主任医师、信息中心主任监管:NMPA等医疗相关监管机构的从业者相信这样一份行业研究报告,将帮助医疗投资人、行业从业者、医生等实现从技术到市场的全面理解,更好地建立行业共识,继而推动技术革命走向产业化落地。购买方式12月3日起,所有雷锋网「AI投研邦」年度会员可前往会员页面免费阅读本报告,非会员亦可通过官方渠道购买后在线查阅。关于「AI投研邦」「AI投研邦」系雷锋网旗下会员组织,聚焦AI+ 10大领域 :AI+汽车(智能驾驶)、AI+教育、AI+金融、AI+智慧城市、AI+安防、AI+医疗、AI+IoT、AI+芯片、AI+零售、AI+安全。「AI投研邦」提供4大服务权益,包括每日投研通讯、每周「大咖Live」、每月AI+主题研报和其他不定期会员彩蛋等,全年365天投研资讯精选推送,40场+国内外AI大咖线上亲授,12份人工智能行业研报。我们希望能给认同投研产生价值的一二级市场投资人、以及给希望知识创造财富的工业界业者,提供更多专业深度的知识服务和交流平台。「AI投研邦」服务将在2018年12月3日与《2018医学影像AI行业研究报告》同步上线。欢迎加入「AI投研邦」,成为行业1000+投研领袖,一起引领人工智能未来。
原作 Jackie SnowRoot 编译自 MIT Technology Review量子位 出品 | 据报道,全球现在超过17亿人的肌肉骨骼都出毛病,每年大概有3千万的急诊病例,而且这个数字还在往上走。骨骼方面的问题已经成为了最常见的慢性重症。为了加快X光片的诊断速度,近日斯坦福吴恩达领头的研究团队开源了含有4万张人体上肢端的X光片的数据集MURA,并用这个数据集训练CNN寻找并定位X光片的异常部分。最后训练的结果,是该模型在手指和手腕X光片中的诊断表现比放射科医生要好些。△ 经过MURA训练的模型可以准确定位出手腕和手指的异常部位不过放射医生依然能比模型更准确地诊断出手肘、前臂、手、上臂及肩膀的异常。△ 图中绿色字体表示表现最优,红色字体代表表现最差。模型对手指、手腕的诊断效果要比三位放射医生的效果都要好。手肘和前臂的诊断结果比人类都差。该神经网络含有169层。当输入多角度的上肢X光片时,模型就可以预测出异常的概率。△ 模型预测X光片异常的工作流作为最大的医学影像数据集,MURA所含的4万张图都是由放射科医生一张张标注的。△ 人工标注的4万张X光片。左上,正常的手肘;右上,骨折的上臂;左下,骨骼退化的指端;右下,打了钢板和钢钉的尺骨和桡骨。这四万张图来自近15000篇论文,其中9067篇为正常上肢骨骼肌X光片的研究,5915篇是异常研究。上肢包括肩膀、肱部、手肘、前臂、手腕、手、指端。现在,越来越多的数据集涌现出来,给深度学习提供了非常好的条件。AI算法在图像识别上能逐步超越人类很大程度上得益于这些数据集的开源。下面列举一些目前在医学影像数据集供大家参考。△ MURA目前是最大的开源医学放射图像数据集。第二大的数据集是Pediatric Bone,含有14236张图,可以根据手的X光片测出人的骨龄;0.E.1是关于膝关节的数据集,可用来查出膝关节炎。不过,依照目前AI发展的速度来看,医学院应该停止培养放射专业的学生了。多伦多大学计算机系教授Geoffrey Hinton在接受纽约客采访时认为。最后,附论文链接: class="bjh-br">数据集要等到2月才会公布,可以持续关注Stanford ML— 完 —加入社群量子位AI社群13群开始招募啦,欢迎对AI感兴趣的同学,加小助手入群;此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。进群请加小助手,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)诚挚招聘量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位对话界面,回复“招聘”两个字。量子位 QbitAI · 头条号签约作者'' 追踪AI技术和产品新动态
12月17日,在第六届东方放射学大会上,中国医科大学附属盛京医院郭启勇教授做了《中国放射医师现状与未来》的主题报告。这次报告中也公布了最新中国医学影像大数据,我们快来一睹为快,这些数据也是以后写标书、策划书时非常好的素材。一、中国大陆设备现状 据统计目前全国二级以上医院共拥有放射医用设备60463台。X线机13200台(CR3897台,DR12662台、胃肠机5676台、乳腺钼靶2460台);CT设备12888台,每百万人口9.4台;磁共振6762台,每百万人口4.9台;DSA 2918台二、中国大陆设备分布情况 东部地区 CT每百万人口拥有量为9.33台,MRI每百万人口拥有量5.28台;海南省CT每百万人口拥有量最多,为18.66台;广东省CT每百万人口拥有量最少,为6.68台。MRI每百万人口拥有量最多的为海南省(8.67台),最少的是河北省(3,73台)。中部地区 CT每百万人口拥有量为9.06台,MRI每百万人口拥有量为4.74台。黑龙江省CT每百万人口拥有量最多,为14.07台;安徽省CT每百万人口拥有量最少,为5.66台;MRI每百万人口拥有量最多的为黑龙江(8.90台),最少的是安徽省(2.80台)。西部地区 CT每百万人口拥有量为9.91台,MRI每百万人口拥有量为4.62台。青海省CT每百万人口拥有量最多,为21.77台;重庆CT每百万人口拥有量最少,为6.63台;MRI每百万人口拥有量最多的为青海省(6.80台),最少的是西藏(0.93台)。三、人员状况 放射从业人员共158072人:高级职称27799人,中级职称53089人,触及职称72370人。男性105129人,女性52943人。东部地区放射从业人员为66439人,中部地区59265人,西部地区32368人。中部地区男性从业人员占本地区放射从业人员的百分比为70.8%,高于东部地区和西部地区。按医院级别放射人员分布情况 三级医院放射从业人员68061人。男性放射从业人员42608人,占62.6%,女性放射从业人员25453人,占37.4%。二级医院放射从业人员90011人。男性放射从业人员62521人,占69.5%,女性放射从业人员27490人,占30.5%。东、中、西部各地区三级医院、二级医院均是男性放射从业人员所占的比例高于女性。不同年龄段放射人员分布情况 放射从业人员小于30岁的有35770人,占全国放射从业人员总数的22.6%,30-39岁的有56734人,占全国放射从业人员总数的35.9%,40-49岁的38934人,占全国放射从业人员总数的24.6%。东部地区、中部地区的三级医院和二级医院的全国放射从业人员年龄分布中均是30-39岁的人数最多,40-49岁的人数次之。西部地区的三级医院与二级医院30-39岁的放射从业放射人员人数最多,所占构成比分别为36.1%、36.9%,小于30岁的放射从业人员人数次之,所占构成比分别为25.6%、27.2%。不同年龄段按医院类别分布情况 综合医院共有放射从业人员126146人,30-39岁最多,为45235人,所占构成比为35.9%。中医医院共有放射从业人员18699人,30-39岁最多,为6668人,所占构成比为35.7%。专科医院共有放射从业人员11975人,30-39岁最多,为4415人,所占构成比为36.9%。东部地区与西部地区,综合医院的放射凑个人员构成比是30-39岁所占构成比最高,小于30岁所占构成比次之,大于等于70岁所占构成比最低。在中部地区综合医院放射从业人员30-39岁所占构成比最高,40-49岁所占构成比次之,大于等于70岁构成比最低。按类别分布情况 放射医师人数为86303人,技师人数为41762人,护理人员为19452人,分别占全国放射人员数量的54.6%、26.4%和12.3%。东部地区放射医师中,三级医院19271人,二级医院18468人,分别占相应级别医院放射从业人员总数的56.9%和56.7%;技师三级医院9434人,二级医院7412人。中部地区放射医师在二级医院人数最多,为22803人,占中部二级医院放射从业人员总数的60.8%。西部地区三级医院放射医师5008人,二级医院8464人,技师、护理、工程师和物理师二级医院人数均大于三级医院。全国三级医院放射医师总人数36568人,二级医院49735人,分别占全国相应级别医院放射从业人员总数的53.7%。放射人员按医院类别分布情况 东部地区不同执业类别放射从业人员中放射医师数量最多,为37739人,其次为技师16846人,物理师最少,为404人,其放射医师中综合医院占比最大,总数位29534人(56.9%)。中部地区不同执业类别放射从业人员中放射医师人数为35092人,技师14896人,物理师321人,其放射医师中综合医院占28102人(59.0%)。西部地区不同执业类别放射从业人员中放射医师人数为13472人,其中综合医院10945人(41.2%)。全国放射医师综合医院68581人,中医医院10623人,专科医院6413人,其他医院686人。放射医生职称分布 放射医师分类中主治医师人数最多,为29803人,占全国放射医师总数的34.5%,住院医师为28249人,占全国放射医师总数的17.4%,主任医师6502人,占全国放射医师总数的7.5%。东部地区主治医师人数众多,为12953人,占东部放射医师人数的34.3%,住院医师其次,占比为32.3%,三级医院和二级医院均为主治医师占比高。中部地区主治医师人数最多,为12249人,占比34.9%,其中二级医院主治医师人数高于三级医院主治医师人数,分别为8019人和4230人;其次是住院医师人数为11644人,占比33.2%。西部地区主治医师人数为4601人,占其地区放射医师总人数34.2%,其次是住院医师4397人,占比32.6%;医师和见习医师数量最少,占比仅为1.8%。
雷锋网AI掘金志《未来医疗大讲堂——医学影像专题》第四期总结文:一个只给医疗AI从业者、影像科医生、名校师生、CFDA工作人员看的系列课程。注:90分钟的视频信息量巨大,文章仅为冰山一角,强烈建议观看完整版视频(含57页PPT),请点击链接:http://www.mooc.ai/open/course/384一、数据篇(17页PPT)1.医学影像数据资产盘点2.标注工具——脱敏:大框架、小技巧3.标注工具第一类——PC+文件夹处理4.标注工具第二类——专用IT系统和工具:客户端系统与网站系统5.第三方标注工具LabelImg6.自建工具7.标注工具开发心得8.标注工具第三类——专用工具+AI辅助标注二、算法篇(31页PPT)1.关于数据分割比例2.迁移学习3.框架选型:Pytorch、Caffe、TensorFlow、MXnet4.目标检测用于面部皮肤疾病分析数据脱敏及预处理、皮肤疾病检测5.目标检测用于宫颈基液细胞分析基于深度学习+GBDT的Two Stage模型multi CPU+multi GPU宫颈病理三分类系统6.3D目标检测用于肺结节CT分析:数据处理、肺结节预测框架、Faster RCNN框架、Online hard Example mining、Loss 函数、框架选择、我们的模型框架、FROC效果提升、模型网络结构(150层+,Unet+Resnet)、分类器与融合三、算力篇(9页PPT)1.架构选型决策:品牌 VS DIYIntel CPU+Nvidia GPUPower CPU+Nvidia GPUIntel CPUIntel +ASICIntel +FPGA2、选型决策:云VS自建亚马逊云、美团云、阿里云3.算力优化:CPU GPU 宽带优化、CUDA吴博从数据、算法和算力三个层面,详细介绍了自己在AI医学影像落地方面的实战经验和心得。他指出,医疗数据的价值评估与钻石类似,可以从数据质量、同分布来源的影像数据尺寸和数据标注程度这三大维度来考核。没有经过标注的数据就像未经加工的原石,无法体现其价值,因此数据标注是AI医学影像落地过程中至关重要的一环。吴博对数据标注工具进行了分类,并分享了自己在开发数据标注工具方面的心得。他指出,通过自建工具能够更好地满足项目推进过程中的用户管理、权限管理、多人协作审核,以及模型迭代标注调整等需求。数据层面,企业能做的决策不多,只能“看菜吃饭”,但在算力层面,企业有很多的选择,比如选择什么样的框架,选择品牌设备还是DIY设备,选择云服务还是自建机房等。在课程的最后部分,吴博详细介绍了许多选型决策和算力优化方面的技巧。嘉宾介绍:吴博,宜远智能CEO学术背景:吴博先后在清华大学、香港浸会大学求学,并在英国利兹大学完成博士后,师从计算机视觉专家唐远炎教授等人。与此同时,他也在ICML/ACL等顶级会议发表多篇人工智能论文。工业界经验:2017年创立医疗AI公司:宜远智能,该公司集结了20多名人工智能博士以及众多海内外医学顾问,为医疗健康领域提供AI增强解决方案,并与多家知名医院达成合作,并推出成型产品。创立宜远智能之前,吴博曾在爱立信大数据研究院任职。还主导过百亿级虚拟品电商、数字货币系统的业务及数据架构建设与运营。2017年成果:吴博领导的宜远智能团队在医学影像领域,取得以下成绩:1.阿里天池医疗AI大赛GPU环节国内最佳;开源系统荣获大赛人气奖。2.面部皮肤诊断分析API、SDK已经进入商业化,并在2017年世界互联网大会展出。3.宫颈基液细胞学诊断AI在权威评测中,超出医生水平。以下图文为雷锋网AI掘金志节选的吴博课程部分内容:一、数据篇如何评估数据价值?医疗人工智能建立在海量数据的基础之上,但优质的医疗数据十分稀缺,其价值随之凸显。如何准确评估数据的价值,是医生和投资人非常关心的话题,对此业内尚未形成共识。吴博认为,医疗数据可以类比为钻石。钻石的价值评估对应着颜色、净度、切工和克拉这四个维度,医疗数据也可如此类比。颜色越纯、净度越高的钻石,价值也就越高。对于医学影像数据来说,它的价值也取决于其干净、规范、清晰和标准化的程度。如果是从胶片、PACS系统和诊断报告中翻拍而来的数据,必然会包含一些杂质,其价值将大打折扣。吴博指出,高质量的数据需要是Raw Data,比如mhd格式的DICOM影像和openslide病理图像。钻石单颗克拉数越高,价值也就越大。吴博认为,钻石的克拉数可类比同分布来源的影像数据尺寸。所谓同分布来源的影像数据,对CT来说就是来自同一设备的,参数和曝光强度都相同的影像数据;对病理图像来说,则指采用同一染色方法和色度、同一扫描仪及倍数,以及相同存储格式的影像数据。虽然AI企业的最终目标是开发出一套通用性强的算法,能通吃各种数据;但作为数据资产方,同分布同来源的影像数据规模越大,其价值就越高。有些医院虽然拥有大量数据,但它们来自不同的科室,格式也不尽相同,这种数据的价值是要打一些折扣的。钻石成为商品前需要经过切割等加工,医疗数据同样要经过标注等处理才能释放其价值。钻石的切割工艺分为许多个层级,医疗影像数据的标注亦是如此。从基础的类别标注到类别+病灶方框标注,再到类别+像素级勾画,标注的精细度逐级提升,数据的价值亦水涨船高。如何选择数据标注工具?工欲善其事,必先利其器。要想对医疗影像数据进行精细化的标注,首先得有好的标注工具。吴博将标注工具划分成了三大类别,他将最基础的一类称作“pc+文件夹处理”,即让医生在pc和工作站上对数据进行分拣。对于医生来说,专业的数据标注软件有一定的学习成本,原始的分拣处理减少了学习成本,而且往往行之有效,还具有不受网络影响、安全性较高等优点。不足之处则在于,对后期的数据清洗要求更高,而且过程繁杂,十分消耗人工物力。更高阶的有专用IT系统和工具,包含第三方工具和自建工具。以MIT 的 Pascal VOC 标准标注工具 labelImg为代表的第三方工具虽然功能强大,但在通用性和灵活性方面还有所欠缺,因此企业经常不得不开发一些自建工具。宜远智能在开发数据标注工具方面积累了许多心得。吴博指出,通过自建工具能够更好地满足项目推进过程中的用户管理、权限管理、多人协作审核,以及模型迭代标注调整等需求。尤其是在医学影像领域,标注的数据大多为图片,天然具备便于展示的优点,因此可以本着方便易用的原则采用H5的canvas来设计标注工具,同时结合css3的变换,满足图像缩放、标注的需求。标注人员只需打开浏览器即可标注,无需复杂软件部署。鉴于有些标注图片太大(比如一例CT数据多达几十甚至上百兆,一例病理数据有可能多达1G),网络传输效率低下,有时候需要对标注数据做本地处理。小的项目可以采用数据本地化的方式,使用fiddler等代理软件将网络图片请求代理到本地。大的项目则可以做内网的分布式部署,将标注系统部署在内网服务器上,由标注人员在内网进行标注。基于这些自建工具,标注人员可以根据需求选择本地标注或在线标注,操作集中于鼠标,交互非常友好。标注人员可根据不同标注需求绘制点/线/框,无需复杂设置,打开浏览器即可标注,也可以清楚看到哪些已标哪些未标。随着技术发展,数据标注本身也呈现出了AI化的趋势。比如基于以往的标注,可以通过AI模型对数据进行预处理,然后由标注人员在此基础上做一些校正。二、算法篇(算法篇 共有31页信息量极大的PPT)三、算力篇吴博认为,算力优化本质上是跟预算做斗争,因为任何一家企业的预算和资源都是有限的,必须做很多的决策,要有所取舍。数据层面,企业能做的决策不多,只能“看菜吃饭”,有多少数据就做多大的事。但在算力层面,企业有很多的选择,比如选择什么样的框架,选择品牌设备还是DIY设备,选择云服务还是自建机房等。就框架而言,Intel CPU + Nvidia GPU的框架是目前为止的首选,特别是在需要做模型训练的情况下。但企业也可以根据自身需求选择其他框架,比如IBM体系的Power CPU + Nvidia GPU框架,性能也很优异,在CPU与CPU、CPU与GPU、GPU与GPU之间都可以提供非常出色的带宽支持,构成比较高端解决方案。而且为了追赶Intel CPU + Nvidia GPU的框架,Power CPU + Nvidia GPU提供了很多扶持计划。对于研发团队来说,加入它们的foundation获得算力上的支持是个不错的选择。而且Power和浪潮的合作非常紧密,这意味着它的国产化将不成问题。此外,还有Intel CPU、Intel + ASIC、FPGA等多种框架,它们各有优缺点,企业可以视自身情况作出选择。……学员部分提问雷锋网AI掘金志线上直播结束后,学员从不同维度提出了18个问题,吴博对多数问题进行了耐心解答。问题:1.多疾病分类的时候,针对严重不均衡的数据,除了过采样以外,还有没有算法层面的突破?严重不均衡的数据集合会不会造成分类时baseline不稳定?2.如何对多模态数据进行有效利用?3.针对组织器官数据有哪些标注工具?4.模型迭代标注调整是什么意思?5.今天讲的细胞学、病理、肺结节等,有做成产品用到医院的吗?6.病理图片的颜色千差万别,如何做预处理?7.液基细胞学用语义分割做的分割效果如何?……本文仅展示了部分内容和10页PPT,剩下的精彩内容和47页PPT,欢迎点击链接:http://www.mooc.ai/open/course/384
2018 全球人工智能与机器人峰会(CCF-GAIR)于6月29日在深圳召开。本次大会共吸引超过2500余位 AI 业界人士参会,其中包含来自全球的 140 位在人工智能领域享有盛誉的演讲与圆桌嘉宾。在大会第二天的 【计算机视觉专场】中,上午计算机视觉前沿与智能视频环节的演讲嘉宾有:ICCV 2011和CVPR 2022大会主席权龙教授、旷视科技首席科学家孙剑等人。下午环节为计算机视觉与医学影像分析,出席的嘉宾分别是包揽7大模式识别与医学影像Fellow的田捷教授,国际顶级医学影像分析大会MICCAI 2019 联合主席沈定刚教授,微软亚洲研究院副院长张益肇博士,飞利浦中国首席技术官王熙博士等。作为计算机视觉与医学影像分析环节的重量级嘉宾,本次大会,田捷教授向与会观众分享了题为“基于人工智能和医疗大数据的影像组学研究及其临床应用”的精彩专题报告。田捷教授现任中国科学院自动化所研究员、分子影像重点实验室主任。自2010年起,田捷教授连续获得计算机视觉与医学影像分析领域的7大Fellow:IEEE Fellow、IAMBE Fellow、SPIE Fellow、AIMBE Fellow、IAPR Fellow、OSA Fellow、ISMRM Fellow。同时也是两项国家重点基础研究发展计划(973计划)首席科学家。田捷教授认为,人工智能等技术给医学领域带来的改变是毋庸置疑的,并列举了几个医学常见案例进行辅证。在他看来,医疗大数据里最常见的是影像数据,而且影像数据格式标准,容易获取、容易使用。但是医疗大数据不仅限于影像,还包括病理、临床治疗信息等,只有这些信息融合在一起,我们才能建模,才能解决人工智能真正在医学上的应用。田捷教授在研究学术的同时,也在积极探索AI技术的应用前景。他认为,AI技术只有跟临床挂钩才有价值,经过企业家的转化才能变成生产力。现在我们需要更多人工智能和大数据在医疗问题上的典型应用,来拉动产业,拉动人工智能进一步深度应用。这是相辅相成的,空喊方法,不形成规模化、典型应用,是解决不了问题的。只有得到外科、内科大夫承认的技术和临床应用,才能更加有意义。与此同时,他还表示,人工智能在医学上应用一定要“医工交叉”,工科的人要穿上医学的马甲,了解医学的问题,参加医学的会,了解医生的需求;作为医生也要对工科的方法知其然,这样才能源于临床,高于临床,又回归临床。以下为田捷教授的现场演讲内容,雷锋网作了不改变原意的编辑及整理: 我下面汇报的是人工智能和医疗大数据在医学上的应用,这是大家比较关注的热门话题,我想从“临床”和“商业”两个方面来做一下简要的归纳。人工智能在医学上的应用和传统中医非常相像。我国中医几千年以来,通过“望闻问切”的方式积累了几百万人甚至几千万人的医疗大数据,后期主要通过人脑来“加工”这些数据;现代社会与此前不同的是,我们使用电脑加人脑,利用此前积累的经验以及大数据与人工智能技术,实现了现在所说的智能医疗。人工智能目前是国家战略,健康中国2030也是国家战略。从这两个角度来说,通过人工智能技术和医疗大数据,提高人们的健康水平是国家下一步的重点发展战略;与此同时,国家也有计划要将我们的医疗和健康占GDP的比重从3%提升到30%。从商业角度出发,人工智能在医学上的应用机会很多,包括通过计算能力驱动肺癌、糖网、乳腺癌等疾病的筛查。今天,我想重点与大家分享的是人工智能对于临床医疗的重要性,它能提高我们的临床医疗水平,实现精准医疗,具体涉及到术前、术中、术后三个方面。从目前医学发展背景来看,人工智能、大数据等技术在医学上的应用是众势所趋。去年北美放射医学大会上给出描述:未来的影像中心就像飞机驾驶舱一样,是各种各样信息的综合体;而未来的医生则相当于飞行员,要处理各种各样的信息。这里还需重点阐述一个观点:如今很多声音表示,AI未来将要替代医生。在我看来,AI不会替代医生,只会更有效地辅助医生。而医生也不应惧怕新兴技术,而是积极地去利用它,使用它。当今,我们处于信息变革的时代,医学大数据也在不断的增长和积累,平均每73天,医学数据就会增长一倍。因此,基于医疗大数据的人工智能医疗必将辅助甚至改变传统的临床诊疗流程。国际影像战略策略研讨会副主席Donoso说了一句很经典的话,人工智能是否会完全替代影像科医生无法下定论,但我们肯定的是,那些使用人工智能技术的影像科医生,势必会代替那些不使用人工智能技术的医生。不跟随时代的发展,面临的就是残酷的淘汰,无论是北美放射年会,还是欧洲放射年会,都不断的在突出人工智能在影像学中的异军突起的作用。所以,未来的影像科医生,不仅仅要会看片子,还要从影像大数据中挖掘大量的潜在知识,学会利用人工智能技术,站在科技潮流的前端,不是惧怕新兴的人工智能技术,而是利用它,使用它,成为新时代下的影像信息学专家。上个月刚刚结束的美国临床肿瘤年会ASCO2018,该年会的参与者大多为内科大夫、肿瘤大夫,他们也提出,要将人工智能技术作为辅助新一代无创诊疗技术发展的重要工具。Dana-Farber癌症研究所首席研究员Geoffrey指出,无创的液体活检技术可以更加便捷的实现肺癌的早期检测和筛查,血液中游离DNA可以成功检测出早期肺癌。而随着这种无创检测手段的进步,医学数据不断积累,机器学习方法将有效提高检测精度、提高测试性能。此外,南加州大学生物科学学院院长在大会指出,在肿瘤疗效评估中,结合基于液体活检技术的基因蛋白组学和基于深度学习方法的智能影像评估可有效预测患者的预后生存。由此可见,无论是在癌症诊断还是治疗中,人工智能技术都是辅助新一代无创诊疗技术发展的重要工具。一、影像组学的本质那么,人工智能在医学领域到底如何应用,接下来我会举一些例子说明。举例之前,我们首先必须了解影像组学概念,其2012年就被提出,是由英文“组学+放射”组合出来的新词:“radiomics”,我们当年认为把它翻译成“放射组学”比较准确。当年为什么用了放射这样一个词汇?它是基于CT进行扫描的数据,然后在PET和超声上得到应用,所以我们认为将“radiomics”翻译成影像组学可能更为精准,它不仅仅融合了医学影像、基因、临床大数据,它也把组学的概念和组学的方法融合在一起。它的工作流程与医生日常读片完全是一模一样的方法,针对影像数据,提取特征,人工智能建模,然后再进行临床应用、辅助决策。这个流程也是一个标准的计算机视觉流程,也是标准的模式识别流程。但它相比医生的高能之处在于计算机看到了高维信息,可能看到了蛋白基因在宏观影像上的变化,这样的宝贵数据可以辅助医生提升临床诊断的正确性和准确性。需要注意的是,人工智能技术在医学上的研究、应用,不是写文章、不是谈概念、也不是纸上谈兵、更不仅仅是做筛查,而是要将技术与临床紧密结合,解决实际临床问题。二、典型临床应用下面我就从临床和技术两个方面谈一下人工智能在医学上的具体应用。首先我想谈谈人工智能在临床上的应用,在座各位很多都是技术人员,对于技术方法比较了解。其实我们在了解技术本身的同时,更需要了解技术到底能够解决什么问题,或者说目前医学需要解决什么问题。所以我先从问题为导向,观察临床上有何需求。在这里,我想举一个细分例子,围绕着临床应用的术前、术中、术后,来说明人工智能如何使得医学治疗更加精准。第一个例子是结直肠癌。外科大夫在为病患做手术之前都会为患者做一个辅助化疗,以控制癌症的发展,之后再为他进行手术。在这个过程中,一部分病患非常不幸,经过辅助化疗之后,他们病理上完全缓解,体内也没有癌细胞存在,但外科大夫无法凭借他的经验来肯定判断他们体内是否还有癌细胞潜藏,所以不得不还为这些病人开刀(实际上病患身上已经没有癌细胞存在)。从这来看,我们能否通过其他方式来准确判别病人的实际数据,让他们在外科大夫的经验无法准确判定、常规的影像磁共振无法精确判别时,能够非常肯定地判定病人的数据。通过人工智能分析,目前我们有90%的把握能把这些PCR缓解的病人挑选出来。换句话说,系统能够将经过辅助化疗以后,体内没有癌细胞的病人找出来。后期,这部分病人就可以免受开刀,只需密切观察随访即可。所以,它的临床意义非常大,人工智能未来不仅仅能够做筛查,更重要是,它能针对临床问题来开展工作。这是我们配合北京大学肿瘤医院放射科专家做的工作,这个结果已经发表在临床肿瘤研究的顶级杂志上。第二个例子还是结直肠癌。如果病患经过化疗之后并没有PCR缓解(占比70%左右),那么他们是需要进行手术的。开刀之后,医生需要对他们做淋巴清扫,以防止癌细胞转移。问题是:清扫完之后显示,70%的淋巴是假阳性。这里需要说明的是,假阳性结果与中国医生的开刀技术没有直接关系,美国大夫开刀假阳性也有70%左右。而这个问题也可以用人工智能技术解决。我们用人工智能技术处理500例临床病理、影像数据完整的结直肠癌患者数据,经过病理、影像,提取特征以后,在实测中,能把70%的淋巴假阳性降到30%,这是医学上非常巨大的进步。目前这项研究也发表在临床肿瘤的顶级杂志JCO上。需要指出的是,其第一作者只是一个硕士二年级的小女孩,所以我们在医学领域的研究并不需要多少临床经验,关键是先要找到临床问题,以问题为导向来解决它,并不是一味的低头专耕技术。第三个例子依旧是结直肠癌。刚才我已经讲了术前及术中,术前有没有病理学的缓解,术中要不要进行淋巴清扫。我们再来看术后,结直肠癌患者做了手术之后,外科大夫还可以给他做一个放化疗控制远端转移。这里又出现了一个问题,经过手术后的结直肠癌患者远端转移的概率只有20%,换句话说,有80%的患者花了钱,忍受了放化疗的痛苦,而去做在他身上也许不可能发生或者概率非常小的远端转移。就此,我们能否用人工智能技术把这些概率大的人挑选出来,再去做放化疗,控制他远端转移;而概率不大的人也就没必要做远端转移,后期观察即可。目前我们正在做相关的人工智能技术落地实验,希望这个概率可以提升更高,预测得更为精准。综上,我举了一个非常完整的例子,从术前、术中、术后来说明人工智能、影像组学、医疗大数据到底怎么改变我们的医学,改变我们的精准诊疗。刚才我所提到的都是手术方面的内容。那么,人工智能能否解决不用开刀也能解决的问题呢?也就是说,其能否既可以辅助外科大夫,也可以辅助内科大夫。我们知道,即使是美国著名医院的外科大夫得了肺癌,他也不知道该用什么样的靶向药,怎么预测他的生存期。而这个工作可以用人工智能、大数据来解决,我们针对500余例晚期EGFR突变靶向治疗患者多中心CT数据,利用LASSO-COX构建反映靶向治疗无进展生存期预测模型,实现对EGFR突变的晚期肺癌患者靶向治疗无进展生存期进行个性化的精准预测。如果后期发现他无进展,这时候我们就提醒他不要再用这个靶向药,价格昂贵不说,效果也不大。目前这项研究发表在CCR上,也是国内学者解决的重点医学工作。举例来说,系统可以对病患的鼻烟癌给出判断及生存期预测。针对临床指标对晚期鼻咽癌的放疗后预测精度低的现状,我们对118例晚期鼻咽癌T1和DCE MR图像做了超过3年时间的随访,并结合970个影像组学特征,和临床病理信息进行分析,在此有效预测该类患者的预后,准确度超临床指标的10%。再举一个例子,我国是肝癌大国,肝纤维化、肝硬化、肝癌是肝癌患者的病变三步曲。所以,对于肝癌患者的治疗,准确判断他们的肝纤维化非常重要。过去医生一般用超声诊断,但是超声的判断准确率只有百分之六七十左右。想要准确判断还需要做一个痛苦的工作:肝穿。用一根穿刺针穿到病患肝里面用病理学组织来确定到底有没有纤维化,从而决定用不用抗病毒的治疗方法。问题来了:能不能用人工智能技术来处理这些数据,不做肝穿也能达到跟它一样的病理学效果。针对这个问题,我们走访了12家医院,采取了600多份数据样本,用深度学习来提取它的特征,实测表明,在使用过程中,人工智能的预测结果与肝穿方法非常一致。换句话说,它能够代替以往的肝穿治疗方式,让病患不需忍受痛苦,用几张图片就能达到绝佳效果。三、影像组学新模态应用在后来的研究过程中,有相关医生提出,炎症会不会对结果产生影响。可以肯定地说,人工智能在对轻度炎症困扰上没有差别;对于重度炎症有一些差别,但是影响不大,准确率还是会远远高于人工判断。后来又有人提出,能否将该技术转化为一个软件,做商业化应用。后期验证过程中,我们发现无论是轻度肝硬化还是重度肝硬化,效果都比较鲁棒,适合医院临床应用。在这里我必须强调一点,人工智能在医学上的应用最好是以问题导向,有了问题再找方法,再去解决。我们可以源于临床,高于临床,这时候我们再商业化应用,医生们就不会抵触,他会主动来使用,因为可以很好地帮助他们辅助诊断。以上是从临床角度讲了人工智能在医学上的应用。接下来我再从技术角度来讲人工智能、模式识别、大数据在医学上应用的进展。四、影像组学的关键技术以肿瘤治疗为例来说。首先是肿瘤分割,一般可能需要医生先进行勾画,然后可以用机器学习的方法进行半自动或者全自动的分工,这些分割都可以提取相关的影像组学的特征,使得我们用人工智能的方法来建模分析。这一块的技术方法有很多,但是坦率说,哪种方法好,还得针对你遇到的问题。第二方面是特征描述,影像组学、人工智能并不是比人更加聪明,只不过医生读片时,人眼提取的信息永远是以形状为主的,以结构为主的。而从影像组学提取的特征,是强度、纹理、小波,最大值、标准方差、灰度矩阵这些特征,人眼是没法看的,同时人脑也难以加工。对于计算机来说,恰恰是它最为擅长的。所以在特征选择上,计算机选择的特征和人眼识别的特征形成了互补关系。如果我们能用计算机提取高维特征,包括毛刺、分叶等信息,再融合年龄、性别、家族史等信息,肯定是1+N>N,我们就能实现人机交互、计算机和人协同工作,从而使得我们的医学更为精准。选择特征的时候切记要多多益善,特别是把这些高维特征提取得越多越好。还有一个非常重要的点,为什么现在影像组学、人工智能热,就是这些高维特征含有基因蛋白这些微观信息,在这些宏观的影像上的体现,只不过过去人眼提取不了,但现在计算机提取了,把这些信息来进行系统加工,使得我们的预测更加精准提取特征之后,还有一项非常重要的工作是降维。共有四类主要特征降维方法:稀疏选择、空间映射、神经网络、递归排除。针对具体临床问题,业界还采用建立计算机定量影像特征与所研究临床研究问题标签之间的分类模型。主要运用了两类模型:SVM模型:从影像大数据原始像素出发,提取高维手工设计特征并进行特征选择,构建影像特征与临床问题的分类模型。CNN模型:在影像大数据的原始像素的基础上,该模型可自主挖掘与临床问题相关的影像组学特征,构建影像特征与临床问题的分类模型。至于建模部分,前面很多讲者也讲了很多模型,人工智能、深度学习有一系列的模型,无所谓哪种模型好,关键是针对你的问题,你是要做生存期预测,还是要做疗效评估,针对我们在医学上不同的使用的对象和问题,我们应该选择不同的方法。有了方法之后,我们构建的模型可以提高分类精度,甚至能达到主治医生的水平,大家已经看到了很多例子,我就不展开细说。但是这里面还有一个非常重要的环节,是我们做计算机、做工科最容易忽视的:我们往往把模型建出来,就直接把这些结果拿给医生去看,希望医生可以去使用。这时候,你一定会吃闭门羹,因为医生肯定会说这不是我需要的东西,你这些模型我看不懂,我根本没法用。所以后期非常重要的步骤就是:要让他们看图识字,要把这些数据可视化。你给医生们一大堆模型,他会觉得很难懂,换成图片之后,他就觉得非常好用,我们要从医生的角度看问题,把模型可视化。另外,计算机处理离不开数据,这些数据质量到底怎么样,我们也要从医生的观点来看待它。去年临床肿瘤学杂志上发表了一篇文章,是以荷兰大夫为主发表的,他在谈数据质量标准的评价,给出了16个评价标准,36分是满分,进行数据质量打分,而且他也会编程序,编一些简单的程序,把它放到网上,你直接填表打分,最后告诉你数据质量是怎么样的,我觉得目前也是对医学用人工智能判断,用影像组学第一个比较公开的数据标准,值得大家借鉴、参考。五、人工智能+医学影像的未来展望刚才我从技术方面谈了人工智能怎么针对医疗问题,用什么样的方法解决。涉及分割、特征提取、模型构建、模型可视化、质量控制5个环节。最后我想提一下人工智能在医学影像应用未来的发展方向,主要涉及到人工智能的方法、数据、软件、共享平台。我们现在不缺方法,也有很多数据,也有各种各样的软件,但是我缺乏交流共享的平台,我们这个会议也是一个交流共享的平台,我也建议我们相关企业在会后把相关的资源共享出来,这样可以更好地促进人工智能在医学领域的应用。我先从模型讲起,这几年人工智能的模型有很多,有卷积神经网络、迁移学习、博弈进化模型,数据也在不断地增多,智能程度也在不断地提高,所以我做了一个二维的方阵来说明这个问题。迁移学习经过大数据训练,我们可以在医学的小数据上提取到复杂的影像特征,而且这些特征还有很好的解释性。与此同时,我们所提取的高维特征又会带来一个挑战,临床医生表示看不懂且不知道有何意义。此时,我们无法对于医生的困惑做出解释,因为这是计算机分析出的结果,我们不能说它跟肝的哪个血管对应,跟肾的哪个细胞对应。但是我们也可以把这些特征,用强特征分布的热点图表达出来,它有一定的可视化,对这样的强特征的热点图,你去做穿刺或者靶向治疗的时候,穿刺效果就会非常好。与此同时,我们还可以用迁移学习的深度学习方法来提高肺癌基因突变预测的精度。迁移学习模型是经过128万张图片训练出来的,我们做肺癌的时候可能没有这么多图像,但是如果我们想要提高它的预测精度,我们用前面图像训练过的模型可能也会得到比较好的效果。另外,大家知道现在博弈进化模型比较热,它可以让机器学习提高智能程度,这在医学上的应用也非常重要。需要指出的是,我们用人工智能做组学分析,我们需要多病种、多模态、多中心、多参数的数据融合,在这一块,还有非常重要的点是数据标准,虽然我们国家这一块现在已经非常重视,做了一系列的筹备,但是目前为止还没有出来一个影像大数据的数据标准,或者数据规范化的行业标准,所以依然是一个挑战。目前,我们医院有大量的数据,大量的数据不代表就是大数据,我们需要经过数据清洗,影像的数据相对来说还比较规范一些,但是病理的信息、治疗的信息、预后的信息我们都需要有,才能使得人工智能做更准确的预测。所以在这里我也想说,前面我举的那些例子,淋巴清扫的工作,原来我们是想做生存期预测的,但生存期预测我们需要两年以上的病人随访,因此很多信息的提取还需要医疗从业人员去科普,需要让患者知道,我们做临床研究需要大量的信息才能做综合。幸运的是,我们国家人口多,病人多,所以数据也是我们的天然优势,这几年我们配合不同的医院采取的数据,包括儿童水果细胞瘤这样一种眼底的肿瘤,我们都能收集相关数据;肺癌、乳腺癌的数据量更大。这些数据不太牵涉到隐私,我们提取的都是高维信息,我们也不需要存原始图象,所以从某种意义上说这些数据的隐私性是比较好解决的。有了数据,我们还需要软件,我们可以开发各种各样的软件,特别是医学图象处理的软件,我们实验室有三个软件,第一个是MITK,是医学软件的集成平台,包含重建、分割可视化;还有一个是3D软件;另外我们还有一个影像组学的软件,全部是开源的,在我们的网站上可以下载。人工智能在医学上的应用一定要医工交叉,我们工科的人要穿上医学的马甲,了解医学的问题,参加医学的会,了解医生的需求,作为医生也要对工科的方法知其然,你也许不知其所以然,但是你要知其然,这样我们才能源于临床,高于临床,又回归临床,不只是看一个病,不只是一个软件。我就汇报到这里,敬请各位批评指正,谢谢大家。(完)观众提问:刚才您说了要从影像里面提取高维信息,并且说了要源于临床,最后还要回归临床,这些高维信息是由谁来提?是医生来提,还是我们工科的人来提?我还听说您那里面有的有400个高维信息,我看到有的文章好像更多,这些信息是怎么提出来的?田捷教授:这个问题提得非常好,也非常关键。如果用计算机去做,还是停留在结构特征上,我们能弥补一些医生的错误,但是不能辅助诊断。刚才举例子讲的这些高维信息,它到底有没有用,医生也不知道,我们也不知道,但是用计算机、深度学习把它提取之后,我们只能尝试,有些问题可能能很好地解决,有些问题现在还解决不了,我们只是提取这几百个甚至上千个特征,跟那些特征、病理信息融合在一起,我们再去筛选,把关键的信息提取出来,这是降维,最后再建模,然后取得一个好的结果。跟医生在交互的过程中,这些特征是人眼看不了的,医生也搞不清楚,我们拿这些特征去投稿的时候,大部分医生是看不懂的,我们投到医疗杂志上,他会问你这到底有什么效果,我们说不清楚,所以我们把那些东西变来变去,终于变成热力图的模式,最后说明这可能是肿瘤的中心地带,它能反映这样的问题,他能看懂了,知道这是有问题的,然后就接受了我们的论文。我们这些特征不仅仅说明它有用,还要想办法跟医生沟通,把这些特征变成可视化的,让医生能接受,说明它的临床意义。这也是一个痛苦的交互过程。观众提问:刚才我看到您的迁移学习的工作,把上百万张自然图像迁移到肝脏的医学图像上,但是我看到有文章说迁移学习必须要有医学的意义,如果您这样做的话,让自然图象迁移到医学图像上,它的临床意义在哪儿?医生会接受这样做吗?田捷教授:医生能不能接受,关键看临床效果,关键看你能不能针对临床解决问题。我没有去计算机视觉的会议,我现在反而是跑到美国临床肿瘤学会、美国肿瘤学会的会议上,你要到临床医生那里,让他们“折磨”你,找出他们能接受的临床效果和临床意义,这时候你的模型才真正起作用,我们老在计算机视觉会议上谈我的方法和参数好,我觉得意义不大,当然能写文章,只是把纸变成钱。所以我说我们技术人员要穿上医生的马甲,到医学的会议上交流。我是工科生,但近些年我没有发表一篇计算机方面的文章,都是医学的文章。这一点我非常自豪,我能在医学的杂志上发文章,就非常具有临床意义,因为审稿人都是医生,说明我已经穿上医生的马甲了。我认为,这是所有想在医学领域深耕的工科生都需要做出的转变,必须站在医生的角度去思考问题,让他们来当裁判,让他们来鉴别。雷锋网雷锋网
核心摘要:前言:本次AI+医疗研究范畴仅限于围绕临床诊疗开展的核心医疗活动,包括CDSS、智慧病案、AI+检查、AI+新药研发及手术机器人。目前中国对AI+医疗的需求逐渐扩大,而供给尚显不足,整体供需并不均衡。AI+医疗行业目前处于快速成长时期。市场规模:2019年AI+核心医疗软件服务整体市场规模达到21亿元。同比增速高达93.9%,其中CDSS占比最多,达到55.2%,智慧病案位列第二,占比达到25.5%。由于政策利好及疫情影响,艾瑞推算,2020-2022年的CAGR将达到51.9%,2022年预计市场规模将超过70亿元。企业分布:目前AI+核心医疗企业中生态领导者包括百度灵医智惠、科大讯飞、惠每科技、医渡云等,由于百度灵医智惠在领域内具有以下优势:1)通用AI能力位居第一;2)AI+医疗实力(构建医学知识图谱、医疗大数据)雄厚;3)核心医疗领域覆盖场景更为全面,因此在AI+核心医疗领域综合实力处于领先地位。未来趋势:未来AI+医疗知识图谱与AI+医疗算法将持续获得突破,并更广泛、更深度地赋能医疗全流程。随着AI+医疗未来不断普及,人们对于AI+医疗伦理的重视也会逐渐增强,随着对AI+医疗伦理监管的不断加强,未来将构建以人为本的AI+医疗生态体系。AI+医疗研究范畴关注在临床诊疗各环节中,利用人工智能开展的医疗活动人民卫生出版社《医院管理词典》中指出:“现代的医疗服务,已从医院内扩大到医院外,形成了综合医疗的概念,医疗内容也日益广泛,包括增进健康、预防疾病和灾害、健康咨询、健康检查、急救处理、消灭和控制疾病、临床诊疗、康复医疗等。”艾瑞认为,现代医疗服务中最核心的环节是临床诊疗,即通过各种检查,使用药物,器械及手术等方法对疾病作出判断和消除疾病,缓解病情等。因此,艾瑞将围绕临床诊疗开展的各项医疗活动定义为“核心医疗”,核心医疗的发展直接影响了整体医疗的发展进程。本报告聚焦于“人工智能如何赋能核心医疗领域,从而实现医疗模式的转变与突破”,研究范围包括CDSS、智慧病案、AI+检查、AI+新药研发及手术机器人。AI+医疗发展历程中国AI+医疗进入快速成长阶段,着力于探索更多应用场景1956年人工智能(AI)开始成为独立的研究领域,20世纪前,中外对AI在医疗领域的研究集中在临床知识库上,但由于大多数临床知识库必须运行在LISP设备上。而由于当时LISP设备尚不能联网且价格昂贵等原因,临床知识库并没有广泛地应用于临床中。2000年-2015年期间,国外的研究重点为AI在临床知识库外的应用,如手术机器人应用落地、鼓励发展电子病历等。而中国仍以研究更多类疾病的临床知识库为主,发展相对缓慢。2015年-2017年,由于AI在图像识别方面的准确率有大幅度提升,AI+影像得以快速发展。得益于在临床知识库的长期研究,CDSS产品走向成熟。2018年后,中国AI+医疗进入稳定发展阶段,智慧病案等新产品相继面世,目前国产手术机器人尚在研究阶段。AI+医疗算法应用AI+医疗算法生态成熟,核心医疗应用广泛目前传统的机器学习和深度学习算法已被广泛得应用,来处理临床研究和医疗服务中的结构化数据,如医学影像数据、基因数据和生物标志物数据;而非结构化数据,如人工笔记、医学期刊与患者调查等则依靠专门的医学自然语言处理技术来分析。艾瑞通过PubMed公开数据整理,2012-2020年在医学文献中使用到的热门机器学习算法和深度学习算法包括:1)支持向量机(38%),主要应用于识别成像生物标志物和医疗影像分析;2)神经网络(34%),主要应用于生化分析、图像分析和药物开发;3)逻辑回归(4%),主要用于疾病风险评估和临床决策辅助系统。AI+医疗痛点分析AI+医疗存在技术难点与标准缺失,打通数据壁垒成为关键随着我国医疗体制改革的深化、分级诊疗制度的落实,政府开始加大力度解决医疗资源分配问题以及医疗服务效率问题。其中,医疗人工智能的广泛应用在提高医疗质量和服务效率、减少误诊误治方面发挥了重要作用。然而,目前AI+医疗仍存在医学数据相关问题、复合人才短缺、行业标准缺失以及医疗科研转化为成熟产品的周期过长等问题。其中,数据的获取、使用与数据共享是阻碍AI+医疗发展的最大因素。艾瑞认为,由于AI+医疗发展的主要推动力仍是满足医疗行业的刚性需求,因而AI+医疗在未来必然会打通数据壁垒,实现数据的安全、高质量及共享的应用。AI+医疗投融资分析行业处在成长期,AI+影像是投融资热门之一2020年医疗融资事件数持续递减,但融资总额却强劲走高,到达历史最高的40亿元,其中新药研发是今年最热门医疗AI融资领域,占已披露投资额的54%。AI+影像占融资额的比例连续三年保持在20%左右,成为另一热门融资领域。对比2019年与2020年的融资项目轮次,其中天使轮、A轮与B轮占融资项目的比例由85.7%降低到70.6%,说明市场成熟度有所提高。同时笔均融资额从0.39亿元/笔上升至1.14亿元/笔。目前行业处于快速成长期,随着市场融资集中度增加,艾瑞认为,未来拥有医疗牌照或技术领先的优质标的公司会更受资本市场青睐,能吸引更多的资源与资金。中国AI+医疗政策导向政府高度重视AI+医疗发展,持续释放政策红利从政策层面来说,2017年国务院发布的《新一代人工智能发展规划》中提出要发展便捷高效的智能服务,推广应用人工智能治疗新模式、新手段,建立快速精准的智能医疗体系。从2017年开始,我国已把人工智能作为一个国策进行推动,近几年的两会上AI也被多次写入政府工作报告中。而AI+医疗则作为AI中的先行者,得到了政府的大力倡导。2018年政府提出人工智能向基层医疗进行渗透,2019年将AI+医疗的范围进一步扩大到康养范畴,2020年进一步提出未来的建设指南,期望在2023年在以医疗为代表的人工智能领域中建立一套初步的标准体系规范。AI+医疗市场规模2019年市场规模超过20亿元,市场将进入快速成长期2019年由于智慧病案的兴起,使得整体AI+核心医疗软件服务市场规模超过20亿,同比增速高达93.9%,其中CDSS占比最多,达到55.2%。2019年之前,由于大部分细分领域的盈利模式尚未明朗,导致AI+医疗市场一度陷入低谷。但如前所述,国家、社会各界及居民对于AI+医疗的需求一直很旺盛。再加上疫情影响,AI+医疗的优势更加凸显,因此,国家开始逐步发放各类医疗影像AI软件三类证,并进一步出台鼓励AI+医疗发展的政策,这些将会使各细分领域的盈利模式逐渐明晰,市场也将会进入快速成长期。艾瑞推算,2020-2022年的CAGR将达到51.9%,2022年预计市场规模将超过70亿元。AI+医疗产业链分析基础层技术层布局完备,应用层可触达全医疗服务场景AI+核心医疗产业链可以分为AI基础层,AI医疗技术层与应用层:1)基础层,除数据服务外,芯片与通信等基础核心领域已形成牢固的技术壁垒,市场呈寡头局面,艾瑞认为,中、短期内市场格局不会改变;2)技术层,算法、框架以及通用技术则需要长期的投入与研发来攻克,目前各大科技企业与互联网巨头企业基本已完成布局,中小企业生存空间较少;3)应用层,应用层可触达全医疗服务场景,如院内临床决策系统、手术机器人、智慧病案系统、医疗影像、药企新药研发与基因检测,已有大量的互联网医疗公司和传统医疗公司涌入。AI+医疗产业图谱AI+医疗企业分布AI+医疗企业助力核心医疗布局,推动医疗开启新的篇章对于AI+医疗类公司而言,综合技术能力主要体现在覆盖医疗场景的广度与对医疗垂直及细分领域研究的深度。该类公司的长远发展需要本身强大的AI能力作为支撑。因此,既具备医疗深度合作能力又具备强大AI研发能力的公司将更具发展潜力。在AI+医疗领域,百度灵医智惠具有以下优势:1)在人工智能专利申请量及发布量方面极具优势,在领域内通用AI能力位居第一;2)在核心医疗领域覆盖场景更为全面;3)拥有雄厚的AI+医疗实力(构建医学知识图谱、医疗大数据),因此在AI+核心医疗领域综合实力处于业内领先地位。除此之外,科大讯飞在AI+医疗领域积累与沉淀多年,在智能语音及语言技术研究中拥有较强优势,并具有强大的医疗智能化分析能力。AI+医疗应用分析辅助检查、CDSS成熟度最高,智慧病案则处于快速增长期随着人工智能产品在医疗领域被越来越多使用,更多AI+医疗产品延伸至院内院外更多场景,并更加深入的整合进医疗流程。目前,以CT影像、皮肤影像、眼底筛查、病理影像等为代表的AI+辅助检查以及CDSS在技术及应用上最为成熟。其中眼底筛查主要集中于糖尿病视网膜病变、视神经疾病的预测和诊断,CDSS则结合以疾病为中心的知识图谱,智能辅助临床决策并助力医疗机构评审。2019年以来兴起的智慧病案由于目前DRGs、DIP等支付政策推动,目前处于快速增长期。AI+医疗成熟期应用分析-眼底筛查眼底筛查需求广阔,AI+眼底商业模式将进一步扩展眼底疾病是我国目前患者致盲的重要原因,DR(糖尿病视网膜病变)是其中最常见的病因,且随着糖尿病持续时间的增加,发病率也会逐渐增加。根据艾瑞推算,仅考虑DR的威胁,到2030年,我国每天约有38.4万人需要进行眼底筛查,因而眼底筛查需求十分广阔。艾瑞认为,随着眼底筛查三类证的签发,医保收费名录在AI领域的扩大以及基层医疗机构信息化水平的逐渐增强,未来AI+眼底筛查领域也得以逐渐开始从向医院打包销售和独立销售的传统商业模式进一步扩展至由医保支付购买以及由基层医疗机构购买的新型商业模式。AI+医疗成熟期应用分析-CDSSAI赋能诊断及治疗全过程,为临床工作提供切实有效的帮助CDSS是AI与医疗在院内融合的体现,也是现代医疗体系中各医疗机构在近年来关注的重点内容。CDSS在临床工作中的应用,使得医师的诊疗水平得到提升,有效降低了临床上的误诊率和漏诊率。CDSS通过真实病历与循证医学库的积累,经过人工智能的优化处理得到最佳实践库,并以此为根据辅助支持医生的临床诊断与治疗决策。2018年12月国家卫健委出台政策,对医院电子病历评级做出了规定,并提出至2020年所有三级医院要达到评级4级以上的要求,而4级以上评级的重要标准之一即是要拥有不同程度的CDSS。这一政策的实施使得CDSS获得了极为广大的发展前景以及巨大的发展潜力。AI+医疗成长期应用分析-智慧病案AI协助审核病案,助力医保控费及流程管控近年来,政府出台DRGs等按病种付费的医保政策,由于DRGs分组所需的全部信息基本是依据病案首页各项目进行计算,因而对病案首页的审核变得十分重要。除此之外,对全程病案的质控同样具有重大意义:1)解决诊断选择问题;2)规范医学使用术语;3)利于日后追溯,防止法律纠纷;4)完善病案信息。因而,能够通过AI协助,构建一套具有标准化、有效质控、智能化的智慧病案系统,将实现医院统计工作及管理工作的高效高质量,同时辅助医生的日常工作流程,提升我国医疗资源的有效利用度。AI+医疗图谱趋势AI助力医学知识图谱不断进步,赋能临床决策等多应用场景医学知识图谱为医疗信息系统中海量、异构、动态的医疗大数据的表达、组织、管理及利用提供了一种更为有效的方式,使系统的智能化水平更高,更加接近于人类的认知思维。医学知识图谱的构建流程大致分为四个步骤,即医学知识表示、医学知识抽取、医学知识融合、医学知识推理,受益于人工智能的不断进步,这四个步骤都取得了较大的进步。艾瑞认为,知识图谱在医疗领域的意义不仅在于它是一个全局医学知识库,也在于它是支撑例如辅助诊疗、智慧病案等医疗智能应用的基础。在医学知识图谱技术具有优势的公司未来将获得更大、更广阔的AI+医疗发展空间。AI+医疗算法趋势突破AI技术障碍,与医疗领域产生更深度融合医疗与人工智能深度融合已是大势所趋,人工智能理论奠基人特伦斯.谢诺夫斯基在2019年其新书《深度学习:智能时代的核心驱动力量》中预测“基于大数据的深度学习将改变医疗行业,对疾病提供更快速准确的诊断与治疗,甚至未来癌症将变得不再可怕。”具体而言,未来AI+医疗在技术上的突破将包括算法拟合度进一步的优化、算法泛用性的增强、对隐私信息的保护、对AI+医疗产生的结果可解释性的加强,以及通过增加可靠验证而不断降低AI+医疗可能发生不良医疗事件的风险。AI+医疗伦理趋势发展AI+医疗相关伦理道德,构建用户友好的AI+医疗系统AI+医疗的发展带给医疗卫生领域更多契机的同时,也会产生一些伦理性问题。2019年国家卫健委一项针对AI+医疗伦理问题的调研显示,六成受访者对个人隐私及知情权表示担忧;超过一半的受访者对大数据及算法的不可控性表示担忧;超过三成的受访者对于诊疗道德方面表示担忧。未来发展中,随着对AI+医疗伦理监管的不断加强、明确医师主体地位以及强化伦理规约,AI+医疗在应用于医疗服务实践时将更加安全可靠,并构建以人为本、用户友好的AI+医疗生态体系。
2016年上半年,我第一次讲AlphaGo战胜李世石带给医学影像的挑战,当时有人不理解AI跟医学有什么关系。2016年的RSNA年会主题是Beyond Imaging,参加完之后大家觉得好像AI跟医学有关系。2017年,主题变成了Explore Invent and Transform,2018年的主题是Tomorrow’s Radiology Today。现在大家觉得AI是我们人类的助手,AI会改变我们工作方式,改变医学影像的状态,所以我们要去拥抱它、参与它,对未来充满着憧憬。所以我觉得,从RSNA年会的主题就可以看到我们对于AI观念的转变。AI在中国医院的现状调研大家都知道,发展AI作为国家战略是非常坚定的。中国从事AI的公司有1500多家,从事AI影像的公司也有很多。但是,AI在医学上到底有什么需求?今年,中国医学影像AI产学研用创新联盟(CAIERA)联合中华医学会放射学分会与中国医学装备协会人工智能联盟,联合搞了一个调研。这次调研我们回收了医生问卷5142份,企业问卷50多份,研究所问卷120多份。其中,四川省和安徽省在参与和完成问卷数量上分别排第一位,云南在医生注册上排在前面,虽然云南省不大,但是填写问卷的数量排在第二位。在参与调研的医院中,二级医院占48.41%,三级医院占47.81%,基本上是五五开的样子。三级医院完成问卷的情况更好一些。这些医院是否跟相关企业或者科研院所合作过?结果显示,没有合作过的有84%,所以空间很大,值得大家去耕耘。在被调研的医生感兴趣AI领域,腹部最多,有56%;其次是心胸45%、骨关节36%、神经35%、头颈29%、乳腺14%、儿科12%等等。AI应用过程中,医生认为存在哪些问题?第一个是没有行业标准,第二个是AI与临床医生承担的法律责任划分,第三个是医生缺乏相应AI的知识,第四个是AI产品的可信度还达不到。这份调研报告加起来有50多页,还没有正式发布,我仅仅简单介绍了其中2页的内容,给大家透露一点信息。相关结果详情我们会选择一个合适的时机发布,希望调对医学影像AI的布局有所帮助。刚需在哪?企业下一步如何布局?中国医学影像需求很大,但是服务跟不上,很多AI公司在这个领域发展,是所有影像科医生的福音。大量的公司投入其中,必然有更多的机会解决我们的痛点。我们研究了一下中国医疗领域AI公司布局的方向,发现他们集中在头部、胸部、盆腔、四肢关节。最多投入的就是肺结节以及肺部相关疾病,其次是脑出血,盆腔的主要是前列腺、直肠,骨关节主要围绕骨折和骨龄。 大家可以看到,中国医学影像AI公司是很多的,美国反而很少。但是要注意,美国的这些公司都是拿到FDA证的,中国的公司虽然多但还没有一个拿到证的。虽然我们繁荣,但还没有落地。 中国AI企业的产品布局,最多的是肺结节等肺部疾病,几乎所有的AI公司都有,因为这一块大家都觉得门槛低,类似于黑纸上找白点,大家觉得比较容易,其他的眼底、皮肤、骨骼、脑出血等等虽然难度稍微大一些,但总体上图像维度都比较低,比较好识别,成为大家的切入点。复杂维度的地方,目前的算法还是解决不了,需要未来大家一起攻克。因此,离我们临床或者是落地最接近的AI技术就是肺结节,其次就是糖网筛查,其他还有骨骼,越往后的离我们临床越远。目前AI产品涉及成像、筛查、随访、诊断、治疗及疗效评估等各个环节。成像环节,目前基于全迭代的图像重建一个病人要半个小时或更久,临床难以接受。用深度学习的方法有望实现类似于全迭代重建的效果,而时间大大缩短,能解决优质图像的瓶颈问题,可能给图像质量的重建带来一个革命。病变的检测环节,人机协同一定会提升检测病变的敏感度。现在可能大家都意识到了,单病种是不符合我们临床场景的,需要多任务学习。多病种的学习才符合我们的临床场景,所以现在已经有多家公司来布局多任务的学习,对于肺里面的结节肿块、肺炎等等进行检测。另外还有骨折模型,胸部的肋骨骨折可能是急诊常常会出现漏诊的地方,基于深度学习的肋骨骨折模型显示了未来强大的应用潜力;有一些隐蔽的骨折,我们可以通过改变摄像的体位来进行证实。 对于基于CT的肺结节诊断模型,AI产品目前能够从发现结节、结节的排序、量化、随访,一直到提取一些结构化的信息或者是报告,甚至做一些危险度处理的建议。在诊断环节,也在进行着各种探索。只要有大量手术证实的病例,机器学习是有希望的,目前有部分公司的产品在闭环数据上已经显示了非常好的敏感度和特异度(分别达到95%和70%),这样差不多就达到了主治医生的水平,如果解决了泛化性问题,前途是美好的。 预测环节,AI可用于肿瘤预后、治疗效果、能否手术等等,比如纯磨玻璃密度结节到底哪一个该开?哪一个不该开?能够真正判断出来的专家毕竟数量有限,作为普通的医生,怎么判断?我们外科医生怎么判断?如果有AI模型帮助他判断,这个结节可能是有风险的,那就可以帮助他来解决这个问题,减少误判。在治疗环节,现在基于深度学习的图像重建,可以帮助医生重构更加直观的病变位置、形态以及信息,可以进行被切除部位残余正常器官组织的功能评价,可以进行年轻医生术前培训,可以进行术前模拟手术的导航以及路径训练,这些都是AI未来很有潜力的方面。在放疗领域,当然可以在各个环节为放疗医生赋能,比如说通过深度学习推荐、自动勾画靶区等等。还可以进行评价,可以通过深度学习获得更加微观的信息,来提供诊断效果的评价。尤其是靶向治疗,哪些适合,哪些不适合?我们要拿到病理才知道患者该用哪一种靶向药。微观和宏观之间的关系,可以通过深度学习的方法来获得,甚至不用做活检都可以知道哪些病人用靶向药,或者是哪些病人不用靶向药,这是非常有潜力的领域。未来AI产品可能会基于整个医疗流程的全数据形成模型,从而为病人提供更加精准的个性化诊治方案。我们影像科医生面临了一个大好的机遇,未来值得期待。比尔·盖茨说过,任何新技术的短期影响都可能被高估,但长期的影响都可能被低估。AI将会带来我们影像科整个工作内容、工作效率、工作流程、工作方式的转变。产品何时才能拿证为什么医学影像AI中国迟迟拿不到证?第一,AI不同于传统医疗产品, AI如何定义?如何分级?如何测试?比如说,硬件只需要上报产品参数,经检测符合就可以给证,但是AI的模型敏感度可以在50%到99%之间进行调节, 相应的变化就是假阳性率由低到高的变化。这当中如何平衡和判断,需要相关专家和管理部门从新学习、选择和确定。还有,我们是否具备了完整意义的AI产品?如何整合到医疗流程?拿到证后赚谁的钱?这些都是需要考虑的。我们常常说,现在单病种的模型不符合临床场景,覆盖现在几个病种还不够,要覆盖全病种;现在的单纯基于图像识别的产品还不够,需要基于工作全流程的产品。肺结节的模型比较靠谱,给了我们4点启示。第一个就是开放、完整、高质量数据库是至关重要的,肺结节全球开放数据库多,大家的学习机会多。第二个是从源头进行顶层设计,进行高质量的标注,在当下是很重要的。第三个是找到明确的临床需求和使用场景,每个产品到底是解决什么问题,一定要和医生磨合才行。第四,进行大量训练和迭代,以便适合临床工作场景非常关键。 但是,现在作为AI产品核心的数据有很多不如意的地方,数据的数量、质量、标注、共享都是值得我们讨论的和重点解决的问题。我想与各个公司和科学家们分享自己的一个观点:现阶段基于深度学习的AI核心是高质量数据,是医生;未来的核心在于算法科学家,只有最核心的算法突破、技术突破,才能带来真正的行业革命。 我注意到,浙江大学某附属医院出了一个多学科的人工智能会诊报价。这是一个很好的尝试和示范,AI怎么落地?你是直接给病人收费,还是直接绑在硬件和软件上收费,还是直接作为诊疗费付费,还是人机互动的付费,还是多学科的付费?不管怎么说,只有找到了付费的方式,才有AI企业的未来,才会给我们整个行业带来繁荣。临床的使用环节,可能现阶段有很多的问题,我们要帮助企业去解决。可能是产品或者是流程的问题,可能是现在的临床医生训练不够,但科技发展会带来整个架构的改变。就像围棋下到中盘,要系统考虑后半盘如何下,我们也应该从更高的层次上来考虑,如何在现有的层面上来重塑我们的知识结构和方法。我相信人工智能一定会带来重大的技术革新,也会带来我们行业的变革,未来发展会越来越好。
日前,上游新闻·重庆商报记者从市卫生健康委获悉,全市医学影像云中心已初步建成,重医附一院、市人民医院等17家市级医院已接入医学影像云中心,这些医院的放射影像资料可在市级医院内调阅共享,病情诊断也将更为准确。卫生健康信息化是深化医改的重要任务,对有效落实医改措施,提高医疗卫生服务质量和效率,降低患者就医成本等具有重要意义。经过前期建设,市卫生健康委进一步完善了卫生健康信息基础体系,整合优化健康医疗数据资源,深化拓展互联网+医疗健康、健康医疗大数据和智能化应用。市卫生健康委信息统计处处长梅政成介绍,重庆在全国率先实现实有人口和家庭信息市级统筹,全市人口信息覆盖率达98.1%。目前,市级平台已集成3300多万份电子健康档案和2000多万份电子病历数据,初步实现跨区域、跨机构的信息共享与调阅应用。2019年,我市还启动了全市医学影像云中心建设,目前已实现17家市级医院放射类影像数据集中存储和跨院调阅功能,推动数字医学影像云服务创新发展,医生可以院内和跨院查看x光片、ct等。我市还建成了全市医疗机构数据平台,除部队医院外,该平台接入公立医院226家、民营医院16家,基本实现全市公立医院和部分民营医院的实时运行监测,数据汇聚量级和标准化程度位居全国前列。在大数据的支撑下,我市“健康健康+互联网”大大提升了患者的就医体验,增强了患者就医获得感。目前示范建设了25家智慧医院,全市近80%的二级及以上医院开展各类预约诊疗服务,在“智慧医院”示范建设医院已实现15分钟内的分时段预约。远程医疗服务已覆盖90%的区县,实现了贫困区县全覆盖。不仅如此,我市健康医疗大数据应用不断在创新发展。除了开始推动以电子病历与健康档案数据共享互阅为核心的智慧健康服务应用外,还在推动医疗服务绩效提升和医保支付方式改革。基于多元健康医疗大数据探索公共卫生智能化应用,发布了流感、手足口病两种传染病预测模型及慢阻肺的慢性病危险因素筛查模型;在全国首个以电子病历和人口家庭个案等多源数据为基础成功测算了城市级居民健康预期寿命。尤其是新冠疫情期间,我市利用开展疫情大数据分析,建成新冠肺炎确诊病例归档系统,上线疫情监测大数据分析平台,为全市疫情决策分析和卫生健康行业复工复产提供了重要数据支撑。上游新闻·重庆商报记者 陈瑜