欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
深度学习在医学影像中的研究进展及发展趋势掠食者

深度学习在医学影像中的研究进展及发展趋势

深度学习在医学影像中的研究进展及发展趋势王丽会1,2, 秦永彬1,21 贵州省智能医学影像分析与精准诊断重点实验室,贵州 贵阳 5500252 贵州大学计算机科学与技术学院,贵州 贵阳 550025摘要:医学影像是临床诊断的重要辅助工具,医学影像数据占临床数据的90%,因此,充分挖掘医学影像信息将对临床智能诊断、智能决策以及预后起到重要的作用。随着深度学习的出现,利用深度神经网络分析医学影像已成为目前研究的主流。根据医学影像分析的流程,从医学影像数据的产生、医学影像的预处理,到医学影像的分类预测,充分阐述了深度学习在每一环节的应用研究现状,并根据其面临的问题,对未来的发展趋势进行了展望。关键词:深度学习 ; 医学影像 ; 图像处理 ; 人工智能 ; 卷积神经网络论文引用格式:王丽会,秦永彬. 深度学习在医学影像中的研究进展及发展趋势[J]. 大数据, 2020, 6(6): 83-104.WANG L H, QIN Y B. State of the art and future perspectives of the applications of deep learning in the medical image analysis[J]. Big Data Research, 2020, 6(6): 83-104.1 引言医学成像已成为临床诊断的重要辅助手段,其包括计算机断层扫描(computed tomography,CT)成像、磁共振成像(magnetic resonance imaging,MRI)、正电子发射断层扫描(positron emission tomography,PET)成像、超声(ultrasound, US)成像、X射线(X-ray)成像等。如何借助大数据和人工智能技术,深入挖掘海量的医学图像信息,实现基于影像数据的智能诊断、智能临床决策以及治疗预后,已成为目前的研究热点。深度学习属于机器学习的分支,是目前实现人工智能技术的重要手段。随着深度学习技术在图像处理和计算机视觉领域的广泛应用,利用深度学习技术辅助临床诊断和决策已成为医学图像分析领域的研究重点。医学影像智能诊断的流程可大致分为3个步骤,首先获取大量高质量的图像数据,然后对图像进行预处理,最后挖掘图像信息,进行分析预测。其具体环节如图1所示。其中海量、高质量的图像数据是深度学习训练的基础,图像预处理(如配准、感兴趣区域提取)是后续分析准确度的基本保障,挖掘信息、建立预测模型是临床智能决策的关键。因此,本文将分别围绕这3个方面,阐述深度学习在医学图像处理分析流程中每个环节的主要应用现状,最后总结深度学习在医学影像研究中的发展趋势。图1 医学图像处理分析过程2 医学图像复原、重建与合成2.1 医学图像复原与重建海量、高质量的医学图像数据是利用深度学习技术实现影像精准诊断的基础。然而,由于成像设备和采集时间等因素的限制,在医学成像的过程中不可避免地会受到噪声、伪影等因素的影响。同时,针对某些成像方式,需要在成像分辨率和采集时间上进行折中,例如在CT成像中,为了降低辐射的影响,需要减少投影采集数目;在磁共振成像中,为了减少患者运动或者器官自身运动引起的伪影,需要降低K空间的采样率以减少采集时间,然而低采样率会严重影响图像的重建质量。为了获得高质量的采集图像,经常需要进行图像降噪、图像超分辨率重建、图像去伪影等复原与重建工作。下面将分别阐述深度学习在这几方面的研究现状。2.1.1 医学图像降噪基于深度学习的医学图像降噪主要应用在低剂量CT图像中。卷积降噪自动编码器(convolutional neural networkdenoise auto-encoder,CNN-DAE)是早期用于医学图像降噪的深度学习模型。该模型通过一些堆叠的卷积层,以编码和解码的方式从噪声图像中学习无噪图像,其鲁棒性较差,对噪声类型变化较为敏感。随后,Chen H等人提出RED-CNN降噪模型,将残差网络与卷积自动编码器相结合,通过跳跃连接形成深度网络,实现低剂量CT图像的降噪。同年,Kang E等人首先对低剂量CT图像进行方向小波变换,然后将深度卷积神经网络模型应用于小波系数图像,实现降噪,并使用残差学习架构加快网络训练速度,提高性能。虽然这些网络结构的降噪性能相较于传统方法得到了显著的提升,但是其网络训练均以复原CT图像与相应正常剂量CT图像之间的均方误差最小为优化目标,使得降噪图像存在细节模糊和纹理缺失等问题。为了解决这一问题,研究者提出改进损失函数和模型结构的方法来优化低剂量CT图像的降噪效果。WGAN-VGG模型通过引入感知损失,采用WGAN(Wasserstein generative adversarial network)模型进行降噪,利用Wasserstein距离和感知损失提高降噪图像与真实图像的相似性。基于WGAN-GP(gradient penalty)的SMGAN (structurally-sensitive multi-scale generative adversarial net)模型将多尺度结构损失和L1范数损失结合到目标函数中,并利用相邻切片之间的信息降噪,其结果优于WGAN-VGG模型。但是梯度惩罚的使用削弱了生成式对抗网络(generative adversarial network,GAN)的表示能力。为了解决这个问题,Ma Y J等人提出基于最小二乘生成对抗网络(least-square GAN,LS-GAN)的残差生成器结构,通过引入结构相似度和L1范数损失来提高降噪能力,生成器负责学习噪声,降噪图像为生成器的网络输入与网络输出的相减结果。除了生成模型,为了提高降噪效果,Yin X R等人同时在投影域和图像域采用3D残差网络进行降噪,并利用滤波反投影重建算法,实现投影域和图像域的相互转化,通过迭代的思想实现图像降噪。Wu D F等人提出一致性神经网络模型,实现了无监督的图像降噪方法,其不需要无噪图像标签,仅利用有噪图像对模型进行训练,从而获得降噪图像。可以看出,在利用深度学习进行降噪时,常需要利用有噪图像和无噪图像来训练模型,学习噪声类型,或者学习无噪图像与有噪图像之间的对应关系,进而实现图像降噪。这种方式具有一定的局限性,在临床的某些应用上,很难获得真实的无噪图像。因此,如何采用无监督或者自监督模型,仅利用有噪图像实现医学图像降噪将是未来研究的主要方向。2.1.2 医学图像超分辨率重建高分辨率的医学图像可以提供更多的临床诊断细节,然而由于采集设备的限制,临床上高分辨率图像较难获取。因此,如何利用深度学习技术从一幅或者多幅低分辨率医学图像中获得高分辨率图像成为当前主要研究热点之一。随着深度学习模型在自然图像超分辨率重建中的成功应用,采用深度学习模型进行医学图像超分辨率重建的研究逐渐开展起来。然而,医学图像与自然图像有本质的区别,其超分辨率重建不仅需要在图像切片平面上进行,还需要在切片之间进行,如图2所示。图2 医学图像超分辨率图像示意图(此图部分来自参考[9] )除了将自然图像中的超分辨率重建模型直接应用到医学图像,Oktay O等人采用深度残差卷积网络从多个2D心脏磁共振(magnetic resonance,MR)图像中重建出3D高分辨率MR图像,提高了层间分辨率。Pham C H等人将SRCNN模型拓展到3D,以实现脑部MR图像的超分辨率重建。McDonagh S等人提出对上下文敏感的残差网络结构,可以得到边界和纹理清晰的高分辨率MR图像。Zheng Y等人提出多个Dense模块和多路分支组合的MR高分辨重建模型,该模型具有较好的重建结果和泛化能力。Zhao X L等人提出通道可分离的脑部MR图像高分辨率重建模型,一个通道采用残差结构,一个通道采用密集连接结构,实现了特征的有效利用,从而提高高分辨率图像的重建质量。Tanno R等人结合3DSubpixelCNN和变分推论实现了磁共振扩散张量图像的超分辨率重建。Peng C等人提出空间感知插值网络(spatially aware interpolation network,SAINT),充分利用不同切面的空间信息提高超分辨率图像的重建质量,该模型在对CT图像进行2倍、4倍和6倍分辨率重建时,均取得了较好的结果。Shi J等人提出一种多尺度全局和局部相结合的残网络(multi-scale global local resial learning,MGLRL)模型,实现了MR图像的超分辨重建,该模型可以增强图像重建细节。Lyu Q等人采用GAN实现了多对比度MR图像的超分辨率重建。与医学图像降噪相似,基于深度学习的超分辨率图像重建需要低分辨率图像样本和高分辨率图像样本对对网络进行训练。通常采用下采样的方式进行高/低分辨率图像样本对的构造。然而针对不同模态的医学成像,其成像原理大不相同,高分辨率和低分辨率之间的对应关系也不尽相同。因此,采用人工下采样的方式获得训练数据,学习低分辨率图像与高分辨率图像的对应关系,很可能与实际采集中低分辨率图像与高分辨率图像的对应关系不相符,进而导致重建的高分辨图像无意义,因此如何构建符合实际的高/低分辨率图像样本对是利用深度学习进行超分辨重建的难点。2.1.3 医学图像重建医学图像重建是指将采集的原始数据重建为临床上可视图像的过程,如CT采集的原始数据为投影图像,MR采集的原始数据为K空间数据,需要重建算法才能获得临床上用于诊断的图像。在实际应用中,由于一些采集条件的限制(如在CT中尽量减少投影数目,缩短采集时间,以降低辐射影响;在MR成像中,减少K空间填充数目,缩短采集时间,以避免患者的不适或者由患者运动带来的图像伪影),需要降低原始数据的采集率。然而,降低原始数据的采集率必然会影响图像的重建质量。因此,研究合适的重建算法,保证在原始数据低采样率下仍能获得高质量的重建图像,成为医学图像重建中的研究重点。目前采用深度学习模型进行医学图像重建的方法主要分为两类:一类是从原始数据直接到图像的重建,另一类是基于后处理的方式提高重建图像的质量。第一类方法的代表模型有:ADMM-Net,其用深度迭代的方式学习传统交替方向乘子(alternating direction method of multipliers,ADMM)优化算法中的超参数,可以直接从欠采样的K空间数据中重构出MR图像;Adler J等人提出对偶学习模型,用其代替CT重建中的滤波反投影方法,实现了投影数据到CT图像的准确重建;Cheng J等人在此基础上提出原始-对偶网络(primal-al network, PD-Net),实现了MR图像的快速重建;Zhang H M等人提出JSR-Net(joint spatial-Radon domain reconstruction net),利用深度卷积神经网络模型,同时重建CT图像及其对应的Radon投影变换图像,得到了比PD-Net更好的重建结果。第二类方法是目前主要的重建方式,即采用图像去伪影的后处理模型进行重建。用于图像降噪、超分辨重建的模型都可以用于该类型的图像重建,如Lee D等人提出带有残差模块的U-Net模型结构来学习重建图像与原始欠采样图像之间的伪影;随后,他们又提出利用双路U-Net模型对相位图像和幅度图像进行重建,进而提高了MR图像的重建质量;Schlemper J等人采用深度级联的卷积神经网络(convolutional neural network,CNN)模型,学习动态MR图像采集的时序关系,进而在快速采集下提高动态MR图像的重建质量;Han Y等人采用域适应微调方法,将CT图像重建的网络应用到MR图像重建上,可以实现高采样率下的准确重建;Eo T等人提出KIKI-Net,同时在K空间和图像空间域上使用深度学习网络进行重建,提高了MR图像重建的性能;Bao L J等人采用一个增强递归残差网络,结合残差块和密集块的连接,用复数图像进行训练,得到了较好的MR图像重建结果;Dai Y X等人基于多尺度空洞卷积设计深度残差卷积网络,以较少的网络参数提高了MR图像的重建精度;受到GAN在视觉领域成功应用的启发,Yang G等人提出一种深度去混叠生成对抗网络(DAGAN),以消除MRI重建过程中的混叠伪影;Quan T M等人提出一种具有周期性损失的RefinGAN模型,以极低的采样率提高了MR图像的重建精度;Mardani M等人基于LS-GAN损失,采用ResNet的生成器和鉴别器来重建MR图像,获得了较好的可视化结果。图像降噪、图像超分辨率重建、图像重建等均属于反问题求解。因此,其模型可互相通用,本文不对其进行一一阐述。2.2 医学图像合成2.2.1 医学图像数据扩展目前,临床上医学图像合成主要有两个目的。其一,扩展数据集,以获得大量医学影像样本来训练深度学习模型,从而提高临床诊断和预测的准确度。尽管已有很多数据扩展方法,如平移、旋转、剪切、加噪声等,但是其数据扩展方式无法满足数据多样性的需求,在提升深度学习模型的预测精度以及泛化能力上仍有待提高。其二,模拟成像。由于不同模态的医学图像可以提供不同的信息,融合不同模态的医学影像信息可以提高临床诊断精度。然而同一个病人的多模态影像信息很难获取,此时图像合成便提供了一种有效的手段。此外,某些新兴的成像技术对成像设备具有较高的要求,仅少数的医院及科研机构可以满足要求,因此图像合成为获取稀缺的影像数据提供了可能。随着GAN模型在自然图像合成上的成功应用,应用GAN的衍生模型进行医学图像合成已成为近几年的研究热点。在医学图像数据集扩展方面,主要采用无条件的GAN模型进行合成,即主要从噪声数据中生成医学图像。常用的方法是以深度卷积生成对抗网络(deep convolutional GAN,DCGAN)为基线模型进行改进。如Kitchen A等人基于DCGAN模型成功地合成了前列腺的病灶图像;Schlegl T等人基于DCGAN提出一种AnoGAN模型,用来生成多样的视网膜图像,以辅助视网膜疾病的检测;Chuquicusma M J M等人采用DCGAN模型生成肺结节数据,其结果可达到临床放射科医生无法辨别的程度;Frid-Adar M等人使用DCGAN生成了3类肝损伤(即囊肿、转移酶、血管瘤)的合成样本,以提高肝病分类的准确性;Bermudez C等人采用DCGAN的原有训练策略,生成了高质量的人脑T1加权MR图像。尽管DCGAN在医学图像合成上取得了众多有价值的成果,但其仅能合成分辨率较低的图像。为了提高医学图像合成的质量,一些改进的GAN模型被提出,如Baur C等人采用LAPGAN,基于拉普拉斯金字塔的思想,利用尺度逐渐变化来生成高分辨率的皮肤病变图像,该方法生成的图像可以有效地提高皮肤疾病分类的准确性。此外,基于渐进生长生成对抗网络(progressive grow GAN,PGGAN)在高分辨率图像合成方面的优势,Korkinof D等人利用PGGAN合成了分辨率为1 280×1 024的乳腺钼靶X光图像。2.2.2 医学图像模态转换医学图像的模态转换合成可以分成两类。一类是单模态的转换,如低剂量CT到普通计量CT图像的转换提出上下文感知生成模型,通过级联3D全卷积网络,利用重建损失、对抗损失、梯度损失,采用配对图像进行训练,实现了MR图像到CT图像的合成,提高了合成CT图像的真实性。除了级联模型,在多模态图像转换任务中,常采用的深度模型网络架构为编码-解码结构,典型代表为Pix2Pix以及CycleGAN模型。如Maspero M等人采用Pix2Pix的网络结构,实现了MR图像到CT图像的转换,进而实现放化疗过程中辐射剂量的计算;Choi H等人基于Pix2Pix模型,从PET图像生成了结构信息更加清晰的脑部MR图像。尽管Pix2Pix模型可以较好地实现多模态图像的转换,但是其要求源图像与目标图像必须空间位置对齐。这种训练数据在临床上是很难获取的。针对源图像和目标图像不匹配的问题,通常采用CycleGAN模型进行图像生成。Wolterink J M等人使用不配对数据,利用CycleGAN从头部MRI图像合成了其对应的CT图像,合成图像更真实。目前,CycleGAN已成为多模态医学图像转换中广泛采用的手段,如心脏MR图像到CT图像的合成、腹部MR图像到CT图像的合成、脑部C T图像到M R图像的合成等。然而CycleGAN有时无法保留图像的结构边界。Hiasa Y等人引入梯度一致性损失,对CycleGAN模型进行了改进,该损失通过评估原始图像与合成图像之间每个像素梯度的一致性来保留合成图像的结构边界,进而提高了合成图像的质量。3 医学图像配准与分割在很多医学图像分析任务中,获得高质量的图像数据后,经常需要对图像进行配准,并对感兴趣区域进行分割,之后才能进行图像分析和识别。本节分别对深度学习在医学图像配准以及分割领域的应用进行详细的阐述。3.1 医学图像配准图像配准是对不同时刻、不同机器采集的图像进行空间位置匹配的过程,是医学图像处理领域非常重要的预处理步骤之一,在多模态图像融合分析、图谱建立、手术指导、肿瘤区域生长检测以及治疗疗效评价中有广泛的应用。目前,深度学习在医学图像配准领域的研究可以分成3类,第一类是采用深度迭代的方法进行配准,第二类是采用有监督的深度学习模型进行配准,第三类是基于无监督模型的深度学习配准。第一类方法主要采用深度学习模型学习相似性度量,然后利用传统优化方法学习配准的形变。该类方法配准速度慢,没有充分发挥深度学习的优势,因此近几年鲜见报道。本文主要集中介绍有监督学习和无监督学习的医学图像配准。基于有监督学习的配准在进行网络训练时,需要提供与配准对相对应的真实变形场,其配准框架如图3所示。网络模型的训练目标是缩小真实变形场与网络输出变形场的差距,最后将变形场应用到待配准的图像上,从而得到配准结果。在有监督学习的医学图像配准中,变形场的标签可以通过以下两种方式获得:一种是将经典配准算法获得的变形场作为标签;另一种是对目标图像进行模拟形变,将形变参数作为真实标签,将形变图像作为待配准图像。在基于有监督学习的刚性配准方面,Miao S等人首先结合CNN,采用回归的思想将3D X射线衰减映射图与术中实时的2D X射线图进行刚体配准;Salehi S S M等人结合深度残差回归网络和修正网络,采用“先粗配准,再细配准”的策略,基于测地线距离损失实现了3D胎儿大脑T1和T2加权磁共振图像的刚体配准,建立了胎儿大脑图谱;随后,Zheng J N等人采用域自适应的思想,利用预训练网络实现了2D和3D射线图像配准,其设计了成对域适应模块,用来调整模拟训练数据与真实测试数据之间的差异,以提高配准的鲁棒性。在非线性配准方面,模拟非线性变形场比模拟刚性变形场困难很多,因此在基于有监督学习的非线性配准中,大多采用经典方法获得变形场,并以其为标签,对模型进行训练。Yang X等人首先以U-Net网络模型为基线结构,利用微分同胚算法获得变形场,并将其作为标签,实现2D和3D脑部MR图像的端到端配准。因为非线性变形场较难模拟,所以在监督学习中引入弱监督配准和双监督配准的概念。弱监督配准指利用解剖结构标签做配准的标记,学习变形场。Hu Y P等人使用前列腺超声图像和MR图像的结构标记训练CNN模型,学习变形场,然后将变形场施加在灰度图像上,从而实现MR图像和超声图像的配准。Hering A等人采用相似度测量和组织结构分割标签,同时训练配准网络,提高了心脏MR图像的配准精度。双监督配准是指模型采用两种监督形式的损失函数进行训练,如Cao X H等人在进行MR图像和CT图像配准时,先利用生成网络将MR图像转换为其对应的CT图像,将CT图像转换为其对应的MR图像,在配准的过程中,同时计算原始MR图像与生成MR图像之间的相似性损失以及原始CT图像与生成CT图像之间的相似性损失,通过两种损失的优化,提高配准的精度;Fan J F等人结合有监督模型损失和无监督模型损失,实现了脑部MR图像的准确配准。有监督学习的医学图像配准的精度取决于标签的可靠性,因此,如何生成可靠的标签并设计合适的损失函数,是有监督学习的医学图像配准中待解决的难点。图3 有监督深度学习医学图像配准框架随着空间变换网络(spatial transformer network,STN)的问世,利用无监督深度学习模型进行医学图像配准成为研究热点。其配准网络框架如图4所示。Yo o I等人结合卷积自动编码器(convolutional auto-encoder,CAE)和STN模型,实现了神经组织显微镜图像的配准,其中CAE负责提取待配准图像与目标图像的特征,基于该特征计算相似性损失,结果表明,该种损失能取得较好的配准结果。2018年,Balakrishnan G等人提出VoxelMorph网络结构,以U-Net为基线模型,结合STN模块,实现了MR图像的非线性配准;随后,其对模型进行了改进,引入分割标记辅助损失,进一步提高了配准的Dice分数。Kuang D等人提出空间变换模块,用于替代U-Net网络结构,在降低模型参数的前提下,实现了脑部MR图像的准确配准。Zhang J为了进一步提高无监督配准的准确度,除了相似度损失,还引入了变换平滑损失、反向一致性损失以及防折叠损失。其中,变化平滑损失和防折叠损失是为了保证变形场的平滑性。反向一致性损失在互换待配准图像与目标图像时,可保证变形场满足可逆关系。Tang K等人利用无监督网络实现了脑部MR图像的端到端配准,即网络模型同时学习了仿射变换参数和非线性变换参数。除了基于CNN模型的无监督配准,采用GAN模型进行配准也已成为一种研究趋势,即采用条件生成对抗网络进行医学图像配准。其中,生成器用来生成变换参数或者配准后的图像,判别器用于对配准图像进行鉴别。通常在生成器与判别器之间插入STN模块,以进行端到端训练。目前,基于GAN模型的医学图像配准有较多的应用,如前列腺MR图像与超声图像配准,以CycleGAN为基线模型的多模态视网膜图像、单模态MR图像配准,CT图像和MR图像配准等。在基于GAN的医学图像配准中,GAN模型或者起到正则化的作用,用来调节变形场及配准图像,或者用来进行图像转换,利用交叉域配准提高配准的性能。表1总结了典型的无监督配准模型和有监督配准模型。图4 无监督深度学习图像配准网络框架3.2 医学图像分割医学图像分割是计算机辅助诊断的关键步骤,是进行感兴趣区域定量分析的前提。随着深度学习在语义分割中的快速发展,将自然图像分割模型扩展到医学图像已成为主要趋势。在医学图像分割中,采用的主流网络框架有CNN、全卷积网络(full convolutional network,FCN)、U-Net、循环神经网络(recurrent neural network,RNN)和GAN模型。目前常用的医学图像分割模型包括2.5D CNN,即分别在横断面、失状面、冠状面上使用2D卷积进行分割,在节约计算成本的前提下,充分利用三维空间的邻域信息提高分割的准确度。FCN是深度学习语义分割的初始模型,通过全卷积神经网络和上采样操作,可以粗略地获得语义分割结果。为了提高分割细节,采用跳跃连接将低层的空间信息和高层的语义信息相结合,以提高图像分割的细腻度。FCN及其变体(如并行FCN、焦点FCN、多分支FCN、循环FCN等)已被广泛应用到各种医学图像分割任务中,且表现良好。U-Net是由一系列卷积和反卷积组成的编码和解码结构,通过跳跃连接实现高级语义特征和低级空间信息的融合,进而保证分割的准确度。U-Net及其变体(如Nested U-Net、V-Net、循环残差U-Net)在医学图像分割上取得了较好的分割结果,是目前医学图像分割的主流基线模型。RNN类分割模型主要考虑医学图像分割中切片和切片之间的上下文联系,进而将切片作为序列信息输入RNN及其变体中,从而实现准确分割。典型的模型有CW-RNN(clockwork RNN)和上下文LSTM模型,其通过抓取相邻切片的相互关系,锐化分割边缘。在此基础上, Chen J X等人提出双向上下文LSTM模型——BDC-LSTM,即在横断面双向、矢状面双向和冠状面双向上学习上下文关系,其结果比采用多尺度分割的金字塔LSTM模型要好。基于GAN的分割的主要思想是生成器被用来生成初始分割结果,判别器被用来细化分割结果。一般在分割网络中,生成器常采用FCN或者U-Net网络框架,判别器为常见的分类网络结构,如ResNet、VGG等。基于GAN的医学图像分割已经被应用到多个器官和组织的医学图像分割任务中。表2为常见医学图像分割模型所用的数据集以及其分割性能对比。4 医学图像分类及识别4.1 医学图像分类医学图像分类和识别是计算机辅助诊断(computer-aided diagnosis,CAD)的最终目标。在深度学习出现前,常采用人工定义的图像特征(如图像的纹理、形状、图像的灰度直方图等),经过特征选择后,再基于机器学习模型(如支持向量机、逻辑回归、随机森林等)进行分类。典型代表为影像组学方法,其在肿瘤的分型分期、治疗的预后预测方面取得了很多重要的成果。然而,人工定义特征以及特征选择方式很大程度上影响了分类的可靠性和鲁棒性。近年来,深度学习模型的飞速发展,尤其是CNN的广泛应用,使得利用神经网络模型自动提取和选择特征并进行分类成为主流趋势。CNN模型的不同变体已经在基于医学影像的临床疾病诊断中得到了广泛的应用,例如基于Kaggle公司的眼底图像公开数据集,Shanthi T等人使用改进的AlexNet进行糖尿病视网膜病变的分类,其精度可以达到96.6%左右;基于VG G,利用胸片进行肺结节的良恶性分类,其精度可高达99%。目前,在常见的CNN变体中,ResNet和VGG在医学影像分类中的表现最好,因此大多数的肿瘤检测、脑神经系统疾病分类、心血管疾病检测等将这两种模型作为基线模型进行研究。与自然图像数据相比,医学图像数据中满足模型训练需求的数据较少。因此,为了提高临床影像智能诊断的准确性,通过知识迁移来训练医学图像分类模型已成为主流。常见的知识迁移包含自然图像到医学图像的迁移、基于临床知识的指导迁移。在自然图像到医学图像的迁移中,主要有两种方式:一种是固定利用自然图像训练的网络模型的卷积层参数,利用该参数提取医学影像特征,然后利用该特征结合传统的机器学习方法进行分类;另一种是将自然图像训练的网络模型参数作为医学图像训练模型的初始化参数,通过微调来实现医学图像分类。除了自然图像到医学图像的迁移,还可以利用其他医学图像数据集,采用多任务学习的方式进行数据信息共享,弥补数据不足带来的分类缺陷。基于临床知识的指导迁移将临床医生诊断的经验(如医生的经验学习方式、影像诊断方式以及诊断关注的图像区域和特征等)融入模型,根据临床医生诊断的经验,即先掌握简单的疾病影像诊断,再进行复杂疾病诊断,研究者们提出了“课程学习”模型,将图像分类任务从易到难进行划分,模型训练先学习简单的图像分类任务,再学习较难的分类任务。基于该方式的学习可以提高分类的准确度。基于医生诊断的方式(如迅速浏览全部医学图像,再选择某些切片进行诊断),研究者提出基于全局和局部的分类模型,其在胸片和皮肤疾病的诊断上取得了较好的效果。基于诊断时关注的影像区域,带有注意力机制的分类模型被提出,典型的代表有AGCNN(attention-based CNN for glaucoma detection)、LACNN(lesion aware CNN)和ABN(attention branch network),通过引入注意力,网络可以关注某些区域,从而提高分类的精度。此外,根据医生诊断用到的经验特征,如肿瘤的形状、大小、边界等信息,将人工定义的特征与深度模型提取的特征进行融合,提高医学图像的分类精度,也是一种趋势。如Majtner T等人将人工特征分类结果与深度学习分类结果进行融合,提高了皮肤癌分类的准确度;Chai Y D等人将人工特征和深度学习特征进行融合并训练分类器,从而实现青光眼图像的分类;Xie Y T等人将人工提取的特征图像块与深度学习图像块同时作为ResNet模型的输入,实现肺结节的准确分类。如何将深度学习特征与传统人工特征进行有效的融合,是该类模型设计的难点。4.2 医学图像目标识别医学图像目标识别也属于临床诊断的一种,即在一幅图像中标记出可能病变的区域,并对其进行分类,如图5所示。图5 医学图像目标识别示意图传统的人工标记识别费时费力。最初将深度学习模型应用于目标识别时,主要是将图像分成小块,逐块输入由CNN等组成的二分类模型中,判断其是否属于目标区域。随着深度学习模型在目标检测领域的快速发展,尤其是Fast R-CNN模型和Mask R-CNN模型的出现,将整幅医学图像输入模型,即可一次找到所有可能的目标区域。但是在这两类模型中均存在一个区域建议模块和一个分类模块,二者需要进行迭代更新,模型的速度并不能满足临床的实时性要求。YOLO(you only look once)和SSD(single shot multibox detector)模型的问世解决了目标检测的实时性问题。基于此类模型,Lin T Y等人提出RetinaNet模型,并将其扩展应用到病理图像和钼靶图像乳腺肿瘤识别、CT图像的肺结节检测中。上述模型均针对2D图像进行目标检测,忽略了3D图像中切片和切片之间的空间信息。为了提高识别的准确度,基于RNN和LSTM的识别模型被应用到医学图像中。此外,在医学图像目标识别中,同样存在数据不充足的问题。为了解决这个问题,基于迁移学习的医学图像识别逐渐开展起来,如基于ImageNet数据进行模型迁移,实现肺结节、乳腺癌和结直肠息肉的检测。同时,基于临床经验知识指导的迁移学习也被应用到医学图像的目标检测中。典型代表有AGCL模型,其基于注意力的课程学习,实现胸片中的肿瘤检测;CASED (curriculum adaptive sampling for extreme data imbalance)模型,其可检测CT图像中的肺结节;特征金字塔模型(feature pyramid network,FPN),其采用不同对比度的图像,利用多尺度注意力模型实现肿瘤检测。图像分类和图像目标识别是医学影像临床诊断的最终目标,是目前人工智能技术与临床紧密结合的研究方向。笔者仅对分类识别的几种情况进行了阐述,以便掌握其发展方向。表3给出了肿瘤分类中常用的医学图像数据集以及深度学习模型,并对比了其分类性能。5 结束语本文从医学图像数据产生、医学图像预处理,以及医学图像识别和分类等方面,阐述了深度学习模型在医学图像分析领域的应用现状。尽管深度学习模型(如CNN、LSTM、GAN、注意力机制、图模型、迁移学习等)在医学图像分析中已取得众多突破,然而将深度学习应用于临床,辅助临床进行精准诊断和个性化治疗仍受到以下几方面的限制。首先,现有的深度学习模型对影像数目和质量有较高的要求,而临床上带有标记的医学影像数据难以获取,且目前临床诊断预测常使用的方法是有监督学习,数据的不充足势必会影响预测的准确性和稳定性。因此,如何在只有少量有标签数据的情况下,采用弱监督、迁移学习以及多任务学习的思想,提高分类预测的准确度,将是持续的研究热点。其次,临床应用对可解释性要求较高,而目前深度学习模型所学习的特征无法进行有效的解释。尽管现阶段已有研究学者提出采用可视化以及一些参数分析来对模型和结果进行解释,但是与临床需求中要求的形成可解释的影像学标记还有一定的距离。因此,研究深度学习模型的可解释方法将是医学图像领域的研究热点。最后,如何提高模型预测的鲁棒性是待解决的难点。现有深度学习模型多数仅针对单一数据集效果较好,无法在不训练的情况下,较好地预测其他数据集。而医学影像由于采集参数、采集设备、采集时间等因素的不同,相同疾病的图像表现可能大不相同,这导致现有模型的鲁棒性和泛化性较差。如何结合脑认知思想改进模型结构以及训练方式,提高深度学习模型的泛化能力,也是医学图像应用领域中待研究的关键问题。作者简介王丽会(1982-),女,博士,贵州大学计算机科学与技术学院、贵州省智能医学影像分析与精准诊断重点实验室副教授,主要研究方向为医学成像、机器学习与深度学习、医学图像处理、计算机视觉 。秦永彬(1980-),男,博士,贵州大学计算机科学与技术学院、贵州省智能医学影像分析与精准诊断重点实验室教授,主要研究方向为大数据治理与应用、文本计算与认知智能。联系我们:Tel:010-81055448010-81055490010-81055534E-mail:bdr@bjxintong.com.cn

弟为盗跖

人工智能在医学成像中的应用简介

定义:人工智能:人工智能是计算机科学的一个分支,强调使机器像人一样行动,使其变得智能。数据科学、机器学习、深度学习、计算机视觉、自然语言处理等领域是人工智能的子集。医学成像:医学成像是指为了诊断、医疗状况或监测某一部位而对人体进行观察的不同类型的技术。不同类型的医学成像有CT扫描、X射线、MRI等。医学影像对于医院中各种类型的严重疾病的诊断和监控至关重要。医学成像是对人体各个部位和组织的成像。例如,如果一个人被诊断出肺部有问题,则使用X射线来监测肺部,这将给出肺部可能受到影响的部分。如果图像不够清晰,就无法得出任何结论,我们可以使用CT扫描来更好地查看肺部。每年,医院都会生成大量的图像数据。这些图像可用于实现深度卷积神经网络,从而有助于在图像中找到不同的模式。人工智能将有助于分析这些图像,并将进一步帮助诊断,为医生做出挽救生命的决策提供工具。基于AI的医学成像如何有助于您制定决策?基于人工智能的医学成像依赖于不同医院的图像。这些图像被用来训练不同的算法,以发现不同的模式,然后对其进一步分析,以发现异常。这些分析和模式识别将有助于放射科医师或医生对疾病进行快速诊断和及时治疗。人工智能驱动技术的预测能力有助于在恶性组织或癌细胞变得致命之前对其进行检测。正在使用基于人工智能的医学成像技术的领域乳房成像:人工智能帮助放射科医生诊断乳房异常并检测癌细胞或组织。像QuantX (Quantitative Insights)这样的计算机辅助诊断(CADx)软件使用基于深度学习的工具,通过磁共振成像(MRI)来评估和表征乳房异常。在deep AI (iCAD inc.)等项目中,诸如数字乳房断层成像(DBT)或3D乳房X线照相术等成像技术一直在帮助放射科医生做出诊断。心血管成像:人工智能有助于检测和识别病人可能的中风。诸如ContaCT(Viz.ai)之类的基于AI的技术会分析计算机断层扫描(CT)图像中的潜在中风。它使用深度学习来识别扫描中的大血管闭塞(LVO)。通过机器学习和训练过的模型,Artery的Cardiac MRI 有助于实现复杂心脏分析的自动化。肺部成像:另一个受益于人工智能的领域是肺部成像。基于人工智能的系统使用医学图像,可以有效评估肺部,以检测潜在的肺癌。基于人工智能的我国创业公司,Infervision开发了一种名为智能CT筛查解决方案(AI — CT)的技术,可以成功地在CT扫描中发现可疑的肺癌病变。其他领域:人工智能已经成功地应用于其他领域,如大脑成像或神经成像,可以检测出潜在的脑损伤或肿瘤。OsteoDetect是一种利用机器学习技术分析腕部X光片(x射线)以识别突出桡骨远端骨折的软件。Idx-DR计算机辅助诊断(CADx)软件程序可分析眼睛的图像,以发现糖尿病性视网膜病变的征兆,而糖尿病性视网膜病变是糖尿病患者视力丧失的最常见原因。

回东之齐

陈根:人工智能渗透医学成像,或将预测癌症复发风险

文/陈根中医诊断,讲究望闻问切,其中“望”首当其冲。作为诊断的第一步,医生对病人的神、色、形、态、舌象等进行观察,初步大致判断病变情况。事实上,现代医学在诊断方法上有着异曲同工之妙,只不过“望”的手段更数据化,“望”的结果也更精准,人工智能的长足发展更是将医疗影像的“望”更上了一层楼。人工智能正在对医学成像领域深度渗透,这已是业内共识。2019WAIC世界人工智能大会上,中国工程院院士范云鹤表示,在甲状腺癌识诊上,医生的平均阅片时间为45分钟、准确率为74.46%,而人工智能的平均阅片时间1分36秒、准确率90%。而人工智能在医学成像领域的研究还不止步于此,近期,在国际期刊《自然》的子刊上,发表了一项英国TRACERx肺癌研究计划的成果:科学家们利用人工智能手段,绘制了肺腺癌中免疫细胞的空间位置图谱,可以根据免疫细胞浸润出的“冷区”和“热区”,预测患者的癌症复发风险。这个最新的人工智能阅片,把100例患者的多区域外显子组和RNA测序(RNA-seq)数据,与免疫细胞分布的空间组织学信息进行了整合,成功经受了970例肺腺癌患者的队列验证。这项研究为临床区分复发高危的癌症患者提供了全新的手段,也为分析癌细胞的免疫逃逸提供了新视角,不过研究团队也表示,这项技术还处于早期阶段,临床应用还需要时日,但这也给我们看到了人工智能应用于医学影像的更多可能。

是无内也

我国生物医学成像领域大科学工程项目实现主体结构封顶

新华社北京12月26日电(记者魏梦佳、田晨旭)记者从北京大学获悉,由北大作为法人单位建设的“十三五”国家重大科技基础设施——多模态跨尺度生物医学成像设施项目26日在北京怀柔科学城实现主体结构封顶。据悉,该成像设施是《国家重大科技基础设施建设“十三五”规划》确定的10个优先建设项目之一,也是北大历史上最大的单体建设项目。这一生物医学成像领域的大科学工程项目,未来将对生命体结构与功能进行跨尺度可视化描绘与精确测量,以期破解生命与疾病的奥秘。北大方面介绍,成像设施建设地点位于北京怀柔科学城的核心区,项目总投资超过17亿元,新建建筑面积7.2万平方米,建设周期为5年。建设内容主要包括多模态医学成像装置、多模态活体细胞成像装置、多模态高分辨分子成像装置、全尺度图像数据整合系统等。成像设施在科研、医疗、教育和产业等方面具有广泛需求。在要求“看得见、看得清、看得早”的重大生物医学问题的研究中,多模态跨尺度成像技术具有重要作用。成像设施建设将聚集相关领域优秀团队,进行自主的工程化设计和自动化改造,建立完备的核心成像设施,形成跨尺度、多模态、自动化和高通量的生物医学成像全功能研究平台,以期成为世界一流的生物医学成像设施。北京大学分子医学研究所教授、成像设施首席科学家程和平院士认为,成像设施建成后将推动我国在脑科学与认知科学、神经系统疾病、心脑血管疾病、生殖与发育、干细胞与再生、肿瘤的精准诊断等生命科学领域研究的实施,将对我国生物医学成像的研发起到积极带动作用。(完)

恐龙王

医学成像光谱技术突破 可快速诊断肺癌

核磁共振、CT、B超,这些医学成像技术是现代医疗体系常用的临床检测技术。但是随着生命科学和医学的研究逐渐深入,只能显示生物器官组织图像的成像技术已经跟不上当前的研究进展。如何对生物细胞与分子进行清晰成像是临床医学和影像学的研究热点,医学成像光谱技术就因此而诞生。成像光谱技术起源于遥感领域,是光谱分析技术和光学成像技术的结合,广泛应用于地质、农林、水文、大气等领域。当成像光谱技术运用于生物组织样本的检测时,既可以获得样本的生化组分信息,又能够得到样本的二维空间图像,从而分析生物组织的生理和病理变化,实现疾病的早期诊断。目前临床应用的医学成像光谱技术叫做荧光高光谱成像(FHSI),它可以在光谱上区分颜色,标记并跟踪目标分子,然后生成彩色图像。但是它也存在局限,例如不一定能显示全彩的光谱。而且荧光高光谱成像技术在分析过程中需要耗费大量时间收集和处理数据,导致患者无法及时拿到检测结果。近日,美国南加州大学的研究人员在《自然-通讯》上发表了医学成像光谱技术的最新研究成果——光谱编码增强成像技术(SEER),可以解决荧光高光谱成像技术的不足,有效提高检测速度和准确率。研究人员表示该技术的工作速度与荧光高光谱成像相比提高了66倍,而准确率也提高了1.7倍。而这意味着患者可以更及时地得到诊断。光谱编码增强成像技术的突破在于数据处理与分析的算法的进步,得益于大数据的发展,新的算法能够以更少的计算机内存更快地从光谱图像中提取有用信息,获取更多细节。癌症检测是高光谱成像技术的主要应用之一。患者组织结构在细胞和亚细胞水平上的变化可以作为癌症早期诊断的重要标识,而医学成像光谱技术可以很好地捕捉到这一变化。因此光谱编码增强成像技术的实际应用也将从癌症检测开始。研究团队与洛杉矶儿童医院达合作,光谱编码增强成像技术将用于检测患者的早期肺癌和污染物造成的潜在损害。此外,生命科学领域的研究者已经在他们的实验室中使用光谱编码增强成像技术。这项研究的主要作者表示,光谱编码增强成像技术的应用前景广阔,他希望可以将其整合为一款多功能的手机APP,在食品安全、假币检测等方面发挥作用。虽然近几年已经有不少在手机上增加光谱仪模块实现光谱检测功能的研究,但以光谱编码增强成像技术核心开发出手机APP依然是一件很困难的事情。如果有一天真的实现,那么在食品安全、假币检测之外,我们也许可以在家给自己做一个光谱成像,而那个时候,远程医疗大概也就可以实现了。

老油坊

我国生物医学成像领域大科学工程项目在京启动

新华社北京6月29日电(记者魏梦佳)由北京大学作为法人单位建设的“十三五”国家重大科技基础设施——多模态跨尺度生物医学成像设施(以下简称成像设施)项目29日在北京市怀柔区正式启动。据悉,这一生物医学成像领域的大科学工程项目,未来将对生命体结构与功能进行跨尺度可视化描绘与精确测量,以期破解生命与疾病的奥秘。该成像设施是《国家重大科技基础设施建设“十三五”规划》确定的10个优先建设项目之一,也是北大历史上最大的单体建设项目。记者从北大获悉,成像设施建设地点位于怀柔科学城的核心区,项目总投资超过17亿元,新建建筑面积7.2万平方米,建设周期为5年。建设内容主要包括多模态医学成像装置、多模态活体细胞成像装置、多模态高分辨分子成像装置、全尺度图像数据整合系统等。成像设施在科研、医疗、教育和产业等方面具有广泛需求。在要求“看得见、看得清、看得早”的重大生物医学问题的研究中,多模态跨尺度成像技术的重要性不可替代。成像设施建设将聚集相关领域优秀团队,进行自主的工程化设计和自动化改造,建立完备的核心成像设施,形成跨尺度、多模态、自动化和高通量的生物医学成像全功能研究平台,以期成为世界一流的生物医学成像设施。在项目启动仪式上,北京大学分子医学所教授、成像设施首席科学家程和平院士表示,成像设施建成后,将成为国际上成像模态融合程度最高、可视化解析能力最全面的全尺度成像系统之一,未来可提供大脑结构与功能成像、神经网络成像、心脑血管造影、组织成像、模式动物活体成像、活细胞/亚细胞结构与功能成像、生物大分子结构解析等多项研究手段。“成像设施的建成,将推动我国在脑科学与认知科学、神经系统疾病、心脑血管疾病、生殖与发育、干细胞与再生、肿瘤的精准诊断等生命科学领域重大研究的实施,为全国生物医学成像平台培训和输出高水平专业技术人才,也将对我国生物医学成像研发起到示范带动作用。”程和平说。北京大学党委书记邱水平表示,大科学设施是现代前沿科学研究取得重要突破的必要条件。北大建设的成像设施,对我国重大科技基础设施水平的提高,以及我国科学及教育事业的发展都具有重要意义。(完)

杨蓓

医学影像AI:全球市场展望

凭借其提高的生产力和准确性以及更加个性化的体验,AI正在彻底改变医学成像。据Signify Research称,到2023年,全球医学影像人工智能市场,包括自动检测,量化,决策支持和诊断软件,将达到20亿美元。全球医学图像分析软件的收入预测(Signify Research)医学成像处理中使用的AI技术包括深度学习,机器学习,AR,数据挖掘等。这些技术能够实现疾病筛查,疾病诊断,医学外科等方面的一系列目标。AI激活医学图像处理:医学图像处理本质上是计算机视觉技术的应用。机器学习和深度学习等AI技术被用于计算机视觉技术处理的成像数据的智能分析,如成像配准和融合; 并可以协助医生进行医学图像标记,疾病诊断和手术。医学图像与其他类型的数据集成以供分析:如果在AI算法的训练中将医学成像数据与患者的身体体征,病史,遗传信息,身份信息和其他非图像数据相结合,这可以帮助机器分析更高维度的数据并提取最基本的特征。探索疾病背后隐含的相关性可以帮助医生更准确地诊断疾病。深度学习在疾病诊断中超越机器学习:传统的计算机辅助诊断(CAD)方法主要基于机器学习或专家系统,并且因机械运行或无益而受到批评。然而,深度学习算法已被证明更有效,并且可以更全面地处理医学数据,提取有用信息并输出疾病的关键点,从而使医生免于耗时的临床工作。医学成像使用情景中的AI在处理医学成像数据时,AI具有优势,因为CNN和RNN可自发地适应图像处理。在医院和其他医疗机构,如独立成像中心和体检中心,医学成像处理已成为人工智能最重要的实际应用之一。下表排除了没有医学成像数据的情景,例如医学纯文本处理。它也省略了生物电,其中图像处理技术与通用计算机视觉技术截然不同。谷歌--LYNA: 谷歌的LYmph节点助手(LYNA)深度学习计划可以训练乳腺癌患者的病理幻灯片,以准确检测乳腺癌的传播。该算法可以区分载玻片与转移性疾病,并确定每张幻灯片中的癌症部位和其他可疑区域。与LYNA相比,病理学家检查幻灯片所需的平均时间仅为一分钟,而没有助手则需要两分钟。ImmersiveTouch--ImmersiveView:这是一套集成的VR实时解决方案,用于优化个性化的手术计划,患者参与和手术教学。ImmersiveView套件将CT和MR图像转换为直观,准确,高分辨率的VR模型,允许医生操纵和探索患者的VR模型,以评估手术选项并为手术做好准备。直观的手术--达芬奇系统:达芬奇系统包括一个控制台和一个包含腹腔镜的病人侧推车,腹腔镜是一个细管,在终端设有微型摄像头和光源。它的设计允许外科医生靠近控制台操作并移动摄像头,摄像头将图像发送到显示器以指导外科医生。医学影像中AI的趋势和局限性人工智能技术受到医学影像市场的欢迎,因为它可以降低效率低下并节省医生的时间,但也有一些因素限制了AI在医学影像中的实际应用。例如,大量医学成像数据分散在不同的医院,独立的成像中心和研究机构中,这使得难以有效地组装和利用医学成像数据。AI的快速改进继续推动医学成像技术的开发和部署。除疾病诊断外,AI还可用于分子/细胞水平的图像处理和介入成像,协助非手术诊断和治疗。预计监管机构和行业协会将合作组建医学影像专家团队,为行业建立算法模型评估标准。https://syncedreview.com/2019/04/27/ai-in-medical-imaging-global-market-outlook/

息息相通

前瞻研究:医学影像中人工智能技术应用现状及展望|智周核心版

通过深度学习、机器学习等人工智能技术,能够对医学影像进行无监督或者半监督的自动化分析,提升医学影像临床诊断效率,深入发掘影像数据中潜藏的医疗与科研价值。医疗行对医学影赛道像诊断的准确度与诊断效率要求在日益增长,传统医学影像科室无法满足国内日益增长的患者需求,由于硬件算业力和算法模型的飞速发展,医学影像中人工智能技术的应用成为必然趋势。人工智能技术对医学影像系统智能化升级体现在:医学影像软件系统诊断及分析功能的升级、医学影像成像设备的升级、助力医学科研工作等方面。自2016年以来,大量初创公司和行业巨头开始加速探索人工智能技术在医学影像领域的商业化应用,医学影像人工智能成为热门投资。作者 | 付海天、田辰一、全球及中国医学影像市场规模据Zion Market Research测算,全球影像诊断市场在2016-2021年年复合增长率(CAGR)约为6.0%,预计在2021年市场规模将达335亿美元。据Signify Research报告显示,全球人工智能医学影像市场有望将在2023年达到20亿美元规模。海通证券等多家机构预测,到2020年国内医学影像市场规模将达6000-8000亿元。据机器之心数据统计,2016年中国医学影像相关企业(包含医学影像业务的通用型人工智能公司)累计融资额约63亿人民币,之后呈现快速增长趋势,2018年融资额度创历史新高,高达约300亿人民币,企业产品创新研发投入持续加码,诊断产品覆盖病种达近百种。中国医学影像相关产品/解决方案服务商年度融资额二、人工智能技术对医学影像行业的影响医学影像数据感知及分析:医学影像的处理本质上就是计算机视觉技术在医疗行业的应用,涉及医学图像分割、图像配准、图像融合、图像压缩、图像重建等多个领域。人工智能的作用主要体现在对于经过一定计算机视觉技术处理后的图像数据进行进一步的智能化分析,辅助医生进行标注、诊断或者手术工作。医学影像数据与其他类型数据融合处理及分析:医学影像能够展现患者身体特定部位的结构特征和代谢情况,具有大量图像数据信息供计算机进行分析,如果将医学影像数据结合患者的生理体征、病史、基因信息、身份信息等非图像数据,通过人工智能算法模型进行训练和应用,则能够帮助计算机从更高维度来分析数据和提取重要特征,更加全面展现疾病背后的隐含关联因素,辅助医生对疾病状况进行更精准的分析诊断。影像数据挖掘加速医疗科研过程:医学影像数据挖掘指从存放在数据库或其他信息库中的大量影像数据中挖掘有价值信息的过程,其目的是寻找影像数据背后的关联和模式。计算机辅助诊断(CAD)系统的原始处理对象为医学影像信息数据库 , 对影像信息进行数据挖掘和知识发现, 能够发现其中的诊断规则和模式,加速医疗科研过程。三、人工智能技术在医学影像中的应用分布四、医学影像中人工智能技术落地案例简述腾讯觅影:腾讯觅影利用腾讯优图在大数据、图像识别与深度学习方面的技术,对早期肺癌的敏感度(识别正确率)达到 85% 以上,在良性肺结核的特异性(识别正确率)超过 84%,对于直径大于 3mm 小于 10mm 的微小结节检出率超过 95%。博为软件:博为肝脏三维手术规划系统解决了肝脏切除手术方案设计困难问题,通过对原始的CT数据进行后处理重建为三维立体图像,精准肝脏分割与分段,自动提取肿瘤病脏,直观地展示肝脏肿瘤、肝段、肝脏内部复杂的管道解剖结构,对病例进行量化分析,并自动生成临床脏器定量分析报告。Curexo:由美国 Curexo 公司制造的Robodoc主要用于膝关节和髋关节置换手术。RoboDoc 包括两部分:手术规划软件和手术助手,分别完成 3D 可视化的术前手术规划、模拟和高精度手术辅助操作。RoboDoc机器人采用了四轴直角坐标工业机器人本体,使用患者股骨上插入的钛金属定位针来实现机器人与患者骨骼的相对定位,精度达到了0.1mm。RoboDoc主要用于关节置换术中辅助骨骼和假体的成形、定位和植入,可提高全膝(髋)置换手术的质量。深思考:基于宫颈细胞学领域知识,通过深度学习、机器学习、医学图像处理等技术提取宫颈细胞的关键特征,自动分割团簇重叠细胞,快速识别涂片上病变细胞的分级类别,实现宫颈细胞涂片的辅助阅片。深思考人工智能辅助阅片机器人可在100秒内完成单张涂片的阅片,适配国内多种制片方法,其中鳞状上皮细胞异常敏感性约为98.4%,特异性约99.77%,腺细胞异常敏感性约为93.4%,特异性接近90%。五、医学影像领域人工智能技术发展所遇瓶颈1. 影像数据分散在各个机构:影像数据是训练影像智能诊断算法模型所需的核心资源,但大量的影像数据分散在各个医院、影像中心、研究机构,不易被高效整合利用。2. 影像训练数据集标注结果存在主观差异:不同医生对图像的理解存在主观差异性,造成标注结果的不确定性,导致影像训练数据集的标注结果受到主观因素的影响。3. 人工智能算法模型适用的影像类型有待拓展:目前人工智能影像诊断主要集中在X光、CT、病理领域,而在超声、MRI、PET、红外等影像领域应用较少。六、医学影像领域人工智能技术发展的未来趋势1. 医学影像技术进一步发展:医学影像系统中成像设备技术升级、影像设备图像处理算力增加、智能诊断软件集成病种增多、影像数据融合应用、迁移学习加速影像诊断模型训练。2. 人工智能在医学影像应用领域不断拓宽:除疾病的鉴别诊断外,还可应用于分子及细胞层面图像处理、应用于介入影像学、助力非外科手术方法诊断及治疗等。3. 医学影像产业升级:区域影像数据中心建设促进区域级别影像数据流转及应用,医学影像专家团队开发模型评估体系与统一标准作为产业界产品标准等。* 本文为「智周」系列报告「核心版」,相应「深度版」的推出计划将在后续公布,敬请大家关注。针对「医学影像中人工智能应用现状及展望」这一主题,有哪些方向或主题,你希望在报告深度版中读到更详细的阐述与分析,欢迎留言,这将成为我们制作报告深度版的重要参考。

哈菲兹

中国科大在生物医学光声成像研究中获进展

近日,中国科学技术大学精密机械与精密仪器系、安徽省精密科学仪器实验室研究员田超课题组,在基于光声成像的无创前哨淋巴结示踪、光声成像质量提升和三维光声成像研究方面取得进展,相关研究成果发表在IEEE Transactions on Biomedical Engineering、Physical Review Applied和Journal of Biophotonics上。前哨淋巴结活检是目前乳腺癌分期的标准方法,其包括术前淋巴结示踪和术中图像引导的淋巴结活检。然而,现有的成像技术存在诸多局限性,如电离辐射、成本高、成像深度差等。为了应对临床挑战,该研究提出一种造影剂增强的光声成像方法,使用碳纳米微粒作为造影剂可以无创、无放射性地示踪前哨淋巴结并引导细针穿刺活检。研究以活体大鼠为对象,碳纳米微粒通过皮下注射注入前爪并染色前哨淋巴结。在大鼠腋窝区同时进行光声和超声双模实时成像,示踪前哨淋巴结并引导穿刺活检。下图展示了整个研究流程。实验结果表明,光声可以高分辨率、高信噪比地对淋巴官、淋巴结、针头等进行成像和显示,可以为淋巴结活检提供了高质量的图像引导。此外,通过光谱分析发现,碳纳米微粒在光学吸收系数、光漂白性和光声转换效率方面比吲哚菁绿、亚甲基蓝等其他造影剂更优,是光声成像识别前哨淋巴结和图像引导活检的优良示踪剂。该研究为在体前哨淋巴结示踪和图像引导的细针穿刺活检提供了一种实用的方法,为光声的临床转化起到推动作用。论文的第一作者为中国科大博士生刘松德,通讯作者为田超。研究工作得到国家自然科学基金委、中科院、安徽省和中国科大的支持。论文链接:1、2、3 基于碳纳米微粒的光声前哨淋巴结示踪和图像引导的细针穿刺活检。(a)通过前爪注射造影剂着色前哨淋巴结。(b)前哨淋巴结的光声和超声双模态实时成像原理、结果及组织学分析。来源:中科院

鲂鳢

Facebook研究帮助加快医学成像速度

来源:金融界网站金融界美股讯 据CNBC消息,当纽约大学的医生有了一个加快核磁共振扫描过程的想法时,他们想到了一家技术公司来帮助他们: Facebook。这两家机构本周宣布,他们正在合作开展一项研究项目,旨在使核磁共振成像扫描速度提高10倍。今天,核磁共振成像大约需要15分钟到1小时,而X射线或CT扫描不到1分钟。这对病人不好,因为他们不得不坐在机器里一动不动,暴露在潜在有害的辐射下。这是一项雄心勃勃的努力,可能对双方都有巨大的回报,同时降低医疗成本并改善患者体验。是双赢的。但为什么选择Facebook呢?我是这样想的:解决世界性的大问题有助于留住人才。Facebook和其他大型科技公司一样,有能力为其工程团队配备其他公司无法负担的机器学习专家。但是这些人可能想做的不仅仅是帮助优化互动,最大限度地增加广告收入,他们还想解决一些难题,这些难题可能会帮助很多人,甚至有可能拯救生命。对于了解数据的公司来说,这是一个巨大的市场,拥有尚未开发的机会。医疗健康市场价值约为3万亿美元,这些数据信息以前被困在在医院服务器中。现在它开始被用于研究,最终可能被用于商业产品。Facebook在图像方面有很多经验。由于Facebook长期致力于照片共享,它的员工队伍中有合适的专家组合来处理图像数据。我们能用我们的数据信任Facebook吗?对我们大多数人来说,医疗信息是一种特别敏感的数据。想象广告商或其他第三方未经同意使用这些信息是一个可怕的前景。Facebook和纽约大学在接受我的采访时都强调,该项目纯粹是为了研究,与财务目标无关。这些公司也在确保数据被取消识别,这样它就不会与特定的个人联系在一起。但是研究结束后会发生什么呢?如果这种方法奏效,那么纽约大学和其他机构很可能会想办法将这项新技术应用到临床护理中。 从长远来看,这可能是 Facebook 和其他科技公司的商机。 尽管 Facebook 可能会继续纯粹处于研究领域,因为它正在努力解决其他方面的隐私问题。Facebook不会是唯一一个将医疗保健带入数字时代的大型科技公司。 在这一点上,社会将不得不弄清楚我们能够多大程度上信任科技巨头,以及如何平衡隐私问题和它们所带来的进步效用。