影像研究与医学应用程序【研究生资讯】

上下囚杀

中科院田捷教授：基于 AI 和医疗大数据的影像组学研究及其临床应用丨CCF-GAIR 2018

2018 全球人工智能与机器人峰会（CCF-GAIR）于6月29日在深圳召开。本次大会共吸引超过2500余位 AI 业界人士参会，其中包含来自全球的 140 位在人工智能领域享有盛誉的演讲与圆桌嘉宾。在大会第二天的【计算机视觉专场】中，上午计算机视觉前沿与智能视频环节的演讲嘉宾有：ICCV 2011和CVPR 2022大会主席权龙教授、旷视科技首席科学家孙剑等人。下午环节为计算机视觉与医学影像分析，出席的嘉宾分别是包揽7大模式识别与医学影像Fellow的田捷教授，国际顶级医学影像分析大会MICCAI 2019 联合主席沈定刚教授，微软亚洲研究院副院长张益肇博士，飞利浦中国首席技术官王熙博士等。作为计算机视觉与医学影像分析环节的重量级嘉宾，本次大会，田捷教授向与会观众分享了题为“基于人工智能和医疗大数据的影像组学研究及其临床应用”的精彩专题报告。田捷教授现任中国科学院自动化所研究员、分子影像重点实验室主任。自2010年起，田捷教授连续获得计算机视觉与医学影像分析领域的7大Fellow：IEEE Fellow、IAMBE Fellow、SPIE Fellow、AIMBE Fellow、IAPR Fellow、OSA Fellow、ISMRM Fellow。同时也是两项国家重点基础研究发展计划（973计划）首席科学家。田捷教授认为，人工智能等技术给医学领域带来的改变是毋庸置疑的，并列举了几个医学常见案例进行辅证。在他看来，医疗大数据里最常见的是影像数据，而且影像数据格式标准，容易获取、容易使用。但是医疗大数据不仅限于影像，还包括病理、临床治疗信息等，只有这些信息融合在一起，我们才能建模，才能解决人工智能真正在医学上的应用。田捷教授在研究学术的同时，也在积极探索AI技术的应用前景。他认为，AI技术只有跟临床挂钩才有价值，经过企业家的转化才能变成生产力。现在我们需要更多人工智能和大数据在医疗问题上的典型应用，来拉动产业，拉动人工智能进一步深度应用。这是相辅相成的，空喊方法，不形成规模化、典型应用，是解决不了问题的。只有得到外科、内科大夫承认的技术和临床应用，才能更加有意义。与此同时，他还表示，人工智能在医学上应用一定要“医工交叉”，工科的人要穿上医学的马甲，了解医学的问题，参加医学的会，了解医生的需求；作为医生也要对工科的方法知其然，这样才能源于临床，高于临床，又回归临床。以下为田捷教授的现场演讲内容，雷锋网作了不改变原意的编辑及整理：我下面汇报的是人工智能和医疗大数据在医学上的应用，这是大家比较关注的热门话题，我想从“临床”和“商业”两个方面来做一下简要的归纳。人工智能在医学上的应用和传统中医非常相像。我国中医几千年以来，通过“望闻问切”的方式积累了几百万人甚至几千万人的医疗大数据，后期主要通过人脑来“加工”这些数据；现代社会与此前不同的是，我们使用电脑加人脑，利用此前积累的经验以及大数据与人工智能技术，实现了现在所说的智能医疗。人工智能目前是国家战略，健康中国2030也是国家战略。从这两个角度来说，通过人工智能技术和医疗大数据，提高人们的健康水平是国家下一步的重点发展战略；与此同时，国家也有计划要将我们的医疗和健康占GDP的比重从3%提升到30%。从商业角度出发，人工智能在医学上的应用机会很多，包括通过计算能力驱动肺癌、糖网、乳腺癌等疾病的筛查。今天，我想重点与大家分享的是人工智能对于临床医疗的重要性，它能提高我们的临床医疗水平，实现精准医疗，具体涉及到术前、术中、术后三个方面。从目前医学发展背景来看，人工智能、大数据等技术在医学上的应用是众势所趋。去年北美放射医学大会上给出描述：未来的影像中心就像飞机驾驶舱一样，是各种各样信息的综合体；而未来的医生则相当于飞行员，要处理各种各样的信息。这里还需重点阐述一个观点：如今很多声音表示，AI未来将要替代医生。在我看来，AI不会替代医生，只会更有效地辅助医生。而医生也不应惧怕新兴技术，而是积极地去利用它，使用它。当今，我们处于信息变革的时代，医学大数据也在不断的增长和积累，平均每73天，医学数据就会增长一倍。因此，基于医疗大数据的人工智能医疗必将辅助甚至改变传统的临床诊疗流程。国际影像战略策略研讨会副主席Donoso说了一句很经典的话，人工智能是否会完全替代影像科医生无法下定论，但我们肯定的是，那些使用人工智能技术的影像科医生，势必会代替那些不使用人工智能技术的医生。不跟随时代的发展，面临的就是残酷的淘汰，无论是北美放射年会，还是欧洲放射年会，都不断的在突出人工智能在影像学中的异军突起的作用。所以，未来的影像科医生，不仅仅要会看片子，还要从影像大数据中挖掘大量的潜在知识，学会利用人工智能技术，站在科技潮流的前端，不是惧怕新兴的人工智能技术，而是利用它，使用它，成为新时代下的影像信息学专家。上个月刚刚结束的美国临床肿瘤年会ASCO2018，该年会的参与者大多为内科大夫、肿瘤大夫，他们也提出，要将人工智能技术作为辅助新一代无创诊疗技术发展的重要工具。Dana-Farber癌症研究所首席研究员Geoffrey指出，无创的液体活检技术可以更加便捷的实现肺癌的早期检测和筛查，血液中游离DNA可以成功检测出早期肺癌。而随着这种无创检测手段的进步，医学数据不断积累，机器学习方法将有效提高检测精度、提高测试性能。此外，南加州大学生物科学学院院长在大会指出，在肿瘤疗效评估中，结合基于液体活检技术的基因蛋白组学和基于深度学习方法的智能影像评估可有效预测患者的预后生存。由此可见，无论是在癌症诊断还是治疗中，人工智能技术都是辅助新一代无创诊疗技术发展的重要工具。一、影像组学的本质那么，人工智能在医学领域到底如何应用，接下来我会举一些例子说明。举例之前，我们首先必须了解影像组学概念，其2012年就被提出，是由英文“组学+放射”组合出来的新词：“radiomics”，我们当年认为把它翻译成“放射组学”比较准确。当年为什么用了放射这样一个词汇？它是基于CT进行扫描的数据，然后在PET和超声上得到应用，所以我们认为将“radiomics”翻译成影像组学可能更为精准，它不仅仅融合了医学影像、基因、临床大数据，它也把组学的概念和组学的方法融合在一起。它的工作流程与医生日常读片完全是一模一样的方法，针对影像数据，提取特征，人工智能建模，然后再进行临床应用、辅助决策。这个流程也是一个标准的计算机视觉流程，也是标准的模式识别流程。但它相比医生的高能之处在于计算机看到了高维信息，可能看到了蛋白基因在宏观影像上的变化，这样的宝贵数据可以辅助医生提升临床诊断的正确性和准确性。需要注意的是，人工智能技术在医学上的研究、应用，不是写文章、不是谈概念、也不是纸上谈兵、更不仅仅是做筛查，而是要将技术与临床紧密结合，解决实际临床问题。二、典型临床应用下面我就从临床和技术两个方面谈一下人工智能在医学上的具体应用。首先我想谈谈人工智能在临床上的应用，在座各位很多都是技术人员，对于技术方法比较了解。其实我们在了解技术本身的同时，更需要了解技术到底能够解决什么问题，或者说目前医学需要解决什么问题。所以我先从问题为导向，观察临床上有何需求。在这里，我想举一个细分例子，围绕着临床应用的术前、术中、术后，来说明人工智能如何使得医学治疗更加精准。第一个例子是结直肠癌。外科大夫在为病患做手术之前都会为患者做一个辅助化疗，以控制癌症的发展，之后再为他进行手术。在这个过程中，一部分病患非常不幸，经过辅助化疗之后，他们病理上完全缓解，体内也没有癌细胞存在，但外科大夫无法凭借他的经验来肯定判断他们体内是否还有癌细胞潜藏，所以不得不还为这些病人开刀（实际上病患身上已经没有癌细胞存在）。从这来看，我们能否通过其他方式来准确判别病人的实际数据，让他们在外科大夫的经验无法准确判定、常规的影像磁共振无法精确判别时，能够非常肯定地判定病人的数据。通过人工智能分析，目前我们有90%的把握能把这些PCR缓解的病人挑选出来。换句话说，系统能够将经过辅助化疗以后，体内没有癌细胞的病人找出来。后期，这部分病人就可以免受开刀，只需密切观察随访即可。所以，它的临床意义非常大，人工智能未来不仅仅能够做筛查，更重要是，它能针对临床问题来开展工作。这是我们配合北京大学肿瘤医院放射科专家做的工作，这个结果已经发表在临床肿瘤研究的顶级杂志上。第二个例子还是结直肠癌。如果病患经过化疗之后并没有PCR缓解（占比70%左右），那么他们是需要进行手术的。开刀之后，医生需要对他们做淋巴清扫，以防止癌细胞转移。问题是：清扫完之后显示，70%的淋巴是假阳性。这里需要说明的是，假阳性结果与中国医生的开刀技术没有直接关系，美国大夫开刀假阳性也有70%左右。而这个问题也可以用人工智能技术解决。我们用人工智能技术处理500例临床病理、影像数据完整的结直肠癌患者数据，经过病理、影像，提取特征以后，在实测中，能把70%的淋巴假阳性降到30%，这是医学上非常巨大的进步。目前这项研究也发表在临床肿瘤的顶级杂志JCO上。需要指出的是，其第一作者只是一个硕士二年级的小女孩，所以我们在医学领域的研究并不需要多少临床经验，关键是先要找到临床问题，以问题为导向来解决它，并不是一味的低头专耕技术。第三个例子依旧是结直肠癌。刚才我已经讲了术前及术中，术前有没有病理学的缓解，术中要不要进行淋巴清扫。我们再来看术后，结直肠癌患者做了手术之后，外科大夫还可以给他做一个放化疗控制远端转移。这里又出现了一个问题，经过手术后的结直肠癌患者远端转移的概率只有20%，换句话说，有80%的患者花了钱，忍受了放化疗的痛苦，而去做在他身上也许不可能发生或者概率非常小的远端转移。就此，我们能否用人工智能技术把这些概率大的人挑选出来，再去做放化疗，控制他远端转移；而概率不大的人也就没必要做远端转移，后期观察即可。目前我们正在做相关的人工智能技术落地实验，希望这个概率可以提升更高，预测得更为精准。综上，我举了一个非常完整的例子，从术前、术中、术后来说明人工智能、影像组学、医疗大数据到底怎么改变我们的医学，改变我们的精准诊疗。刚才我所提到的都是手术方面的内容。那么，人工智能能否解决不用开刀也能解决的问题呢？也就是说，其能否既可以辅助外科大夫，也可以辅助内科大夫。我们知道，即使是美国著名医院的外科大夫得了肺癌，他也不知道该用什么样的靶向药，怎么预测他的生存期。而这个工作可以用人工智能、大数据来解决，我们针对500余例晚期EGFR突变靶向治疗患者多中心CT数据，利用LASSO-COX构建反映靶向治疗无进展生存期预测模型，实现对EGFR突变的晚期肺癌患者靶向治疗无进展生存期进行个性化的精准预测。如果后期发现他无进展，这时候我们就提醒他不要再用这个靶向药，价格昂贵不说，效果也不大。目前这项研究发表在CCR上，也是国内学者解决的重点医学工作。举例来说，系统可以对病患的鼻烟癌给出判断及生存期预测。针对临床指标对晚期鼻咽癌的放疗后预测精度低的现状，我们对118例晚期鼻咽癌T1和DCE MR图像做了超过3年时间的随访，并结合970个影像组学特征，和临床病理信息进行分析，在此有效预测该类患者的预后，准确度超临床指标的10%。再举一个例子，我国是肝癌大国，肝纤维化、肝硬化、肝癌是肝癌患者的病变三步曲。所以，对于肝癌患者的治疗，准确判断他们的肝纤维化非常重要。过去医生一般用超声诊断，但是超声的判断准确率只有百分之六七十左右。想要准确判断还需要做一个痛苦的工作：肝穿。用一根穿刺针穿到病患肝里面用病理学组织来确定到底有没有纤维化，从而决定用不用抗病毒的治疗方法。问题来了：能不能用人工智能技术来处理这些数据，不做肝穿也能达到跟它一样的病理学效果。针对这个问题，我们走访了12家医院，采取了600多份数据样本，用深度学习来提取它的特征，实测表明，在使用过程中，人工智能的预测结果与肝穿方法非常一致。换句话说，它能够代替以往的肝穿治疗方式，让病患不需忍受痛苦，用几张图片就能达到绝佳效果。三、影像组学新模态应用在后来的研究过程中，有相关医生提出，炎症会不会对结果产生影响。可以肯定地说，人工智能在对轻度炎症困扰上没有差别；对于重度炎症有一些差别，但是影响不大，准确率还是会远远高于人工判断。后来又有人提出，能否将该技术转化为一个软件，做商业化应用。后期验证过程中，我们发现无论是轻度肝硬化还是重度肝硬化，效果都比较鲁棒，适合医院临床应用。在这里我必须强调一点，人工智能在医学上的应用最好是以问题导向，有了问题再找方法，再去解决。我们可以源于临床，高于临床，这时候我们再商业化应用，医生们就不会抵触，他会主动来使用，因为可以很好地帮助他们辅助诊断。以上是从临床角度讲了人工智能在医学上的应用。接下来我再从技术角度来讲人工智能、模式识别、大数据在医学上应用的进展。四、影像组学的关键技术以肿瘤治疗为例来说。首先是肿瘤分割，一般可能需要医生先进行勾画，然后可以用机器学习的方法进行半自动或者全自动的分工，这些分割都可以提取相关的影像组学的特征，使得我们用人工智能的方法来建模分析。这一块的技术方法有很多，但是坦率说，哪种方法好，还得针对你遇到的问题。第二方面是特征描述，影像组学、人工智能并不是比人更加聪明，只不过医生读片时，人眼提取的信息永远是以形状为主的，以结构为主的。而从影像组学提取的特征，是强度、纹理、小波，最大值、标准方差、灰度矩阵这些特征，人眼是没法看的，同时人脑也难以加工。对于计算机来说，恰恰是它最为擅长的。所以在特征选择上，计算机选择的特征和人眼识别的特征形成了互补关系。如果我们能用计算机提取高维特征，包括毛刺、分叶等信息，再融合年龄、性别、家族史等信息，肯定是1+N>N，我们就能实现人机交互、计算机和人协同工作，从而使得我们的医学更为精准。选择特征的时候切记要多多益善，特别是把这些高维特征提取得越多越好。还有一个非常重要的点，为什么现在影像组学、人工智能热，就是这些高维特征含有基因蛋白这些微观信息，在这些宏观的影像上的体现，只不过过去人眼提取不了，但现在计算机提取了，把这些信息来进行系统加工，使得我们的预测更加精准提取特征之后，还有一项非常重要的工作是降维。共有四类主要特征降维方法：稀疏选择、空间映射、神经网络、递归排除。针对具体临床问题，业界还采用建立计算机定量影像特征与所研究临床研究问题标签之间的分类模型。主要运用了两类模型：SVM模型：从影像大数据原始像素出发，提取高维手工设计特征并进行特征选择，构建影像特征与临床问题的分类模型。CNN模型：在影像大数据的原始像素的基础上，该模型可自主挖掘与临床问题相关的影像组学特征，构建影像特征与临床问题的分类模型。至于建模部分，前面很多讲者也讲了很多模型，人工智能、深度学习有一系列的模型，无所谓哪种模型好，关键是针对你的问题，你是要做生存期预测，还是要做疗效评估，针对我们在医学上不同的使用的对象和问题，我们应该选择不同的方法。有了方法之后，我们构建的模型可以提高分类精度，甚至能达到主治医生的水平，大家已经看到了很多例子，我就不展开细说。但是这里面还有一个非常重要的环节，是我们做计算机、做工科最容易忽视的：我们往往把模型建出来，就直接把这些结果拿给医生去看，希望医生可以去使用。这时候，你一定会吃闭门羹，因为医生肯定会说这不是我需要的东西，你这些模型我看不懂，我根本没法用。所以后期非常重要的步骤就是：要让他们看图识字，要把这些数据可视化。你给医生们一大堆模型，他会觉得很难懂，换成图片之后，他就觉得非常好用，我们要从医生的角度看问题，把模型可视化。另外，计算机处理离不开数据，这些数据质量到底怎么样，我们也要从医生的观点来看待它。去年临床肿瘤学杂志上发表了一篇文章，是以荷兰大夫为主发表的，他在谈数据质量标准的评价，给出了16个评价标准，36分是满分，进行数据质量打分，而且他也会编程序，编一些简单的程序，把它放到网上，你直接填表打分，最后告诉你数据质量是怎么样的，我觉得目前也是对医学用人工智能判断，用影像组学第一个比较公开的数据标准，值得大家借鉴、参考。五、人工智能+医学影像的未来展望刚才我从技术方面谈了人工智能怎么针对医疗问题，用什么样的方法解决。涉及分割、特征提取、模型构建、模型可视化、质量控制5个环节。最后我想提一下人工智能在医学影像应用未来的发展方向，主要涉及到人工智能的方法、数据、软件、共享平台。我们现在不缺方法，也有很多数据，也有各种各样的软件，但是我缺乏交流共享的平台，我们这个会议也是一个交流共享的平台，我也建议我们相关企业在会后把相关的资源共享出来，这样可以更好地促进人工智能在医学领域的应用。我先从模型讲起，这几年人工智能的模型有很多，有卷积神经网络、迁移学习、博弈进化模型，数据也在不断地增多，智能程度也在不断地提高，所以我做了一个二维的方阵来说明这个问题。迁移学习经过大数据训练，我们可以在医学的小数据上提取到复杂的影像特征，而且这些特征还有很好的解释性。与此同时，我们所提取的高维特征又会带来一个挑战，临床医生表示看不懂且不知道有何意义。此时，我们无法对于医生的困惑做出解释，因为这是计算机分析出的结果，我们不能说它跟肝的哪个血管对应，跟肾的哪个细胞对应。但是我们也可以把这些特征，用强特征分布的热点图表达出来，它有一定的可视化，对这样的强特征的热点图，你去做穿刺或者靶向治疗的时候，穿刺效果就会非常好。与此同时，我们还可以用迁移学习的深度学习方法来提高肺癌基因突变预测的精度。迁移学习模型是经过128万张图片训练出来的，我们做肺癌的时候可能没有这么多图像，但是如果我们想要提高它的预测精度，我们用前面图像训练过的模型可能也会得到比较好的效果。另外，大家知道现在博弈进化模型比较热，它可以让机器学习提高智能程度，这在医学上的应用也非常重要。需要指出的是，我们用人工智能做组学分析，我们需要多病种、多模态、多中心、多参数的数据融合，在这一块，还有非常重要的点是数据标准，虽然我们国家这一块现在已经非常重视，做了一系列的筹备，但是目前为止还没有出来一个影像大数据的数据标准，或者数据规范化的行业标准，所以依然是一个挑战。目前，我们医院有大量的数据，大量的数据不代表就是大数据，我们需要经过数据清洗，影像的数据相对来说还比较规范一些，但是病理的信息、治疗的信息、预后的信息我们都需要有，才能使得人工智能做更准确的预测。所以在这里我也想说，前面我举的那些例子，淋巴清扫的工作，原来我们是想做生存期预测的，但生存期预测我们需要两年以上的病人随访，因此很多信息的提取还需要医疗从业人员去科普，需要让患者知道，我们做临床研究需要大量的信息才能做综合。幸运的是，我们国家人口多，病人多，所以数据也是我们的天然优势，这几年我们配合不同的医院采取的数据，包括儿童水果细胞瘤这样一种眼底的肿瘤，我们都能收集相关数据；肺癌、乳腺癌的数据量更大。这些数据不太牵涉到隐私，我们提取的都是高维信息，我们也不需要存原始图象，所以从某种意义上说这些数据的隐私性是比较好解决的。有了数据，我们还需要软件，我们可以开发各种各样的软件，特别是医学图象处理的软件，我们实验室有三个软件，第一个是MITK，是医学软件的集成平台，包含重建、分割可视化；还有一个是3D软件；另外我们还有一个影像组学的软件，全部是开源的，在我们的网站上可以下载。人工智能在医学上的应用一定要医工交叉，我们工科的人要穿上医学的马甲，了解医学的问题，参加医学的会，了解医生的需求，作为医生也要对工科的方法知其然，你也许不知其所以然，但是你要知其然，这样我们才能源于临床，高于临床，又回归临床，不只是看一个病，不只是一个软件。我就汇报到这里，敬请各位批评指正，谢谢大家。（完）观众提问：刚才您说了要从影像里面提取高维信息，并且说了要源于临床，最后还要回归临床，这些高维信息是由谁来提？是医生来提，还是我们工科的人来提？我还听说您那里面有的有400个高维信息，我看到有的文章好像更多，这些信息是怎么提出来的？田捷教授：这个问题提得非常好，也非常关键。如果用计算机去做，还是停留在结构特征上，我们能弥补一些医生的错误，但是不能辅助诊断。刚才举例子讲的这些高维信息，它到底有没有用，医生也不知道，我们也不知道，但是用计算机、深度学习把它提取之后，我们只能尝试，有些问题可能能很好地解决，有些问题现在还解决不了，我们只是提取这几百个甚至上千个特征，跟那些特征、病理信息融合在一起，我们再去筛选，把关键的信息提取出来，这是降维，最后再建模，然后取得一个好的结果。跟医生在交互的过程中，这些特征是人眼看不了的，医生也搞不清楚，我们拿这些特征去投稿的时候，大部分医生是看不懂的，我们投到医疗杂志上，他会问你这到底有什么效果，我们说不清楚，所以我们把那些东西变来变去，终于变成热力图的模式，最后说明这可能是肿瘤的中心地带，它能反映这样的问题，他能看懂了，知道这是有问题的，然后就接受了我们的论文。我们这些特征不仅仅说明它有用，还要想办法跟医生沟通，把这些特征变成可视化的，让医生能接受，说明它的临床意义。这也是一个痛苦的交互过程。观众提问：刚才我看到您的迁移学习的工作，把上百万张自然图像迁移到肝脏的医学图像上，但是我看到有文章说迁移学习必须要有医学的意义，如果您这样做的话，让自然图象迁移到医学图像上，它的临床意义在哪儿？医生会接受这样做吗？田捷教授：医生能不能接受，关键看临床效果，关键看你能不能针对临床解决问题。我没有去计算机视觉的会议，我现在反而是跑到美国临床肿瘤学会、美国肿瘤学会的会议上，你要到临床医生那里，让他们“折磨”你，找出他们能接受的临床效果和临床意义，这时候你的模型才真正起作用，我们老在计算机视觉会议上谈我的方法和参数好，我觉得意义不大，当然能写文章，只是把纸变成钱。所以我说我们技术人员要穿上医生的马甲，到医学的会议上交流。我是工科生，但近些年我没有发表一篇计算机方面的文章，都是医学的文章。这一点我非常自豪，我能在医学的杂志上发文章，就非常具有临床意义，因为审稿人都是医生，说明我已经穿上医生的马甲了。我认为，这是所有想在医学领域深耕的工科生都需要做出的转变，必须站在医生的角度去思考问题，让他们来当裁判，让他们来鉴别。雷锋网雷锋网

展开

大毒后

田捷：基于人工智能和医疗大数据的影像组学研究及其临床应用

不到现场，照样看最干货的学术报告！嗨，大家好。这里是学术报告专栏，读芯术小编不定期挑选并亲自跑会，为大家奉献科技领域最优秀的学术报告，为同学们记录报告干货，并想方设法搞到一手的PPT和现场视频——足够干货，足够新鲜！话不多说，快快看过来，希望这些优秀的青年学者、专家杰青的学术报告，能让您在业余时间的知识阅读更有价值。2018年9月22-23日，“2018中国医学人工智能大会暨第一届人工智能雁栖高端论坛”在中国科学院大学雁栖湖校区举行。本次大会由中国人工智能学会、中国图像图形学会、中科院计算所、中国科学院大学共同主办，关注人工智能领域的最新进展以及面临的挑战，重点讨论了人工智能在医学方面的前沿研究和产业化热点。此次会议极具产学研融合的特点，30多位来自信息科学（含计算机与电子工程等学科）、数学与医学等领域的专家学者与临床医生和产业界代表齐聚一堂，围绕人工智能+医疗、医学图像分析、机器学习等热点领域开展了历时两天的深入交流与探讨。读芯术作为合作媒体，经过授权，对其中部分专家报告进行内容整理。中国科学院分子影像重点实验室主任田捷研究员以《基于人工智能和医疗大数据的影像组学研究及其临床应用》为主题进行报告，以下为相关内容。田捷老师的PPT原文内容请后台回复“学术报告”，查阅文件夹“20180922 中国医学人工智能大会”。基于人工智能和医疗大数据的影像组学研究及其临床应用田捷中国科学院分子影像重点实验室主任研究员田捷研究员围绕“智慧医疗研究背景”，“智慧医疗研究方向”，“智慧医疗未来方向”三个重点展开。在智慧医疗研究背景方面，2017年7月20日，中共中央国务院办公厅印发《新一代人工智能发展规划》指出：研发人机协同临床智能诊疗方案，实现智能影像识别、病理分型和智能多学科会诊。在此基础上，“人工智能技术进步”与“医疗大数据不断积累”共同提供了智能医疗发展的有利时机。在智慧医疗研究方向方面，主要阐述了“肿瘤术中影像导航”与“人工智能疗效评估”两个方向，并举例进行了说明：智慧医疗显著改善了肺癌手术治疗，为新药研制提供新途径。此外，在典型临床应用（如肺癌头颈癌预后预测）上，神经系统疾病应用（精神分裂症精准诊断）上，影像组学新模态应用（PET影像组学）上，都具有极好的效果。最后，从人工智能方法，数据资源平台，辅助诊断系统，共享交流平台四个方向上进行了展望。留言点赞发个朋友圈我们一起分享AI学习与发展的干货

展开

三学

首届北京医学影像诊断及新技术应用高峰论坛在京召开

11月28日，第一届“北京医学影像诊断及新技术应用高峰论坛——精准医学影像先行”在京隆重举办。本次论坛主题聚焦于：肿瘤影像诊断及医学影像新技术应用。旨在通过学术交流、技术探讨、高峰论坛等多种形式，统一影像诊断共识、推广影像新技术与理念，促进多学科交叉与融合，为民众提供更早的诊断和更及时的治疗。原中华医学会核医学分会主任委员、全军核医学会主任委员、中国医师协会核医学医师分会会长、中国人民解放军总医院核医学科主任田嘉禾教授表示，“医学影像技术在现代医疗行业中的应用不断扩大、地位不断提高，成为现在临床医学检测中不可或缺的重要组成部分。目前，医学影像数据采集越来越标准化与规范化，支持典型疾病领域的医学影像新技术研发，加快医疗影像精准诊断系统的产品化及临床辅助应用。”论坛中，中国非公立医疗机构协会常务副会长兼秘书长郝德明先生表示，“医学影像在我们日常生活中越来越重要，已经从临床辅助手段发展成为诊断疾病的主要方法和重要诊疗手段。”据全景医学影像联合创始人、集团总裁居培明先生介绍，未来，医学影像的发展趋势是在大数据的基础上，开展具有临床意义的人工智能新技术研究，为临床诊断提供精准数据案例，助推精准诊疗和影像新技术服务于民众。首届北京医学影像诊断及新技术应用高峰论坛旨在发挥纽带桥梁作用，加强医学影像专家与临床专家的互动交流，实现医学影像和新技术的融合，推动行业创新合作，使精准诊断及医学影像新技术真正落地，并实现临床运用，最终为提高医疗质量、降低医疗成本、造福更多民众，做出更多的突破和贡献。本次论坛由全景医学影像主办、北京全景德康医学影像诊断中心承办、西门子医疗系统有限公司协办。

展开

此何鸟哉

深睿研究院8篇论文入选CVPR2019，图像识别与医学影像分析等技术实现了创新性突破

2019年6月16日-6月20日，全球计算机视觉与模式识别顶级会议(IEEE CVPR 2019)将在美国长滩拉开帷幕，本次会议论文收录工作已经结束。CVPR( Conference on Computer Vision and Pattern Recognition)作为行业最顶级的研究型会议，每年被收录的论文均来自计算机视觉领域顶级团队，代表着国际最前沿的科研技术，并指引着计算机视觉领域未来的研究方向。本届CVPR总共录取来自全球顶级学术论文1299篇，中国团队表现不俗。深睿 AI LAB 8篇论文入选CVPR 2019根据CVPR 2019官网显示，共提交了7144篇论文，其中5165篇为有效投递论文，比去年CVPR2018增加了56%，最终录取了1299篇。这些录取的最新科研成果，涵盖了计算机视觉领域各项前沿工作。2019年深睿医疗有8篇论文被本届CVPR大会接收，跻身中国论文发布数量排名前列的科技公司之一。深睿研究院CVPR2019录取论文在以下领域实现了创新性突破：医学影像微小病灶检测、细粒度图像分类、基于弱监督的显著性检测、图像与自然语言的综合理解，统计理论与深度学习相结合，采用“异常检测”新思路准确检测医学图像中富于变化的弱信号等前沿技术。这些全球领先的计算机视觉算法显示了深睿研究院在计算机视觉领域强大的核心人才储备、科研文化底蕴和技术创新能力。深睿研究院独创的算法已被应用于深睿医疗现有医疗AI产品中，同时对未来产品研发提供有力的技术支撑。对于自研算法在智慧医疗领域的应用，研究院本次被录取了一篇文章题目为《基于级联生成式与判别式学习的乳腺钼靶微钙化检测(Cascaded Generative and Discriminative Learning for Microcalcification Detection in Breast Mammograms)》的论文。论文针对乳腺钼钯中的微钙化(直径<=1cm)检出问题提出了结合生成式和判别式模型的新思路。钙化检测对于乳腺癌的早期诊断十分关键，根据美国放射学院第五版BI-RADS标准，可疑恶性钙化点通常直径在1cm以内。因此，研究微钙化的检出算法具有重要的临床意义。(论文中配图)钼靶影像的微钙化点通常不到10个像素，且形态多变，再加上正常组织背景变化较复杂且样本量极大，仅使用判别式分类器很难提取到有效的特征。本篇论文设计了一个生成式模型“异常分离网络”，与判别式模型相结合，在公开和私有数据集上均超越了当前钙化检出的先进水平。深睿医疗2018年发布的一款基于乳腺钼靶的人工智能辅助诊断系统的产品，主要应用于乳腺癌的早期筛查和诊断，这篇论文中的算法已经在深睿这款产品上得到应用。另外一篇入选论文《为自底向上细粒度图像分类服务的弱监督互补部件模型(Weakly Supervised Complementary Parts Models for Fine-Grained Image Classification from the Bottom Up)》提出了一种新颖且有效的框架—弱监督互补部件模型，来完成细粒度图像分类任务。(论文中配图)作者首先通过基于弱监督学习的物体检测和实例分割提取粗糙的物体实例，然后在尽可能保持多样性的原则下，对每个物体实例的最佳组成部件进行估计和搜索。实验表明本文提出的框架在一些常用的为细粒度图像分类服务的公开标准测试集上大幅度地超越了当前最先进的算法。俞益洲教授领衔的深睿研究院，在2018年的科研攻坚战取得了阶段性的成果。俞教授本人在2018年度入选2019 IEEE Fellow以及2018ACM杰出科学，获得两项殊荣，并带领团队完成了7款医疗AI 领域的人工智能产品的研发。俞教授坦言成立深睿研究院的初衷就是为了可以集中企业最核心的技术力量，探索前瞻性的技术，为医疗AI提供领先的技术，为医疗机构提供优质的临床痛点的解决方案，同时培养优秀的医疗AI科技人才。目前深睿医疗已经和10多家国内外顶级学术机构建立长期学术科研合作，20多家顶级三甲医院建立长期临床科研合作。医疗AI任重道远，需要更多的科研人员投身其中，要有克服困难的决心，也要有进行长期技术积累的耐心。深睿研究院CVPR2019收录论文列表如下：[1] “Cascaded Generative and Discriminative Learning for Microcalcification Detection in Breast Mammograms”Fandong Zhang, Ling Luo, Xinwei Sun, Zhen Zhou, Xiuli Li, Yizhou Wang, Yizhou Yu, IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, June 16-20, 2019.[2] “Towards Accurate Task Accomplishment with Low-Cost Robotic Arms”Yiming Zuo, Weichao Qiu, Lingxi Xie, Fangwei Zhong, Yizhou Wang, Alan Yuille, IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, June 16-20, 2019.[3] “Convolutional Spatial Fusion for Multi-Agent Trajectory Prediction”Tianyang Zhao, Yifei Xu, Mathew Monfort, Wongun Choi, Chris Baker, Yibiao Zhao, Yizhou Wang, Yingnian Wu, IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, June 16-20, 2019.[4] “Completeness Modeling and Context Separation for Weakly Supervised Temporal Action Localization”Daochang Liu, Tingting Jiang, Yizhou Wang, IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, June 16-20, 2019.[5] “Cross-Modal Relationship Inference for Grounding Referring Expressions ”Sibei Yang, Guanbin Li, Yizhou Yu, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019.[6] “Weakly Supervised Complementary Parts Models for Fine-Grained Image Classification from the Bottom Up ”Weifeng Ge, Xiangru Lin, Yizhou Yu, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019.[7] “Multi-Source Weak Supervision for Saliency Detection”Yu Zeng, Huchuan Lu, Lihe Zhang, Yun Zhuge, Mingyang Qian, Yizhou Yu, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019.[8] “Towards Rich Feature Discovery with Class Activation Maps Augmentation for Person Re-Identification”Wenjie Yang,Houjing Huang,Zhang Zhang,Xiaotang Chen,Kaiqi Huang,Shu Zhang. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019.来源：中国网

展开

爱火花

前瞻研究：医学影像中人工智能技术应用现状及展望｜智周核心版

通过深度学习、机器学习等人工智能技术，能够对医学影像进行无监督或者半监督的自动化分析，提升医学影像临床诊断效率，深入发掘影像数据中潜藏的医疗与科研价值。医疗行对医学影赛道像诊断的准确度与诊断效率要求在日益增长，传统医学影像科室无法满足国内日益增长的患者需求，由于硬件算业力和算法模型的飞速发展，医学影像中人工智能技术的应用成为必然趋势。人工智能技术对医学影像系统智能化升级体现在：医学影像软件系统诊断及分析功能的升级、医学影像成像设备的升级、助力医学科研工作等方面。自2016年以来，大量初创公司和行业巨头开始加速探索人工智能技术在医学影像领域的商业化应用，医学影像人工智能成为热门投资。作者 | 付海天、田辰一、全球及中国医学影像市场规模据Zion Market Research测算，全球影像诊断市场在2016-2021年年复合增长率（CAGR）约为6.0%，预计在2021年市场规模将达335亿美元。据Signify Research报告显示，全球人工智能医学影像市场有望将在2023年达到20亿美元规模。海通证券等多家机构预测，到2020年国内医学影像市场规模将达6000-8000亿元。据机器之心数据统计，2016年中国医学影像相关企业（包含医学影像业务的通用型人工智能公司）累计融资额约63亿人民币，之后呈现快速增长趋势，2018年融资额度创历史新高，高达约300亿人民币，企业产品创新研发投入持续加码，诊断产品覆盖病种达近百种。中国医学影像相关产品/解决方案服务商年度融资额二、人工智能技术对医学影像行业的影响医学影像数据感知及分析：医学影像的处理本质上就是计算机视觉技术在医疗行业的应用，涉及医学图像分割、图像配准、图像融合、图像压缩、图像重建等多个领域。人工智能的作用主要体现在对于经过一定计算机视觉技术处理后的图像数据进行进一步的智能化分析，辅助医生进行标注、诊断或者手术工作。医学影像数据与其他类型数据融合处理及分析：医学影像能够展现患者身体特定部位的结构特征和代谢情况，具有大量图像数据信息供计算机进行分析，如果将医学影像数据结合患者的生理体征、病史、基因信息、身份信息等非图像数据，通过人工智能算法模型进行训练和应用，则能够帮助计算机从更高维度来分析数据和提取重要特征，更加全面展现疾病背后的隐含关联因素，辅助医生对疾病状况进行更精准的分析诊断。影像数据挖掘加速医疗科研过程：医学影像数据挖掘指从存放在数据库或其他信息库中的大量影像数据中挖掘有价值信息的过程，其目的是寻找影像数据背后的关联和模式。计算机辅助诊断（CAD）系统的原始处理对象为医学影像信息数据库 , 对影像信息进行数据挖掘和知识发现, 能够发现其中的诊断规则和模式，加速医疗科研过程。三、人工智能技术在医学影像中的应用分布四、医学影像中人工智能技术落地案例简述腾讯觅影：腾讯觅影利用腾讯优图在大数据、图像识别与深度学习方面的技术，对早期肺癌的敏感度（识别正确率）达到 85% 以上，在良性肺结核的特异性（识别正确率）超过 84%，对于直径大于 3mm 小于 10mm 的微小结节检出率超过 95%。博为软件：博为肝脏三维手术规划系统解决了肝脏切除手术方案设计困难问题，通过对原始的CT数据进行后处理重建为三维立体图像，精准肝脏分割与分段，自动提取肿瘤病脏，直观地展示肝脏肿瘤、肝段、肝脏内部复杂的管道解剖结构，对病例进行量化分析，并自动生成临床脏器定量分析报告。Curexo：由美国 Curexo 公司制造的Robodoc主要用于膝关节和髋关节置换手术。RoboDoc 包括两部分：手术规划软件和手术助手，分别完成 3D 可视化的术前手术规划、模拟和高精度手术辅助操作。RoboDoc机器人采用了四轴直角坐标工业机器人本体，使用患者股骨上插入的钛金属定位针来实现机器人与患者骨骼的相对定位，精度达到了0.1mm。RoboDoc主要用于关节置换术中辅助骨骼和假体的成形、定位和植入，可提高全膝（髋）置换手术的质量。深思考：基于宫颈细胞学领域知识，通过深度学习、机器学习、医学图像处理等技术提取宫颈细胞的关键特征，自动分割团簇重叠细胞，快速识别涂片上病变细胞的分级类别，实现宫颈细胞涂片的辅助阅片。深思考人工智能辅助阅片机器人可在100秒内完成单张涂片的阅片，适配国内多种制片方法，其中鳞状上皮细胞异常敏感性约为98.4%，特异性约99.77%，腺细胞异常敏感性约为93.4%，特异性接近90%。五、医学影像领域人工智能技术发展所遇瓶颈1. 影像数据分散在各个机构：影像数据是训练影像智能诊断算法模型所需的核心资源，但大量的影像数据分散在各个医院、影像中心、研究机构，不易被高效整合利用。2. 影像训练数据集标注结果存在主观差异：不同医生对图像的理解存在主观差异性，造成标注结果的不确定性，导致影像训练数据集的标注结果受到主观因素的影响。3. 人工智能算法模型适用的影像类型有待拓展：目前人工智能影像诊断主要集中在X光、CT、病理领域，而在超声、MRI、PET、红外等影像领域应用较少。六、医学影像领域人工智能技术发展的未来趋势1. 医学影像技术进一步发展：医学影像系统中成像设备技术升级、影像设备图像处理算力增加、智能诊断软件集成病种增多、影像数据融合应用、迁移学习加速影像诊断模型训练。2. 人工智能在医学影像应用领域不断拓宽：除疾病的鉴别诊断外，还可应用于分子及细胞层面图像处理、应用于介入影像学、助力非外科手术方法诊断及治疗等。3. 医学影像产业升级：区域影像数据中心建设促进区域级别影像数据流转及应用，医学影像专家团队开发模型评估体系与统一标准作为产业界产品标准等。* 本文为「智周」系列报告「核心版」，相应「深度版」的推出计划将在后续公布，敬请大家关注。针对「医学影像中人工智能应用现状及展望」这一主题，有哪些方向或主题，你希望在报告深度版中读到更详细的阐述与分析，欢迎留言，这将成为我们制作报告深度版的重要参考。

展开

卜筮

深度学习在医学影像中的研究进展及发展趋势

深度学习在医学影像中的研究进展及发展趋势王丽会1,2, 秦永彬1,21 贵州省智能医学影像分析与精准诊断重点实验室，贵州贵阳 5500252 贵州大学计算机科学与技术学院，贵州贵阳 550025摘要：医学影像是临床诊断的重要辅助工具，医学影像数据占临床数据的90%，因此，充分挖掘医学影像信息将对临床智能诊断、智能决策以及预后起到重要的作用。随着深度学习的出现，利用深度神经网络分析医学影像已成为目前研究的主流。根据医学影像分析的流程，从医学影像数据的产生、医学影像的预处理，到医学影像的分类预测，充分阐述了深度学习在每一环节的应用研究现状，并根据其面临的问题，对未来的发展趋势进行了展望。关键词：深度学习 ; 医学影像 ; 图像处理 ; 人工智能 ; 卷积神经网络论文引用格式：王丽会,秦永彬. 深度学习在医学影像中的研究进展及发展趋势[J]. 大数据, 2020, 6(6): 83-104.WANG L H, QIN Y B. State of the art and future perspectives of the applications of deep learning in the medical image analysis[J]. Big Data Research, 2020, 6(6): 83-104.1 引言医学成像已成为临床诊断的重要辅助手段，其包括计算机断层扫描（computed tomography，CT）成像、磁共振成像（magnetic resonance imaging，MRI）、正电子发射断层扫描（positron emission tomography，PET）成像、超声（ultrasound， US）成像、X射线（X-ray）成像等。如何借助大数据和人工智能技术，深入挖掘海量的医学图像信息，实现基于影像数据的智能诊断、智能临床决策以及治疗预后，已成为目前的研究热点。深度学习属于机器学习的分支，是目前实现人工智能技术的重要手段。随着深度学习技术在图像处理和计算机视觉领域的广泛应用，利用深度学习技术辅助临床诊断和决策已成为医学图像分析领域的研究重点。医学影像智能诊断的流程可大致分为3个步骤，首先获取大量高质量的图像数据，然后对图像进行预处理，最后挖掘图像信息，进行分析预测。其具体环节如图1所示。其中海量、高质量的图像数据是深度学习训练的基础，图像预处理（如配准、感兴趣区域提取）是后续分析准确度的基本保障，挖掘信息、建立预测模型是临床智能决策的关键。因此，本文将分别围绕这3个方面，阐述深度学习在医学图像处理分析流程中每个环节的主要应用现状，最后总结深度学习在医学影像研究中的发展趋势。图1 医学图像处理分析过程2 医学图像复原、重建与合成2.1 医学图像复原与重建海量、高质量的医学图像数据是利用深度学习技术实现影像精准诊断的基础。然而，由于成像设备和采集时间等因素的限制，在医学成像的过程中不可避免地会受到噪声、伪影等因素的影响。同时，针对某些成像方式，需要在成像分辨率和采集时间上进行折中，例如在CT成像中，为了降低辐射的影响，需要减少投影采集数目；在磁共振成像中，为了减少患者运动或者器官自身运动引起的伪影，需要降低K空间的采样率以减少采集时间，然而低采样率会严重影响图像的重建质量。为了获得高质量的采集图像，经常需要进行图像降噪、图像超分辨率重建、图像去伪影等复原与重建工作。下面将分别阐述深度学习在这几方面的研究现状。2.1.1 医学图像降噪基于深度学习的医学图像降噪主要应用在低剂量CT图像中。卷积降噪自动编码器（convolutional neural networkdenoise auto-encoder，CNN-DAE）是早期用于医学图像降噪的深度学习模型。该模型通过一些堆叠的卷积层，以编码和解码的方式从噪声图像中学习无噪图像，其鲁棒性较差，对噪声类型变化较为敏感。随后，Chen H等人提出RED-CNN降噪模型，将残差网络与卷积自动编码器相结合，通过跳跃连接形成深度网络，实现低剂量CT图像的降噪。同年，Kang E等人首先对低剂量CT图像进行方向小波变换，然后将深度卷积神经网络模型应用于小波系数图像，实现降噪，并使用残差学习架构加快网络训练速度，提高性能。虽然这些网络结构的降噪性能相较于传统方法得到了显著的提升，但是其网络训练均以复原CT图像与相应正常剂量CT图像之间的均方误差最小为优化目标，使得降噪图像存在细节模糊和纹理缺失等问题。为了解决这一问题，研究者提出改进损失函数和模型结构的方法来优化低剂量CT图像的降噪效果。WGAN-VGG模型通过引入感知损失，采用WGAN（Wasserstein generative adversarial network）模型进行降噪，利用Wasserstein距离和感知损失提高降噪图像与真实图像的相似性。基于WGAN-GP（gradient penalty）的SMGAN （structurally-sensitive multi-scale generative adversarial net）模型将多尺度结构损失和L1范数损失结合到目标函数中，并利用相邻切片之间的信息降噪，其结果优于WGAN-VGG模型。但是梯度惩罚的使用削弱了生成式对抗网络（generative adversarial network，GAN）的表示能力。为了解决这个问题，Ma Y J等人提出基于最小二乘生成对抗网络（least-square GAN，LS-GAN）的残差生成器结构，通过引入结构相似度和L1范数损失来提高降噪能力，生成器负责学习噪声，降噪图像为生成器的网络输入与网络输出的相减结果。除了生成模型，为了提高降噪效果，Yin X R等人同时在投影域和图像域采用3D残差网络进行降噪，并利用滤波反投影重建算法，实现投影域和图像域的相互转化，通过迭代的思想实现图像降噪。Wu D F等人提出一致性神经网络模型，实现了无监督的图像降噪方法，其不需要无噪图像标签，仅利用有噪图像对模型进行训练，从而获得降噪图像。可以看出，在利用深度学习进行降噪时，常需要利用有噪图像和无噪图像来训练模型，学习噪声类型，或者学习无噪图像与有噪图像之间的对应关系，进而实现图像降噪。这种方式具有一定的局限性，在临床的某些应用上，很难获得真实的无噪图像。因此，如何采用无监督或者自监督模型，仅利用有噪图像实现医学图像降噪将是未来研究的主要方向。2.1.2 医学图像超分辨率重建高分辨率的医学图像可以提供更多的临床诊断细节，然而由于采集设备的限制，临床上高分辨率图像较难获取。因此，如何利用深度学习技术从一幅或者多幅低分辨率医学图像中获得高分辨率图像成为当前主要研究热点之一。随着深度学习模型在自然图像超分辨率重建中的成功应用，采用深度学习模型进行医学图像超分辨率重建的研究逐渐开展起来。然而，医学图像与自然图像有本质的区别，其超分辨率重建不仅需要在图像切片平面上进行，还需要在切片之间进行，如图2所示。图2 医学图像超分辨率图像示意图（此图部分来自参考[9] ）除了将自然图像中的超分辨率重建模型直接应用到医学图像，Oktay O等人采用深度残差卷积网络从多个2D心脏磁共振（magnetic resonance，MR）图像中重建出3D高分辨率MR图像，提高了层间分辨率。Pham C H等人将SRCNN模型拓展到3D，以实现脑部MR图像的超分辨率重建。McDonagh S等人提出对上下文敏感的残差网络结构，可以得到边界和纹理清晰的高分辨率MR图像。Zheng Y等人提出多个Dense模块和多路分支组合的MR高分辨重建模型，该模型具有较好的重建结果和泛化能力。Zhao X L等人提出通道可分离的脑部MR图像高分辨率重建模型，一个通道采用残差结构，一个通道采用密集连接结构，实现了特征的有效利用，从而提高高分辨率图像的重建质量。Tanno R等人结合3DSubpixelCNN和变分推论实现了磁共振扩散张量图像的超分辨率重建。Peng C等人提出空间感知插值网络（spatially aware interpolation network，SAINT），充分利用不同切面的空间信息提高超分辨率图像的重建质量，该模型在对CT图像进行2倍、4倍和6倍分辨率重建时，均取得了较好的结果。Shi J等人提出一种多尺度全局和局部相结合的残网络（multi-scale global local resial learning，MGLRL）模型，实现了MR图像的超分辨重建，该模型可以增强图像重建细节。Lyu Q等人采用GAN实现了多对比度MR图像的超分辨率重建。与医学图像降噪相似，基于深度学习的超分辨率图像重建需要低分辨率图像样本和高分辨率图像样本对对网络进行训练。通常采用下采样的方式进行高/低分辨率图像样本对的构造。然而针对不同模态的医学成像，其成像原理大不相同，高分辨率和低分辨率之间的对应关系也不尽相同。因此，采用人工下采样的方式获得训练数据，学习低分辨率图像与高分辨率图像的对应关系，很可能与实际采集中低分辨率图像与高分辨率图像的对应关系不相符，进而导致重建的高分辨图像无意义，因此如何构建符合实际的高/低分辨率图像样本对是利用深度学习进行超分辨重建的难点。2.1.3 医学图像重建医学图像重建是指将采集的原始数据重建为临床上可视图像的过程，如CT采集的原始数据为投影图像，MR采集的原始数据为K空间数据，需要重建算法才能获得临床上用于诊断的图像。在实际应用中，由于一些采集条件的限制（如在CT中尽量减少投影数目，缩短采集时间，以降低辐射影响；在MR成像中，减少K空间填充数目，缩短采集时间，以避免患者的不适或者由患者运动带来的图像伪影），需要降低原始数据的采集率。然而，降低原始数据的采集率必然会影响图像的重建质量。因此，研究合适的重建算法，保证在原始数据低采样率下仍能获得高质量的重建图像，成为医学图像重建中的研究重点。目前采用深度学习模型进行医学图像重建的方法主要分为两类：一类是从原始数据直接到图像的重建，另一类是基于后处理的方式提高重建图像的质量。第一类方法的代表模型有：ADMM-Net，其用深度迭代的方式学习传统交替方向乘子（alternating direction method of multipliers，ADMM）优化算法中的超参数，可以直接从欠采样的K空间数据中重构出MR图像；Adler J等人提出对偶学习模型，用其代替CT重建中的滤波反投影方法，实现了投影数据到CT图像的准确重建；Cheng J等人在此基础上提出原始-对偶网络（primal-al network， PD-Net），实现了MR图像的快速重建；Zhang H M等人提出JSR-Net（joint spatial-Radon domain reconstruction net），利用深度卷积神经网络模型，同时重建CT图像及其对应的Radon投影变换图像，得到了比PD-Net更好的重建结果。第二类方法是目前主要的重建方式，即采用图像去伪影的后处理模型进行重建。用于图像降噪、超分辨重建的模型都可以用于该类型的图像重建，如Lee D等人提出带有残差模块的U-Net模型结构来学习重建图像与原始欠采样图像之间的伪影；随后，他们又提出利用双路U-Net模型对相位图像和幅度图像进行重建，进而提高了MR图像的重建质量；Schlemper J等人采用深度级联的卷积神经网络（convolutional neural network，CNN）模型，学习动态MR图像采集的时序关系，进而在快速采集下提高动态MR图像的重建质量；Han Y等人采用域适应微调方法，将CT图像重建的网络应用到MR图像重建上，可以实现高采样率下的准确重建；Eo T等人提出KIKI-Net，同时在K空间和图像空间域上使用深度学习网络进行重建，提高了MR图像重建的性能；Bao L J等人采用一个增强递归残差网络，结合残差块和密集块的连接，用复数图像进行训练，得到了较好的MR图像重建结果；Dai Y X等人基于多尺度空洞卷积设计深度残差卷积网络，以较少的网络参数提高了MR图像的重建精度；受到GAN在视觉领域成功应用的启发，Yang G等人提出一种深度去混叠生成对抗网络（DAGAN），以消除MRI重建过程中的混叠伪影；Quan T M等人提出一种具有周期性损失的RefinGAN模型，以极低的采样率提高了MR图像的重建精度；Mardani M等人基于LS-GAN损失，采用ResNet的生成器和鉴别器来重建MR图像，获得了较好的可视化结果。图像降噪、图像超分辨率重建、图像重建等均属于反问题求解。因此，其模型可互相通用，本文不对其进行一一阐述。2.2 医学图像合成2.2.1 医学图像数据扩展目前，临床上医学图像合成主要有两个目的。其一，扩展数据集，以获得大量医学影像样本来训练深度学习模型，从而提高临床诊断和预测的准确度。尽管已有很多数据扩展方法，如平移、旋转、剪切、加噪声等，但是其数据扩展方式无法满足数据多样性的需求，在提升深度学习模型的预测精度以及泛化能力上仍有待提高。其二，模拟成像。由于不同模态的医学图像可以提供不同的信息，融合不同模态的医学影像信息可以提高临床诊断精度。然而同一个病人的多模态影像信息很难获取，此时图像合成便提供了一种有效的手段。此外，某些新兴的成像技术对成像设备具有较高的要求，仅少数的医院及科研机构可以满足要求，因此图像合成为获取稀缺的影像数据提供了可能。随着GAN模型在自然图像合成上的成功应用，应用GAN的衍生模型进行医学图像合成已成为近几年的研究热点。在医学图像数据集扩展方面，主要采用无条件的GAN模型进行合成，即主要从噪声数据中生成医学图像。常用的方法是以深度卷积生成对抗网络（deep convolutional GAN，DCGAN）为基线模型进行改进。如Kitchen A等人基于DCGAN模型成功地合成了前列腺的病灶图像；Schlegl T等人基于DCGAN提出一种AnoGAN模型，用来生成多样的视网膜图像，以辅助视网膜疾病的检测；Chuquicusma M J M等人采用DCGAN模型生成肺结节数据，其结果可达到临床放射科医生无法辨别的程度；Frid-Adar M等人使用DCGAN生成了3类肝损伤（即囊肿、转移酶、血管瘤）的合成样本，以提高肝病分类的准确性；Bermudez C等人采用DCGAN的原有训练策略，生成了高质量的人脑T1加权MR图像。尽管DCGAN在医学图像合成上取得了众多有价值的成果，但其仅能合成分辨率较低的图像。为了提高医学图像合成的质量，一些改进的GAN模型被提出，如Baur C等人采用LAPGAN，基于拉普拉斯金字塔的思想，利用尺度逐渐变化来生成高分辨率的皮肤病变图像，该方法生成的图像可以有效地提高皮肤疾病分类的准确性。此外，基于渐进生长生成对抗网络（progressive grow GAN，PGGAN）在高分辨率图像合成方面的优势，Korkinof D等人利用PGGAN合成了分辨率为1 280×1 024的乳腺钼靶X光图像。2.2.2 医学图像模态转换医学图像的模态转换合成可以分成两类。一类是单模态的转换，如低剂量CT到普通计量CT图像的转换提出上下文感知生成模型，通过级联3D全卷积网络，利用重建损失、对抗损失、梯度损失，采用配对图像进行训练，实现了MR图像到CT图像的合成，提高了合成CT图像的真实性。除了级联模型，在多模态图像转换任务中，常采用的深度模型网络架构为编码-解码结构，典型代表为Pix2Pix以及CycleGAN模型。如Maspero M等人采用Pix2Pix的网络结构，实现了MR图像到CT图像的转换，进而实现放化疗过程中辐射剂量的计算；Choi H等人基于Pix2Pix模型，从PET图像生成了结构信息更加清晰的脑部MR图像。尽管Pix2Pix模型可以较好地实现多模态图像的转换，但是其要求源图像与目标图像必须空间位置对齐。这种训练数据在临床上是很难获取的。针对源图像和目标图像不匹配的问题，通常采用CycleGAN模型进行图像生成。Wolterink J M等人使用不配对数据，利用CycleGAN从头部MRI图像合成了其对应的CT图像，合成图像更真实。目前，CycleGAN已成为多模态医学图像转换中广泛采用的手段，如心脏MR图像到CT图像的合成、腹部MR图像到CT图像的合成、脑部C T图像到M R图像的合成等。然而CycleGAN有时无法保留图像的结构边界。Hiasa Y等人引入梯度一致性损失，对CycleGAN模型进行了改进，该损失通过评估原始图像与合成图像之间每个像素梯度的一致性来保留合成图像的结构边界，进而提高了合成图像的质量。3 医学图像配准与分割在很多医学图像分析任务中，获得高质量的图像数据后，经常需要对图像进行配准，并对感兴趣区域进行分割，之后才能进行图像分析和识别。本节分别对深度学习在医学图像配准以及分割领域的应用进行详细的阐述。3.1 医学图像配准图像配准是对不同时刻、不同机器采集的图像进行空间位置匹配的过程，是医学图像处理领域非常重要的预处理步骤之一，在多模态图像融合分析、图谱建立、手术指导、肿瘤区域生长检测以及治疗疗效评价中有广泛的应用。目前，深度学习在医学图像配准领域的研究可以分成3类，第一类是采用深度迭代的方法进行配准，第二类是采用有监督的深度学习模型进行配准，第三类是基于无监督模型的深度学习配准。第一类方法主要采用深度学习模型学习相似性度量，然后利用传统优化方法学习配准的形变。该类方法配准速度慢，没有充分发挥深度学习的优势，因此近几年鲜见报道。本文主要集中介绍有监督学习和无监督学习的医学图像配准。基于有监督学习的配准在进行网络训练时，需要提供与配准对相对应的真实变形场，其配准框架如图3所示。网络模型的训练目标是缩小真实变形场与网络输出变形场的差距，最后将变形场应用到待配准的图像上，从而得到配准结果。在有监督学习的医学图像配准中，变形场的标签可以通过以下两种方式获得：一种是将经典配准算法获得的变形场作为标签；另一种是对目标图像进行模拟形变，将形变参数作为真实标签，将形变图像作为待配准图像。在基于有监督学习的刚性配准方面，Miao S等人首先结合CNN，采用回归的思想将3D X射线衰减映射图与术中实时的2D X射线图进行刚体配准；Salehi S S M等人结合深度残差回归网络和修正网络，采用“先粗配准，再细配准”的策略，基于测地线距离损失实现了3D胎儿大脑T1和T2加权磁共振图像的刚体配准，建立了胎儿大脑图谱；随后，Zheng J N等人采用域自适应的思想，利用预训练网络实现了2D和3D射线图像配准，其设计了成对域适应模块，用来调整模拟训练数据与真实测试数据之间的差异，以提高配准的鲁棒性。在非线性配准方面，模拟非线性变形场比模拟刚性变形场困难很多，因此在基于有监督学习的非线性配准中，大多采用经典方法获得变形场，并以其为标签，对模型进行训练。Yang X等人首先以U-Net网络模型为基线结构，利用微分同胚算法获得变形场，并将其作为标签，实现2D和3D脑部MR图像的端到端配准。因为非线性变形场较难模拟，所以在监督学习中引入弱监督配准和双监督配准的概念。弱监督配准指利用解剖结构标签做配准的标记，学习变形场。Hu Y P等人使用前列腺超声图像和MR图像的结构标记训练CNN模型，学习变形场，然后将变形场施加在灰度图像上，从而实现MR图像和超声图像的配准。Hering A等人采用相似度测量和组织结构分割标签，同时训练配准网络，提高了心脏MR图像的配准精度。双监督配准是指模型采用两种监督形式的损失函数进行训练，如Cao X H等人在进行MR图像和CT图像配准时，先利用生成网络将MR图像转换为其对应的CT图像，将CT图像转换为其对应的MR图像，在配准的过程中，同时计算原始MR图像与生成MR图像之间的相似性损失以及原始CT图像与生成CT图像之间的相似性损失，通过两种损失的优化，提高配准的精度；Fan J F等人结合有监督模型损失和无监督模型损失，实现了脑部MR图像的准确配准。有监督学习的医学图像配准的精度取决于标签的可靠性，因此，如何生成可靠的标签并设计合适的损失函数，是有监督学习的医学图像配准中待解决的难点。图3 有监督深度学习医学图像配准框架随着空间变换网络（spatial transformer network，STN）的问世，利用无监督深度学习模型进行医学图像配准成为研究热点。其配准网络框架如图4所示。Yo o I等人结合卷积自动编码器（convolutional auto-encoder，CAE）和STN模型，实现了神经组织显微镜图像的配准，其中CAE负责提取待配准图像与目标图像的特征，基于该特征计算相似性损失，结果表明，该种损失能取得较好的配准结果。2018年，Balakrishnan G等人提出VoxelMorph网络结构，以U-Net为基线模型，结合STN模块，实现了MR图像的非线性配准；随后，其对模型进行了改进，引入分割标记辅助损失，进一步提高了配准的Dice分数。Kuang D等人提出空间变换模块，用于替代U-Net网络结构，在降低模型参数的前提下，实现了脑部MR图像的准确配准。Zhang J为了进一步提高无监督配准的准确度，除了相似度损失，还引入了变换平滑损失、反向一致性损失以及防折叠损失。其中，变化平滑损失和防折叠损失是为了保证变形场的平滑性。反向一致性损失在互换待配准图像与目标图像时，可保证变形场满足可逆关系。Tang K等人利用无监督网络实现了脑部MR图像的端到端配准，即网络模型同时学习了仿射变换参数和非线性变换参数。除了基于CNN模型的无监督配准，采用GAN模型进行配准也已成为一种研究趋势，即采用条件生成对抗网络进行医学图像配准。其中，生成器用来生成变换参数或者配准后的图像，判别器用于对配准图像进行鉴别。通常在生成器与判别器之间插入STN模块，以进行端到端训练。目前，基于GAN模型的医学图像配准有较多的应用，如前列腺MR图像与超声图像配准，以CycleGAN为基线模型的多模态视网膜图像、单模态MR图像配准，CT图像和MR图像配准等。在基于GAN的医学图像配准中，GAN模型或者起到正则化的作用，用来调节变形场及配准图像，或者用来进行图像转换，利用交叉域配准提高配准的性能。表1总结了典型的无监督配准模型和有监督配准模型。图4 无监督深度学习图像配准网络框架3.2 医学图像分割医学图像分割是计算机辅助诊断的关键步骤，是进行感兴趣区域定量分析的前提。随着深度学习在语义分割中的快速发展，将自然图像分割模型扩展到医学图像已成为主要趋势。在医学图像分割中，采用的主流网络框架有CNN、全卷积网络（full convolutional network，FCN）、U-Net、循环神经网络（recurrent neural network，RNN）和GAN模型。目前常用的医学图像分割模型包括2.5D CNN，即分别在横断面、失状面、冠状面上使用2D卷积进行分割，在节约计算成本的前提下，充分利用三维空间的邻域信息提高分割的准确度。FCN是深度学习语义分割的初始模型，通过全卷积神经网络和上采样操作，可以粗略地获得语义分割结果。为了提高分割细节，采用跳跃连接将低层的空间信息和高层的语义信息相结合，以提高图像分割的细腻度。FCN及其变体（如并行FCN、焦点FCN、多分支FCN、循环FCN等）已被广泛应用到各种医学图像分割任务中，且表现良好。U-Net是由一系列卷积和反卷积组成的编码和解码结构，通过跳跃连接实现高级语义特征和低级空间信息的融合，进而保证分割的准确度。U-Net及其变体（如Nested U-Net、V-Net、循环残差U-Net）在医学图像分割上取得了较好的分割结果，是目前医学图像分割的主流基线模型。RNN类分割模型主要考虑医学图像分割中切片和切片之间的上下文联系，进而将切片作为序列信息输入RNN及其变体中，从而实现准确分割。典型的模型有CW-RNN（clockwork RNN）和上下文LSTM模型，其通过抓取相邻切片的相互关系，锐化分割边缘。在此基础上， Chen J X等人提出双向上下文LSTM模型——BDC-LSTM，即在横断面双向、矢状面双向和冠状面双向上学习上下文关系，其结果比采用多尺度分割的金字塔LSTM模型要好。基于GAN的分割的主要思想是生成器被用来生成初始分割结果，判别器被用来细化分割结果。一般在分割网络中，生成器常采用FCN或者U-Net网络框架，判别器为常见的分类网络结构，如ResNet、VGG等。基于GAN的医学图像分割已经被应用到多个器官和组织的医学图像分割任务中。表2为常见医学图像分割模型所用的数据集以及其分割性能对比。4 医学图像分类及识别4.1 医学图像分类医学图像分类和识别是计算机辅助诊断（computer-aided diagnosis，CAD）的最终目标。在深度学习出现前，常采用人工定义的图像特征（如图像的纹理、形状、图像的灰度直方图等），经过特征选择后，再基于机器学习模型（如支持向量机、逻辑回归、随机森林等）进行分类。典型代表为影像组学方法，其在肿瘤的分型分期、治疗的预后预测方面取得了很多重要的成果。然而，人工定义特征以及特征选择方式很大程度上影响了分类的可靠性和鲁棒性。近年来，深度学习模型的飞速发展，尤其是CNN的广泛应用，使得利用神经网络模型自动提取和选择特征并进行分类成为主流趋势。CNN模型的不同变体已经在基于医学影像的临床疾病诊断中得到了广泛的应用，例如基于Kaggle公司的眼底图像公开数据集，Shanthi T等人使用改进的AlexNet进行糖尿病视网膜病变的分类，其精度可以达到96.6%左右；基于VG G，利用胸片进行肺结节的良恶性分类，其精度可高达99%。目前，在常见的CNN变体中，ResNet和VGG在医学影像分类中的表现最好，因此大多数的肿瘤检测、脑神经系统疾病分类、心血管疾病检测等将这两种模型作为基线模型进行研究。与自然图像数据相比，医学图像数据中满足模型训练需求的数据较少。因此，为了提高临床影像智能诊断的准确性，通过知识迁移来训练医学图像分类模型已成为主流。常见的知识迁移包含自然图像到医学图像的迁移、基于临床知识的指导迁移。在自然图像到医学图像的迁移中，主要有两种方式：一种是固定利用自然图像训练的网络模型的卷积层参数，利用该参数提取医学影像特征，然后利用该特征结合传统的机器学习方法进行分类；另一种是将自然图像训练的网络模型参数作为医学图像训练模型的初始化参数，通过微调来实现医学图像分类。除了自然图像到医学图像的迁移，还可以利用其他医学图像数据集，采用多任务学习的方式进行数据信息共享，弥补数据不足带来的分类缺陷。基于临床知识的指导迁移将临床医生诊断的经验（如医生的经验学习方式、影像诊断方式以及诊断关注的图像区域和特征等）融入模型，根据临床医生诊断的经验，即先掌握简单的疾病影像诊断，再进行复杂疾病诊断，研究者们提出了“课程学习”模型，将图像分类任务从易到难进行划分，模型训练先学习简单的图像分类任务，再学习较难的分类任务。基于该方式的学习可以提高分类的准确度。基于医生诊断的方式（如迅速浏览全部医学图像，再选择某些切片进行诊断），研究者提出基于全局和局部的分类模型，其在胸片和皮肤疾病的诊断上取得了较好的效果。基于诊断时关注的影像区域，带有注意力机制的分类模型被提出，典型的代表有AGCNN（attention-based CNN for glaucoma detection）、LACNN（lesion aware CNN）和ABN（attention branch network），通过引入注意力，网络可以关注某些区域，从而提高分类的精度。此外，根据医生诊断用到的经验特征，如肿瘤的形状、大小、边界等信息，将人工定义的特征与深度模型提取的特征进行融合，提高医学图像的分类精度，也是一种趋势。如Majtner T等人将人工特征分类结果与深度学习分类结果进行融合，提高了皮肤癌分类的准确度；Chai Y D等人将人工特征和深度学习特征进行融合并训练分类器，从而实现青光眼图像的分类；Xie Y T等人将人工提取的特征图像块与深度学习图像块同时作为ResNet模型的输入，实现肺结节的准确分类。如何将深度学习特征与传统人工特征进行有效的融合，是该类模型设计的难点。4.2 医学图像目标识别医学图像目标识别也属于临床诊断的一种，即在一幅图像中标记出可能病变的区域，并对其进行分类，如图5所示。图5 医学图像目标识别示意图传统的人工标记识别费时费力。最初将深度学习模型应用于目标识别时，主要是将图像分成小块，逐块输入由CNN等组成的二分类模型中，判断其是否属于目标区域。随着深度学习模型在目标检测领域的快速发展，尤其是Fast R-CNN模型和Mask R-CNN模型的出现，将整幅医学图像输入模型，即可一次找到所有可能的目标区域。但是在这两类模型中均存在一个区域建议模块和一个分类模块，二者需要进行迭代更新，模型的速度并不能满足临床的实时性要求。YOLO（you only look once）和SSD（single shot multibox detector）模型的问世解决了目标检测的实时性问题。基于此类模型，Lin T Y等人提出RetinaNet模型，并将其扩展应用到病理图像和钼靶图像乳腺肿瘤识别、CT图像的肺结节检测中。上述模型均针对2D图像进行目标检测，忽略了3D图像中切片和切片之间的空间信息。为了提高识别的准确度，基于RNN和LSTM的识别模型被应用到医学图像中。此外，在医学图像目标识别中，同样存在数据不充足的问题。为了解决这个问题，基于迁移学习的医学图像识别逐渐开展起来，如基于ImageNet数据进行模型迁移，实现肺结节、乳腺癌和结直肠息肉的检测。同时，基于临床经验知识指导的迁移学习也被应用到医学图像的目标检测中。典型代表有AGCL模型，其基于注意力的课程学习，实现胸片中的肿瘤检测；CASED （curriculum adaptive sampling for extreme data imbalance）模型，其可检测CT图像中的肺结节；特征金字塔模型（feature pyramid network，FPN），其采用不同对比度的图像，利用多尺度注意力模型实现肿瘤检测。图像分类和图像目标识别是医学影像临床诊断的最终目标，是目前人工智能技术与临床紧密结合的研究方向。笔者仅对分类识别的几种情况进行了阐述，以便掌握其发展方向。表3给出了肿瘤分类中常用的医学图像数据集以及深度学习模型，并对比了其分类性能。5 结束语本文从医学图像数据产生、医学图像预处理，以及医学图像识别和分类等方面，阐述了深度学习模型在医学图像分析领域的应用现状。尽管深度学习模型（如CNN、LSTM、GAN、注意力机制、图模型、迁移学习等）在医学图像分析中已取得众多突破，然而将深度学习应用于临床，辅助临床进行精准诊断和个性化治疗仍受到以下几方面的限制。首先，现有的深度学习模型对影像数目和质量有较高的要求，而临床上带有标记的医学影像数据难以获取，且目前临床诊断预测常使用的方法是有监督学习，数据的不充足势必会影响预测的准确性和稳定性。因此，如何在只有少量有标签数据的情况下，采用弱监督、迁移学习以及多任务学习的思想，提高分类预测的准确度，将是持续的研究热点。其次，临床应用对可解释性要求较高，而目前深度学习模型所学习的特征无法进行有效的解释。尽管现阶段已有研究学者提出采用可视化以及一些参数分析来对模型和结果进行解释，但是与临床需求中要求的形成可解释的影像学标记还有一定的距离。因此，研究深度学习模型的可解释方法将是医学图像领域的研究热点。最后，如何提高模型预测的鲁棒性是待解决的难点。现有深度学习模型多数仅针对单一数据集效果较好，无法在不训练的情况下，较好地预测其他数据集。而医学影像由于采集参数、采集设备、采集时间等因素的不同，相同疾病的图像表现可能大不相同，这导致现有模型的鲁棒性和泛化性较差。如何结合脑认知思想改进模型结构以及训练方式，提高深度学习模型的泛化能力，也是医学图像应用领域中待研究的关键问题。作者简介王丽会（1982-），女，博士，贵州大学计算机科学与技术学院、贵州省智能医学影像分析与精准诊断重点实验室副教授，主要研究方向为医学成像、机器学习与深度学习、医学图像处理、计算机视觉。秦永彬（1980-），男，博士，贵州大学计算机科学与技术学院、贵州省智能医学影像分析与精准诊断重点实验室教授，主要研究方向为大数据治理与应用、文本计算与认知智能。联系我们:Tel:010-81055448010-81055490010-81055534E-mail:bdr@bjxintong.com.cn

展开

长青树

探索精准影像、智能诊疗领域学科共建推动医学交叉学科深度融合

记者16日获悉， “上海大学全景智能影像研究院”签约成立，将探索精准影像、智能诊疗领域学科共建机制，开启互利共赢的合作模式。据悉，线上线下同步的第二届上海大学医工论坛关注生物材料、智能医学、医学影像领域话题，专家学者共同探讨医工交叉在老年医学、公共卫生、医学工程三大领域的技术创新及未来合作。此次论坛由上海大学主办，旨在推进医工交叉学科的创新、融合与发展，构建医研企协同创新体系。150多名从事医工交叉研究的学者、医学专家出席论坛，四位来自海内外的医工交叉领域专家作主旨报告。上海大学副校长、医学院院长汪小帆强调了“交叉”对于推动医学、工科发展的重要性，希望在学校、附属医院等的共同努力下，加速推进上海大学医学学科建设。未来，上海大学医学院还将进一步推动医学交叉学科的深度融合，搭建学术交流与合作平台，努力建成世界一流、特色鲜明的综合性研究型大学。论坛上，天津大学明东教授通过线上会议平台作题为《无创脑机接口发展与挑战》的报告。他总结了有创脑-机接口和无创脑-机接口发展的趋势，从多个方面梳理无创脑-机接口的发展历史，介绍天津大学神经工程团队在无创脑-机接口领域的最新研究进展。新加坡南洋理工大学关存太教授带来题为《医工交叉遇见脑机智能——深度学习和脑机接口在卒中康复的最新进展》的线上报告。他介绍了智能深度学习和脑机接口在卒中康复的最新进展，回顾了多个针对卒中康复临床研究，展示了初步研究成果，并探讨了运动康复领域未来研究的设想。上海交通大学医学院附属新华医院王辉教授则聚焦“核医学新进展”，介绍了核医学科设备和放射性药物方面的巨大进展。王辉指出，放射性药物在肿瘤等诊疗一体化上，将发挥重要作用。论坛上，“上海大学附属全景医学影像诊断中心”挂牌建立。上海大学医工交叉研究院特聘研究员聘任仪式同期举行，特聘研究员代表杨帮华教授表示，未来将致力于医工交叉领域的发展，共同为上海大学医学学科建设和未来发展贡献智慧。（文章来源：中新网）

展开

方其梦也

首个获 FDA 批准临床应用的医疗影像软件,「RADLogics」被数十亿美元全资收购

总部位于新加坡的基金 East Ocean Venture 和并购基金中国天津大数资产管理公司于今年 5 月一同全资收购了一家美国的 AI 医疗影像公司 RADLogics 。基金方透露，此次全资收购额在数十亿美元。据 Crunchbase 公开资料查询，RADLogics 于 2011 年完成了 85 万美元的天使轮融资，2014 年完成 200 万美元的 A 轮融资。新加坡基金方 VP 向36氪透露，RADLogics的商业化能力是其看重的一点：不同医院间的系统差异并不太大，系统适配的情况下，软件安装可以在云端完成(API对接)，边际成本低，可快速规模化。RADLogics，2010年创立，是一家位于美国的AI医疗影像公司，主要为放射科研发影像类医疗软件。截止至2017年2月，它们也许是唯一在美国多个临床地点进行商业化并获得FDA批准的创业公司。其中，加州的El Camino医院与纽约的Mount Sinai医院与RADLogics的合作起始于2014年，这意味着RADLogics已被纳入数家美国民营医院的放射科胸腔CT系统。RADLogics在实际操作中，可用于辅助医生阅读胸腔CT及肺部的X-Ray（包括肺癌筛查、心瓣肿大等），脑部和Liver部分的辅助功能仍在研发中。其是运用的大数据图像分析系统能够在几秒内处理成像数据。另外，该软件的三维扫描方式，相较于二维，可显著提升识别准确度，以此辅助医生下临床诊断并更早地发现病患的身体异常之处。RADLogics应用界面StreetInsider报道指出，一份2018年由Matt Brown（UCLA的博士生）出具的评估报告提及RADLogics的软件可以与PACS（医学影像存档与通信系统）整合，整合系统可节省放射科医生读取报告47%的时间。研究表明，使用该系统检测的结节精准度误差控制等于或小于1mm.RADLogics创始人Moshe Becker也在该报道中提到，RADLogics在过去的三年间一直在开发运用AlphaPoint算法的医疗成像产品，而该算法训练的初期数据得益于Moshe的医生职业经历 —— 以色列的几家较大医院成为其早期数据的积累，尤其是医疗数据的标注比较完善。另外，RADLogics的办公场所在硅谷，但在以色列仍保留了一个研发中心。此项全资收购完毕后，RADLogics计划于7月中旬进驻国内的几家公立医院，进行正式的商业化运作。RADLogics位于美国的团队将会派一部分技术人员前来北京，参与将产品整合到医生工作流程中，此处涉及与各医院设备与软件的适配问题。国内方面，腾讯觅影与科大讯飞的产品也均先后入驻医院。基金方East Ocean创始人Nick表示，若RADLogics通过中国CFDA后有望进行大规模推广。根据世界卫生组织（WHO）统计，中国每1000人只有1.5个医生，比其他许多国家（例如美国的每千人中有2.5人）低得多。鲸准研究院2018年4月出具的《人工智能行业应用价值报告》中指出，中国医学影像数据年增长率达到30%，但放射科医师年增长率只有 4.1%，导致了严重的供需失衡；且中国医学影像误诊人数高达5700万人/年。随着中国人口老龄化速度高于全球平均水平，中国医疗体系的癌症负担预计将在未来几年中增长。放射科医生的短缺，也致使中国政府启动多项大型癌症筛查项目。服务医院的医学影像，无论是创业项目数还是融资数量都是最多，竞争也最为激烈（与RADLogics有竞品关系的几家公司可于此处查询， https://www.nanalyze.com/2017/02/artificial-intelligence-medical-imaging/）。----我是36氪记者yanyan，关注医疗领域的一切，微信交流roseisnotred.

展开

笼婴

权威解读医学影像AI路线图：AI未来会在很大程度上取代医生读片

AI 正在对医学成像领域深度渗透，这已是业内共识。根据市场调查公司 Signify Research 报告，包括自动检测、量化、决策支持和诊断软件在内，全球医学影像 AI 市场在 2023 年将达到 20 亿美元。如今除了通用电气公司（GE）、西门子和谷歌等大公司，大量的新创公司正在涌入到这个领域来。图：全球医学成像软件的收入预测（Signify Research）。然而，很少有人能看清渗透将如何发生。4 月 16 日，一篇题为《医学影像 AI 路线图》的报告在业内顶级杂志《放射学杂志》（Radiology）上发布。这份攸关医学影像 AI 应用未来发展方向的路线图，厘清了未来数年医学影像 AI 可能重点突破的技术主题，应为业内重点关注。它是 2018 年 8 月一次研讨会的成果，当时美国国立卫生研究院、北美放射学会 (RSNA)、美国放射学院 (ACR) 和放射学与生物医学成像研究学院在华盛顿特区联合主办这次会议。路线图指出了 5 个关键主题：1）图像重建：如何从源数据生成适合解释的图像；2）图像自动标记和注释：从临床影像、电子档案和结构化图像中提取信息；3）临床影像机器学习新方法：包括定制的、预先训练的模型架构和分布式机器学习方法等；4）机器学习人工智能方法的解释性；5）图像识别和数据共享：以促进临床影像数据应用和学科发展。如何解读这份路线图？这份路线图对于下一步的医学影像 AI 应用有多大的指导价值？为此 DeepTech 专访了路线图作者之一、美国纽约伦斯勒理工学院讲席教授王革。DeepTech：为什么放射医学更热衷 AI 应用？王革：这和图像性质有关。在医院，成像技术会产生大量的图像数据，而图像数据分析正是 AI 相对成熟的技术。医学成像相当于是现代医学中的眼睛，可以把人的五脏六腑看得一清二楚。无论做手术，还是开药方，或者是放疗都离不开图像。所以人工智能介入进来理所应当，于是就变成了很热的一个领域。此外，在医疗数据里边，断层扫描图像应该是最精确的数据了，因此利于 AI 研发。其他如电子病历或者是保险数据可能都会有较大误差，这也让医学影像领域在 AI 方面走得较快。不过那些不太精确的数据并非没用，如果这些数据分析和精确的图像数据结合起来分析，就会让医生有一个整合性的更精准的决策。图：ImageNet大规模视觉识别挑战错误在过去6年中下降了8倍以上，2017年低于3％，好于人类错误率5%的表现。尤其是2012年引入深度学习后，识别准确性大大提高。DeepTech：AI 在医学影像中的应用达到了什么阶段，是否还处于初级阶段呢？王革：是的，还是初级阶段。比如说图像重建的问题，现在 AI 用在医学图像品质提升方面进展稍微快一些。比如说，对于一张模糊的医学影像，我们可以增强它的清晰度。原来用经典的 CT 影像分析方法可以将清晰度增强 30% 左右，现在我用深度学习分析 CT 图像或核磁共振图像，能增强 100% 甚至到 200%。这个进步是显著的，但还需深入研究与严格检验。图像增强对病患者是有实际收益的。比方说 X 光 CT 筛查癌症。因为大部分来体检的人是没有癌症的，在这个过程中人们会担忧 X 射线的安全性。因为 X 光照射本身可能会引发基因变异以及增加癌变的可能性。尽管这个可能性很小，但是毕竟让人们有所顾虑。在这种情况下，我们就考虑用比较少的 X 光剂量来做癌症筛查。问题是把剂量减少之后，就会得到背景嘈杂的影像。那么我们可以用机器学习来减少低剂量照射的噪音和伪影。也就是说，低剂量照射得到的原始图像是模糊的，有噪音的，经过机器学习处理这个图像就变得清楚了。这也是 2018 年 8 月 NIH 会议说的第一个要点，低剂量造影图像的重建。图像重建是机器学习的一个新领域。我们正在和 GE 合作研究基于 AI 的 CT 图像的重建。另外，如何审批这类应用产品还没有明确规则。美国 FDA 正在考虑这个方向。AI 研究结果看着很好，但要是用到病人身上，万一有失误怎么办？而且 AI 产品的监管和传统产品监管不一样，以前的产品的发布和修改是很明确的，但是 AI 产品是交互式的和自适应的，它会不断从现实环境中学习迭代，因此给 FDA 监管带来新挑战。所以说，AI 在医学影像中距离广泛应用还有工作要做。在非医学图像数据库 ImageNet 大规模 AI 识别中，错误率已经低于人类的错误率。这是机器学习的结果，而错误率的降低对患者的健康至关重要。要知道，诊断错误造成了不少病患者死亡，而放射科医生的读片常有错误。在某些特定的图像识别中，现在人工智能已经超过人类了。将来机器一定程度上甚至是很大程度上会取代医生来读片。我认为这正在发生或迟早会发生。DeepTech：AI 将来能全面取代医生吗？王革：至少目前看我们还不能完全让机器来做复杂的处理，现在的 AI 还有可解释性、鲁棒性（即系统稳定性）等在医学影像领域尤其重要的问题需要解决。AI 的介入希望能提高医生的诊治效率。我认为，最终这样的半自动化技术会在很多场景下变为全自动。也就是说，在一些特定场合取代医生是可以实现的。一些很常规的分析，比方说骨头在 X 照射中看得很清楚。机器分析会明确诊断出有没有骨折。这种情况下，我觉得医生就可以相信机器。那么，医生的重要性怎么体现呢？在整个诊断过程中，将来医生的角色可能更宏观一些，进行一些有创造性、有想象力的分析。DeepTech：你刚才说医学影像的 AI 发展还是初级阶段，那么路线图是如何描述下一个阶段要解决的问题的？王革：这份路线图是行业专家告诉美国相关机构下一步要怎么走，侧重的是接下来几年要关注的要点以及可实现的改进，而不侧重 AI 的远景。除了刚才说的图像重建问题，还有一个当前重要的问题是黑匣子问题，就是说机器学习的可解释性。医生可以和患者沟通病情、病因以及诊治的依据，但机器学习只会给出一个结论，这不容易让患者放心，会让人感觉把自己完全交给未知了。但这其实也是一个进步，以前患者只能听到医生的判断，现在患者还能听到 AI 的判断。我们现在正与 IBM 合作研究神经网络可解释性的问题。另外一个问题是图像数据库。机器学习需要用大数据，来保证训练分析是合理的。还有外国的数据库拿到能不能用，要不要监管部门来审批，公司能不能开放数据，这都是问题。再一个问题是硬件。机器学习用到大量的数据，所以对硬件的要求越来越高，尽管这几年硬件在快速升级，但对于普通机构可能就要负担不起。还有，数据库会涉及病患者隐私，现在机器学习可能猜出患者的身份信息。对于隐私问题，我们可以借助于模拟计算来解决。比如用 10 个病人的图像，根据特征随机构造出一个新的患者（他不是这 10 个病人中的任何一个）。然后，我们用这个模拟患者来训练分析，这样就规避了数据隐私的问题。当然这个也会有弊端，它毕竟不是实际的病例，这就需要强大的数字模拟能力。DeepTech：目前美国的医学影像数据库足够大了吗？还需要哪些完善措施？王革：美国有一些公开的数据库，但更多数据库是不让别人用的。医院出于隐私的考虑很少开放其数据库。他们担心病人的诉讼。如果要把病人的身份信息去掉，以及标注这些数据，要花大量的时间精力。DeepTech：你怎么看待中国在这方面的研究？王革：中国国内的应用研究很好，前景广阔。但源头创新比方说神经网的基础理论以及硬件芯片还是落后的，这方面定会进步。DeepTech：你怎么看待美国 FDA 去年批准了 AI 在糖尿病视网膜病变中的应用？怎么看待医学 AI 商业化发展趋势？王革：因为视网膜图像是两维的，相对比较简单，不像那种三维的甚至动态的图像分析那么复杂。另外糖尿病视网膜病变数据也比较丰富，又不是那么隐私敏感，所以这类应用已有很好的结果，甚至在智能手机上就能使用，很贴近老百姓。我觉得发展都是从易到难。将来 AI 能不能精准地预测心脏病，预测中风以及癌症，就要一步一步来。我们和康奈尔大学在心脏疾病方面有些合作。对于放射影像而言，放射科的主流机器都是由大公司来做。我们从两年前开始与 GE 合作人工智能成像方面的研究。而 IBM 侧重于大数据和推理，属于自然语言理解分析。有人说自然语言理解的进展没有图像领域进展大，但是我认为这事也不能急，时机成熟自然就会有好的结果。王革（右）于2014年当选美国科学促进会会员。王革（Ge Wang），美国纽约伦斯勒理工学院（RENSSELAER POLYTECHNIC INSTITUTE）的讲席教授（Clark & Crossan Chair Professor），也是生物医学影像中心主任。他于 1982 年毕业于西安电子科技大学电子工程系，于 1991 年和 1992 年在美国纽约州立大学获得硕士和博士学位，现为 IEEE、AAPM、AIMBE、SPIE、OSA，和 AAAS 多个国际学术组织的 Fellow。他专注于 X 射线计算机断层扫描、光学分子成像、多尺度和多模态成像、机器学习等方面研究。他的团队在医学成像方面进行了一系列开拓性的研究工作，提出了螺旋状锥束 CT 重建、自发荧光断层成像、CT 内重建理论和方法等。他发表了 450 多篇期刊论文，主持多个大型 NIH 和 NSF 项目。其团队与哈佛、斯坦福、康奈尔、MSK、UTSW、耶鲁、GE 全球研究中心、 Hologic 和 IBM 等均有活跃的合作。

展开

澶漫为乐

医学影像学、医学影像技术、临床医学，三者有什么不同，选谁？

协和医学院从去年开始，医学院校的分数线又开始往上涨了，很多医学院的分数线都非常高，看来即便大家觉得医患关系不佳，医生很辛苦，但医生还是一个好职业。不过，大家在填医科大学的时候，一定要注意，并不是你考上了医科大学就一定是医生，在医科大学里面，有很多种专业，大家一定要看清楚，有些学科当不了医生。比如，我们看看下面天津医科大学招生的专业计划表，大家可以看到里面有两项，一个是医学影像学，是5年制；另一个在医学技术类里，包含医学影像技术，是4年制学制。天津医科大学招生专业这两个的差别不单单是学制的不一样，学位也不一样，医学影像学的学位是医学学士，医学影像技术的学位是理学学士。理学学士不能考执业医师资格证，意味着就当不了医生。医学影像学医学影像学说白了就是培养医学影像诊断专家的。比如，肺炎，肺炎病人需要去拍肺部CT，医学影像学的医生就会根据拍出来的片子进行诊断。学的课程主要是医学方面的课程，再加上各种影像方面的内容，包括医学影像设备、医学影像诊断学、核医学、发射学、超声诊断学等。医学影像技术医学影像技术人才就是制造、修理或者操作这些CT、X光、B超等仪器的人，说白了就是懂一些医学知识的理工工程师。主要学的课程有：电工电子、图像处理、医学图像处理、医学影像检查技术、设备的安装和维修。这些课程明显就是一位特殊仪器的电子工程师的课程。除了这些，还加一些医学的基本课程，诸如人体解剖学、医学术语学等等。临床医学不过，虽然医学影像学毕业生可以当医生，但病人一般不直接跟他们打交道，我们一般打交道的是临床医生，像肺炎，一般是呼吸内科的临床医生看，他决定要不要拍片，根据结果，是吃药，还是打点滴，还是住院，都是临床医生来看。因此，在医学院里面，最重要的专业就是临床医学，一个顶尖医学院，临床医学和口腔医学一般都是很好的。因此，作为医学专业来说，临床医学和口腔医学是最好的，当然也是最辛苦的。从就业来说，首选临床医学。执业医师资格考试要当医生必须要过执业医师资格考试，这里谈谈考试资格。要考执业医师资格，必须要有本科医学专业的学历，并且要实习一年。在2014年，国家颁发了一个《医师资格考试报名条件》，里面明确了基础医学类、法医学类、护理（学）类、医学技术类、药学类、中药学类等医学相关专业，其学历不作为报考医师资格的学历依据。所以，医学影像技术不能当医师。总结不过，不能当医生不意味着这个工作不好。从工作性质来说，临床医生最好，当然也最苦，工作很累，需要不断学习，进入门槛很高，而且一开始收入和地位都不高，需要过了一定阶段之后，才会进入越老越值钱的状态。是个先苦后甜的工作。医学影像学也是需要读研，考执照，进入医院当医生。我对这项工作持保留态度，因为随着大数据的兴起和AI技术的发展，也许这件事由机器来完成的可能性很大。虽然不能百分百取代人工，但人工的削减是肯定的。医学影像技术则是工程师，现在医疗在改革，这种医疗设备的检测也许会成为第三方，不是医院的一部分，因此这个专业的就业跟其他的电子工程师区别不大，也许收入会不错，也许一般，完全取决于公司的运营情况。至于个人怎么选择，我觉得看个人兴趣爱好吧。毕竟临床医生最后很好，但前期的苦并不是每个人都能扛下来，有的人也不喜欢当医生。至于影像技术，则要求理工专业要学好。大家觉得呢？

展开

英国博士毕业难度报考的在职攻读博士学位上海研究生对外经贸大学行政管理考研公共管理适合考研吗成都考研日语美国会计考研北京理工保研条件研究生考试班哈尔滨北航研究生院有哪些管理类考研究生专业北体研究生专业有哪些四川外国语学院研究生考试校本研修优秀案例市场调研报告包括哪些公共管理研究生论文选题

首页

考研

考博

院校选择

专业选择

研究生动态

研究生题库

影像研究与医学应用程序