肺部自动癌症检测与分类系统毕业论文
2021-11-28 21:23:04
论文总字数:29094字
摘 要
医生需要从每位患者的大量CT图像中寻找肺结节,从而判断是否存在肺癌的早期病变。然而,患者不断增多,医生所面临的医疗图像不断增多,人工分析所暴露出的问题也日益突出。因此,医疗图像的智能化和专业化处理势在必行。本文针对LNDb竞赛中的肺部结节的CT数据和标记,组合多种机器学习算法,设计了肺部癌症的自动检测、分割和分类系统。该系统使用YOLOv3和K-Means 来检测和分类肺部结节,然后采用U-Net、形态学操作和窗口法来分割肺部结节。实验表明,系统在以上两方面的表现均较为优异,此外,本文还对实验的各种现象进行了详细的分析,给出了性能不理想的原因,最后讨论了医学图像处理中目标检测与语义分割所面临的问题和今后的发展方向。
关键词:肺结节;目标检测;语义分割;卷积神经网络
Abstract
Doctors need to search the pulmonary nodules in a large number of CT images of each patient, in order to judge the early existence of lung cancer. However, with the increasing number of patients and medical images faced by doctors, the problems exposed by manual analysis are increasingly prominent. Therefore, intelligent and professional medical image processing is imperative. Aiming at the CT images and labels of pulmonary nodules in the LNDb competition, this paper combines various machine-learning algorithms to design an automatic detection, segment and classification system for lung cancer. In this system, YOLOv3 and K-Means are used to detect and classify the pulmonary nodules, which are then segmented by applying U-Net, morphological operation and window techniques. The experimental results show that this system performs well in both the aforementioned two aspects. Furthermore, several phenomena in the experiments are analyzed in detail and the causes for some non-ideal results are provided. Finally, the problems existing in the object detection and semantic segmentation for medical images as well as some perspectives are discussed.
Key Words:Pulmonary nodules; target detection; semantic segmentation; convolutional neural network
目 录
摘 要 III
Abstract IV
第1章 绪论 1
1.1 课题背景与意义 1
1.1.1 背景与研究价值 1
1.1.2 研究目的与意义 1
1.2 国内外研究现状 2
1.2.1医学图像处理中的目标检测 2
1.2.2医学图像处理中的语义分割 3
1.3 主要工作与论文组织架构 3
第2章 数据集与数据预处理 5
2.1 LNDb竞赛介绍 5
2.2 LNDb数据集 5
2.2.1 数据描述 5
2.2.2 元数据格式 6
2.2.3 标记数据格式 7
2.3 数据预处理 7
2.3.1 CT数据预处理 7
2.3.2 标记数据预处理 8
2.3.3 处理工具 9
2.4 小结 9
第3章 基于YOLOv3的肺结节自动检测与分类 10
3.1 YOLO目标检测算法原理 10
3.1.1 YOLOv1 10
3.1.2 YOLOv2 13
3.1.3 YOLOv3 14
3.2 实验原理与方法 14
3.2.1 目标检测的数据预处理 15
3.2.2 先验框尺寸确定 17
3.3 实验设置与结果 17
3.3.1 实验参数设置 17
3.3.2 实验结果与分析 18
3.4 小结 19
第4章 基于U-Net的肺结节自动分割 21
4.1语义分割基础知识 21
4.1.1 全卷积网络 21
4.1.1 U-Net 22
4.2 实验原理与方法 24
4.2.1 语义分割的数据预处理 24
4.2.2 基于窗口的肺结节分割 24
4.3 实验设置与结果 26
4.3.1 实验参数设置 26
4.3.2 实验结果与分析 26
4.4 小结 28
展望与总结 29
参考文献 30
致 谢 33
第1章 绪论
1.1 课题背景与意义
1.1.1 背景与研究价值
根据《2018年全球癌症统计报告:全球185个国家36种癌症发病率和死亡率的估计》[1],肺癌是目前所有癌症中发病率最高和死亡率最高的恶性肿瘤。根据《2018全球癌症统计报告解读》[2],中国的肺癌发病总数为77.4万,国内占比18.1%,全球占比为37.0%,肺癌死亡总数为69.1万,国内占比24.1%,全球占比为39.2%,发病数和死亡数均为国内最高。由此可见,肺癌对公共健康有着极大的危害。
与其他癌症类型相比,提高肺癌存活率的进展十分缓慢,这主要归因于肺癌的诊断时间点较晚。尽早诊断对于提高肺癌的治疗效果和存活率有着显著的效果。长期以来,低剂量计算机断层扫描(CT)被认为是一种潜在的早期筛查工具,对于肺癌高风险人群,已证明其肺癌死亡率可降低20%。但肺部CT图像诊断给放射科医生带来了巨大的挑战:医生需要从大量的CT图像中找出肺结节,肺结节可能为肺癌的早期病变,也可能是其他良性病变;一位患者每次CT检测结果包含200-700张图片,医生的工作量十分巨大,且会因为疲劳和认为主观性造成漏诊和错诊。因此,计算机辅助诊断(CAD)系统可以减轻临床医生的负担并提供独立的第二意见,从而有助于筛查程序的采用和推广。CAD系统可以根据患者肺部CT图像自动进行结节检测、分割和分类等功能,但CAD系统的设计有着较高的复杂度与困难度,首先结节特征变化无穷且发生部位不固定,另外很难避免漏诊的情况发生。
早期CAD系统依赖于传统图像处理技术和人工特征,这些系统泛化能力较差,只能处理特定的情况。近年来随着深度学习技术的出现与发展,计算机视觉(CV)中的分类、目标检测和语义分割等任务的表现有着飞跃性的提高,医学图像处理方面也有很多大的进展,CAD系统的效果得到了极大地提升。
1.1.2 研究目的与意义
本设计的目的主要是为了完成肺部癌症自动诊断竞赛,并将其分为三个子任务,即肺结节的检测、分割与分类。本设计旨在使用深度学习技术,利用竞赛公开数据完成肺结节的自动检测、分割与分类任务。检测任务为将CT图片中的肺结节定位并使用边界框标出,可以作为病灶检测的前序任务,得到病灶的大致位置和数量等基本信息;分割任务为对CT图片进行语义分割,给出结节的蒙版,以方便医生估计结节的体积和直径等信息;分类任务能够在上述两个子任务的基础上给出结节种类的判断,辅助医生进行诊断。在实际中,分类任务可以与目标检测与语义分割任务相结合以同时解决,具体情况需要根据数据格式与任务需求共同决定。
以卷积神经网络(CNN)为代表的深度学习技术极大地推动了计算机视觉中各类任务的发展。借鉴自然图像处理和深度学习的思想,医学图像处理在CT图像识别、病灶目标检测和病灶分割等任务上的精度有着很大的提高。
1.2 国内外研究现状
在阐述相关方法之前需要明确定义各类任务的要求。图像分类是计算机视觉最基础的任务,但是在单纯的图像分类之上还有更多具有挑战性的任务:语义分割、实例分割、分类与定位和目标检测等等,如图1.1所示。
图1.1 多种计算机视觉任务示意图
目标检测任务既要求系统能够识别出图片中的不同目标,又要求给出描述其位置的方框,所以目标检测比常规的图像分类任务难度更大。语义分割要求系统对输入图像的每一个像素进行分类,最终的输出可以看做输入图像中不同物体的蒙版(Mask)。本节梳理在医学图像处理中的目标检测和语义分割中的传统方法和深度方法。
1.2.1医学图像处理中的目标检测
在医学图像处理中,目标检测的解决方法主要有两种,一种是从图像处理的角度来解决,该方法需要大量先验知识去设计方法和调整参数;另一种是从机器学习的角度来解决,该方法需要大量数据来训练学习器,但对先验知识没有过多的要求。
从图像处理的角度解决目标检测,一般需要在阈值法和形态学操作等方法的基础上改进,针对问题设计更符合实际的检测流程。Jacobs等人[3]使用双阈值密度蒙版和形态学开操作检测肺结节。针对尺寸大小不同的肺结节,Seito等人[4]设计了多阶段的阈值法与形态学开操作进行检测,Seito等人[5]在后续工作中对部分实性结节、实性结节和大实性结节分别设计基于阈值与形态学开操作的方法检测候选,并融合检测结果。
从机器学习的角度解决目标问题,最简单的思路就是将检测问题退化为分类问题,基本思想是使用一定大小和比例的窗口(patch)在候选图片中进行滑动,分类器对滑窗对应的图像进行分类,如果某类概率大于阈值则判定目标存在,根据滑窗的位置和尺寸反推回原图像便可以得到目标边界框,这种方法即为滑动窗口法。由于医学图像的特殊性,滑窗法有着非常普遍的应用[6,7]。滑窗法的缺点非常明显,首先在于事先不知道目标的大小,所以要设定不同的窗口大小和比例,以至于在实践中分类器常常要处理几十万个子区域,计算时间长。
随着深度学习在目标检测领域的突飞猛进,涌现了R-CNN[8]、Fast R-CNN[9]、Faster R-CNN[10]和YOLO类[11-13]等等目标检测算法,医学图像领域同样受到上述算法的深刻影响。Dou等人[14]将在线样本过滤和残差混合损失与3D CNN结合,预测结节的位置和类别,Zhu等人[15]使用3D Faster R-CNN进行结节预测,并在网络设计上引入了残差模块和U型结构,Zhu等人[16]将期望最大化算法和Faster R-CNN结合实现在弱监督信息下的结节预测。
1.2.2医学图像处理中的语义分割
请支付后下载全文,论文总字数:29094字
相关图片展示: