宫颈组织OCT影像的计算机辅助诊断关键技术研究
【摘要】:宫颈癌威胁着全球女性的健康。在高收入水平国家,筛查技术的普及大大降低了宫颈癌的发病率与死亡率。但是,现有宫颈癌筛查技术都存在各自的不足,迫切需要一种新的基于高分辨率成像和“非侵入”式的筛查方法。光学相干断层扫描技术(optical coherence tomography,OCT)是近年来迅速发展的一种生物医学成像技术,有着实时成像、高分辨的优点,已被广泛应用于眼科、心血管等领域;而且,已有研究者开始利用OCT成像技术来开展宫颈疾病检诊的临床实验。在此背景下,考虑到医生人工诊断的不足以及人工智能技术的快速发展,本文拟将深度学习与OCT成像技术相结合,形成一种新的宫颈癌筛查技术,辅助医生对宫颈癌患者做出快速而准确的诊断。为实现上述目标,本文着重研究如下两个问题:1)针对经典卷积神经网络存在的问题,提出更适合OCT影像的分类模型;2)针对宫颈组织OCT影像的不均衡数据问题,引入生成对抗网络来生成多样性的稀少类别数据。具体而言,本文的主要工作如下:(1)针对经典卷积神经网络的不足(如大量使用池化操作,忽略空间位置信息),以及胶囊网络处理大尺寸图片能力有限的问题,本文将胶囊网络与VGG16相结合,提出了一个宫颈组织OCT影像分类模型。为了验证该模型的有效性,将模型的分类结果与人类专家进行了对比。实验结果表明,该模型优于人类专家的平均水平,可以被应用于计算机辅助诊断。同时,本文设计了“五折交叉验证”让该模型与VGG16模型进行比较,前者五分类任务准确率为84.9%±1.2%,二分类任务准确率为88.9%±2.5%,优于VGG16模型的80.9%±2.1%和87.3%±3.9%,表明该模型表现更好和更稳定。(2)考虑到原始生成对抗网络(generative adversarial networks,GAN)难以训练且易“模式崩塌”的缺点,本文引入了 WGAN-GP模型,用来生成宫颈组织OCT影像中较少的低度病变类别的样本。训练得到的生成样本与真实样本有着相似的分辨率和组织形态特征。为了验证生成样本的有效性,本文设计了相应的对比实验,将生成样本加入训练集,训练本文所提出的分类模型。与之前未加入生成样本的结果相比,在灵敏度指标上有了 3%的提升。