基于BP神经网络对乳腺癌诊断的分析与预测
【摘要】:在女性恶性肿瘤患者中,乳腺癌患者的死亡率最高,严重危害当代女性身体健康。对恶性肿瘤的早期诊断可以有效提高患者的生存率,因而对乳腺癌的早期诊断是十分重要的课题。近年来,决策树、支持向量机、广义回归等方法已经被运用到乳腺癌的诊断中,而神经网络作为一种新兴的机器学习算法,在该领域的研究内容还相对较少。人工神经网络模型的训练不需要对输入输出做特定的假设,具有自学习、自适应的优点,是一个非常适合处理非线性问题的工具。已有学者提出概率神经网络、SOM神经网络算法等在乳腺癌诊断中的运用。本文使用的BP算法是一种较为成熟的神经网络算法,由于其特殊的前馈机制和误差的反向传播机制,相比其他神经网络算法,BP算法的分类效果是更好的。本文的实证分析部分是将BP网络运用到具体的案例中,选取的数据是威斯康星医学院的william H.Wolberg博士提供的乳腺癌样本。建立BP神经网络模型后,又与传统的逻辑回归方法进行了对比。在模型的评价过程中用到的主要评价指标是分类正确率、混淆矩阵、ROC曲线和交叉验证方法等。在建模过程中用到的统计软件主要是R语言。本文最后对整篇文章进行了总结,得出结论,陈述不足,并提出展望。R语言建模的输出结果显示BP神经网络对乳腺癌病理诊断的分类效率是令人满意的。逻辑回归模型往往能更加直观地解释自变量和因变量之间的因果关系。而在处理更复杂的数据时,BP神经网络模型的处理能力是更强的。