基于内容的垃圾邮件意图分析方法研究
【摘要】:邮件的意图是一种不同于传统技术中所指的内容或行为的全新特征,其稳定性、不可伪装性和必要性,是传统垃圾邮件识别方法中的其它特征所无法比拟的,因此本文从邮件的意图特征着手,将传统基于内容的识别方法与意图分析方法进行了有机结合,以达到更好的识别垃圾邮件的目的。
本文首先对垃圾邮件识别技术的国内外研究现状和传统的一些比较重要的技术手段进行了归纳总结,同时简要描述了垃圾邮件识别技术新的发展趋势。其次,本文在对传统的两种基于内容的识别方法进行详细分析之后,提出了一种新的基于内容的意图分析方法,并对该方法的原理、过程和涉及到的算法进行了详细描述和讲解。为了对基于内容的垃圾邮件意图分析方法进行测试,本文还分别在Enron、PU1和LingSpam数据集上对传统方法和基于内容的意图分析方法进行了对比测试,测试结果表明基于内容的意图分析方法在召回率和精确率上可以比传统方法分别平均提高2%和0.5%,由此可以表明通过使用二者相结合的手段,可以更好的识别垃圾邮件。最后,本文对该方法进行了总结,从实验结果中分析了该方法的不足和有待改进之处,为下一步的工作提供借鉴。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|