基于细粒度的网络媒体情感分析
【摘要】:随着互联网的普及,越来越多的人们选择在网络媒体上发表自己的观点和意见,其涉及的内容已成为网络用户在日常生活和工作中不可或缺的信息来源。如何进一步提升计算机在处理、理解以及运用人类语言包含的情感信息成为当今人们关注的热点。与只关注文本整体情感相比,网络媒体的评论涉及较为复杂的细节信息。因此需要从细粒度的角度挖掘分析和分析网络媒体评论的情感倾向。不过,目前在细粒度情感分析任务上仍存着对复杂语境中的情感表达能力有限,捕获长文本语义的关联性困难、模型的泛化能力差和分类准确率低等问题。基于上述问题,本文提出了一种基于ERNIE(Enhanced Representation through Knowledge Integration)、DPCNN(Deep Pyramid Convolutional Neural Networks)神经网络的细粒度网络媒体情感分析模型。首先,针对BERT预训练语言模型无法很好地捕捉输入样本的局部语义信息以及长文本的依赖关系。在文本向量方法上该模型使用了ERNIE预处理语言模型,通过添加更多优质语料,融合更多外部知识信息,可以解决长距离中文语义问题。其次,在文本分类中,Text CNN网络无法捕捉长距离文本间的语意关系。通过DPCNN网络的构建,加深了网络的深度,能够较好地提取长距离文本间的相关语意。通过实验的准确率、损失函数值,对比细粒度情感分析模型的效果。实验结果表明,针对情感复杂度高、文本多元化的网络媒体评论,本文设计的基于ERNIE-DPCNN细粒度情感分析模型的判别准确率更高,测验结果更加符合用户所表达的真实情感。