基于深度学习的服装商品评论细粒度情感分析
【摘要】:在互联网时代,电子商务蓬勃发展,随之孕育而生的商品评论可以给商家和消费者带来不同的影响。对商家而言,根据消费者的反馈来改进和设计后续商品;对消费者而言,参考消费者的反馈从而购买到满意的商品。文本情感分析是研究商品评论常用的手段之一,根据分析对象级别的不同,可分为粗粒度情感分析和细粒度情感分析。相比于粗粒度商品评论情感分析而言,细粒度商品评论情感分析能够更加具体地了解商品的优缺点,为买家提供有力的参考依据,方便卖家在产品质量和造型方面进行改进,是现在文本分析的难点之一。细粒度商品评论情感分析的关键在于精准的抽取评价对象以及对其的相关描述,目前存在着低频评价对象提取率低和局部情感词发现困难等问题,本文提出了结合外部知识的服装商品评论中评价对象和情感词的抽取方法来解决上述问题。细粒度商品评论情感分析的重点在于对评价对象的相关描述进行情感分类,深度学习方法的情感分类效果好,但是难以有针对性的学习文本的深层特征。本文提出了基于多层特征融合的长短期记忆网络进行细粒度情感分析模型来解决上述问题。(1)本文提出了结合外部知识的服装商品评论中评价对象——情感词的关联组合抽取方法。引入评价对象的概念层次树将服装设计细划为造型、材质、色彩和做工等中层评价对象和修身、性感、弹性、质感、手艺等207个底层评价对象,用中文近义词工具包Synonyms对中层和底层评价对象进行扩展,组建了四个中层评价对象词典;鉴于不同年龄段、不同季节和不同性别的消费者对服装需求存在差异,同一个情感词可能会表现出多种情感极性,故在构建领域情感词典外引入多极性情感词典。按照标点符号把商品评论拆分成若干短句,使用词性规则、依存句法和特征词典来抽取短句中存在的评价对象和情感词,采用经典的关联组合来刻画它们之间的关联关系。在服装商品评论数据集上进行了验证,结果表明对评价对象和情感词抽取的整体准确率能达到89.2%。(2)本文提出了基于多层特征融合的长短期记忆网络细粒度情感分析MLFF-Bi LSTM(Bi LSTM Based on Multi-level Features Fusion)模型,通过深度学习方法学习服装商品评论的深层特征,深层特征由情感极性特征和上下文语义特征组成。(1)本文认为评论文本的情感极性不仅与情感词有关,还与评价对象有关,分别从评价对象和情感词两个方面进行抽取。基于评价对象的情感极性特征抽取是将评论文本的句向量送入双向长短期记忆网络中学习特征,结合关联组合中评价对象的词向量获取注意力权重进行特征筛选;基于情感词的情感极性特征抽取是将关联组合中的否定词、程度副词和情感词的词向量进行拼接构建输入向量,送入双向长短期记忆网络学习特征,再通过最大池化构建注意力机制来筛选出重要特征。(2)上下文语义特征抽取:将评论的句向量以及评价对象、程度副词、否定词和情感词组成的组合向量进行拼接,送入双向长短期记忆网络学习,并通过平均池化构建注意机制筛选出对应的整体特征。该模型通过Bert(Bidirectional Encoder Representation from Transformers)模型对评论文本进行向量化表示,再结合外部知识抽取服装商品评论文本的关联组合表示,结合Bert向量和关联组合表示使用双向长短期记忆网络和注意力机制学习文本的深层特征,将学习到的深层特征融合完成情感分析任务。在本文构建的服装商品评论数据集上进行了验证,结果表明本文提出的MLFF-Bi LSTM能充分地学习评论文本中的情感极性特征和上下文语义特征,实验效果比传统CNN和LSTM模型取得了更好的效果,提升了情感分类效果和模型的可解释性。