收藏本站
《山东师范大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

基于知识图谱的虚假评论检测方法研究

房有丽  
【摘要】:目前,电子商务在日常生活中扮演着非常重要的角色。而在线评论在电子商务应用中起着至关重要的作用,它帮助人们比较产品的质量、评估商店的服务,并作为消费者购买决策的依据。但是,由于利益的驱动,商家开始雇佣水军冒充普通顾客伪造评论,试图通过虚假的评论来误导消费者。一方面对自己的商品进行好评,另一方面对于竞争者恶意诋毁。虚假评论的存在,使营造公平公正的网络购物环境带来了巨大挑战。因此,如何有效识别虚假评论成为亟待解决的网络安全问题之一。许多工作者专注于研究虚假评论的检测方法,所研究的成果在帮助用户提供合理购物决策同时对商家良性竞争有指导意义。尽管研究人员对虚假评论检测取得了很大进展,但依旧存在很多不足之处。首先,研究成果没有挖掘评论文本的多维特征以及与评分之间的一致性问题;其次,忽略了评论数量及评分与时间序列存在隐含关系;最后,没有考虑多模网络特征对识别虚假评论的影响。所以,目前的研究算法对虚假评论的识别仍旧存在很大问题。针对以上对虚假评论检测存在的问题,本文提出并深入研究一种基于知识图谱的虚假评论检测方法。本文主要工作如下:(1)提出一种基于评分-文本一致性的虚假评检测方法。首先,分析评论文本的情感极性,考虑情感强度、特征影响度对文本极性的影响,并判断文本极性与评分的一致性;其次,通过分析多源特征简化特征集,进而提取5个重要的虚假评论检测特征;最后,融合抽取的多个虚假评论特征,构建出虚假评论检测分类器。该方法是计算知识图谱中评论真实性的重要前提。(2)提出一种基于多维时间序列的虚假评论识别方法。首先,在评分和评论数量两个维度上,借助于贝叶斯算法,拟合一条曲线时间序列曲线;其次,设置滑动时间窗口并使用模板匹配算法检测拟合曲线突发模式;最后,比较突发时间段的评分与评论数量的一致性。该方法是根据评论数量及评分突然上升或下降的特点提出的,不但能高效率的检测虚假评论而且有效的检测商铺刷单问题。(3)提出一种基于动态知识图谱的虚假评论检测方法。首先,构建了多粒度双向LSTM(ST-BLSTM)网络模型,用以抽取包含评论者、评论、商品和店铺的四类实体;其次,定义了实体间的关系度量并探讨了四类实体之间的联系;然后,考虑了时间因素对虚假评论的影响,设计了一个迭代模型,在关系抽取中加入时间特征,构建动态图谱网络;最后,定义4个新指标,以有效衡量四类节点间的相互影响关系,并据此构建出虚假评论检测分类器。此外,为支持本文的创新性,本文利用八爪鱼数据器采集了大量多特征评论数据集。该数据集弥补了当前数据单模且信息不完善的缺点。该数据集包含用户、评论、商品、店铺以及评论时间等多模特征信息。数据采集过程主要步骤如下:首先,通过目前虚假评论特点和查找文献,检验本文采集信息源的合理性;再次,针对原始数据进行标准化并进行多模特征相关性分析;最后,验证多模特征信息对在虚假评论检测的重要性。
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F713.36;TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 饶鲜;杨绍全;魏青;董春曦;;基于熵的入侵检测特征参数选择[J];系统工程与电子技术;2006年04期
2 龙啸;方勇;黄诚;刘亮;;Webshell研究综述:检测与逃逸之间的博弈[J];网络空间安全;2018年01期
3 沈通;吴志军;张建富;杨建新;曾龙;;数控加工原位检测系统中检测规划关键技术研究[J];制造技术与机床;2018年08期
4 张少擎;;基于MBD的数字化零件检测技术研究[J];航空制造技术;2014年21期
5 王通;郭渊博;祝松帅;严新成;;基于大数据的APT威胁检测方法[J];信息工程大学学报;2017年06期
6 刘素芳,凌云,曹致刚,程玉香,姜雪波,曾蓉嘉,陈雪莲,贾铭章;全自动酶标分析系统对抗-HCVEIA检测特征性的影响[J];中国输血杂志;2000年01期
7 周颖;胡勇;;基于关联分析的Webshell检测方法研究[J];信息安全研究;2018年03期
8 欧凡;刘冲;;人脸图像灰度分布统计分析与检测特征设计[J];大连理工大学学报;2010年04期
9 申家全;闫怀志;胡昌振;;探地雷达目标检测中的离散余弦变换方法[J];仪器仪表学报;2011年06期
10 刘丽冰;桑宏强;陈英姝;张红梅;田大伟;;用于加工中心的在线检测新方法研究[J];新技术新工艺;2005年11期
中国重要会议论文全文数据库 前1条
1 侯长军;彭承琳;罗伟;霍丹群;段玉娟;罗小刚;法焕宝;;卟啉传感的肺病早期诊断技术研究[A];中国仪器仪表学会医疗仪器分会第四次全国会员代表大会暨2009年学术年会论文集[C];2009年
中国重要报纸全文数据库 前2条
1 ;如何解决误报率问题[N];中国计算机报;2002年
2 本报记者 耿挺;两小时让H7N9原形毕露[N];上海科技报;2013年
中国博士学位论文全文数据库 前3条
1 张治国;前方道路行人检测和距离估计研究[D];华中科技大学;2017年
2 许舟军;基于异常分析的入侵检测关键技术研究[D];天津大学;2006年
3 滕少华;基于对象监控的分布式协同入侵检测[D];广东工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 李昭青;基于视频的行人检测研究[D];山东大学;2019年
2 吴楚婷;基于用户网络数据指纹的异常行为检测研究[D];北京邮电大学;2019年
3 房有丽;基于知识图谱的虚假评论检测方法研究[D];山东师范大学;2019年
4 毛科栋;基于深度学习的房颤检测[D];浙江工业大学;2019年
5 李承前;基于深度学习的行人检测方法的研究[D];中国石油大学(华东);2017年
6 高苗;基于姿态分析的摔倒检测研究与实现[D];上海师范大学;2019年
7 刘广峰;基于车载摄像头的行人检测算法研究[D];吉林大学;2018年
8 刘清波;基于深度学习的行人检测研究[D];湖南大学;2018年
9 苏博文;基于HOG3D的三维CT腹部器官检测[D];哈尔滨工业大学;2018年
10 刘李正;基于Kinect的人体跌倒检测算法研究[D];南京邮电大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026