收藏本站
《山西大学》 2020年
收藏 | 手机打开
二维码
手机客户端打开本文

基于序列标注的汽车产品对象抽取方法研究

王佳  
【摘要】:面向汽车的产品评论是指用户在微博、论坛、微信公众号等平台发表自己对汽车的价格、性能、动力、外观等方面的主观使用感受。在汽车评论中,用户评论产品时经常带有明确的指向,往往针对特定产品的某一部分或某一功能做出具体评价。因此,挖掘汽车产品评论中的汽车名称及属性,对于汽车厂商和消费者具有重要的商业价值。本文将汽车名称和属性统称为产品对象,这样,抽取评论中的产品对象也是产品评论分析的基本任务,更是细粒度情感分析的重要研究问题。已有的研究多是针对评价产品名称进行单独抽取,并没有考虑产品的名称和属性。本文针对汽车评论中产品对象的抽取问题,以实现产品评论细粒度情感分析为目标,开展汽车的产品名称和产品属性的抽取方法研究。本文的主要工作有以下三点:(1)相关技术和数据标注规范对中文文本表示基础理论以及汽车产品名称与属性抽取相关技术进行了分析,并对数据标注规范进行了介绍。首先对中文文本表示相关方法Word2vec模型和Cw2vec模型进行了介绍。通过分析评论数据的特点,制定相应的数据标注规范,为实验数据的标注提供了标准。(2)融合多特征的产品对象抽取方法将产品对象的抽取看作是一个序列标注问题,提出一种基于词向量和条件随机场(Conditional random field,简称CRF)的产品对象抽取方法。在此模型中,在选择词特征、词性特征、词长特征以及词语的左右信息熵、互信息作为统计特征,在此基础上,计算出词语的词向量与汽车领域词表的词向量之间的相似度,将相似度特征引入CRF模型中,设计了融合多种特征的基于CRF模型的产品对象抽取方法,并在产品对象抽取数据集上取得了较好的结果。(3)基于cw2vec-BiLSTM-CRF的产品名称和属性识别方法针对产品评论数据中用户希望获取更细粒度的产品名称和属性问题,设计了基于cw2vec-BiLSTM-CRF的产品对象识别方法。首先使用了cw2vec模型对中文文本进行表示,在此基础上,利用双向长短期记忆模型融合了条件随机场模型对产品中的名称和属性进行识别。该方法利用长短期记忆模对上下文信息进行有效建模,同时利用条件随机场模型作为标签推理层较好地解决序列标签的依赖问题。通过在汽车领域数据上进行实验,实验结果表明cw2vec-BiLSTM-CRF模型在产品名称和产品属性识别任务是有效的。
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2020
【分类号】:TP391.1

知网文化
【参考文献】
中国期刊全文数据库 前5条
1 郑敏洁;雷志城;廖祥文;陈国龙;;基于层叠CRFs的中文句子评价对象抽取[J];中文信息学报;2013年03期
2 陈飞;刘奕群;魏超;张云亮;张敏;马少平;;基于条件随机场方法的开放领域新词发现[J];软件学报;2013年05期
3 王荣洋;鞠久朋;李寿山;周国栋;;基于CRFs的评价对象抽取特征研究[J];中文信息学报;2012年02期
4 宋晓雷;王素格;李红霞;;面向特定领域的产品评价对象自动识别研究[J];中文信息学报;2010年01期
5 贾美英;杨炳儒;郑德权;杨靖;;采用CRF技术的军事情报术语自动抽取研究[J];计算机工程与应用;2009年32期
中国硕士学位论文全文数据库 前8条
1 邹爱玲;基于法律的知识图谱构建[D];电子科技大学;2019年
2 王林木;司法文书法律要素提取方法的研究与实现[D];东南大学;2018年
3 王礼敏;面向法律文书的中文命名实体识别方法研究[D];苏州大学;2018年
4 谢云;面向中文法律文本的命名实体识别研究[D];南京师范大学;2018年
5 周晓辉;基于隐式马尔科夫模型的法律命名实体识别模型的设计与应用[D];华南理工大学;2017年
6 杨森;基于领域知识的评价对象抽取研究[D];北京理工大学;2015年
7 冯小翼;在线评论的产品属性提取与情感分析研究[D];华中科技大学;2011年
8 鞠久朋;评价对象抽取研究[D];苏州大学;2011年
【共引文献】
中国期刊全文数据库 前10条
1 钟敏娟;万常选;刘德喜;;基于关联规则挖掘和极性分析的商品评论情感词典构建[J];情报学报;2016年05期
2 王洪伟;蒋文瑛;高松;华瑾;;面向竞争力分析的中文在线评论的比较观点识别:以餐饮业为例[J];情报学报;2015年12期
3 刘丽;王永恒;韦航;;面向产品评论的细粒度情感分析[J];计算机应用;2015年12期
4 宋佳颖;贺宇;付国宏;;领域相关的汉语情感词典扩展[J];中文信息学报;2015年06期
5 何炎祥;刘健博;孙松涛;文卫东;;基于层叠条件随机场的微博商品评论情感分类[J];山东大学学报(理学版);2015年11期
6 陈锋;;细颗粒度观点挖掘中的观点句识别与要素抽取研究综述[J];数字图书馆论坛;2015年10期
7 孙晓;孙重远;任福继;;基于深层结构模型的新词发现与情感倾向判定[J];计算机科学;2015年09期
8 丁杰;吕学强;刘克会;;基于边界标记集的专利文献术语抽取方法[J];计算机工程与科学;2015年08期
9 徐娟;曹晔;张奇;;面向自由文本的中文地址规范化[J];计算机应用与软件;2015年08期
10 郝志峰;杜慎芝;蔡瑞初;温雯;;基于全局变量CRFs模型的微博情感对象识别方法[J];中文信息学报;2015年04期
中国硕士学位论文全文数据库 前10条
1 王佳;基于序列标注的汽车产品对象抽取方法研究[D];山西大学;2020年
2 张悦;基于评论情感分析和销量预测的外贸电商选品研究[D];北京交通大学;2019年
3 林义孟;面向司法领域的命名实体识别研究[D];云南财经大学;2019年
4 王玥;基于深度学习的命名实体识别研究[D];云南财经大学;2019年
5 吴红健;商场室内空间知识图谱构建与查询应用[D];大连海事大学;2019年
6 邹爱玲;基于法律的知识图谱构建[D];电子科技大学;2019年
7 周双月;基于句法结构和依存关系的评价对象提取方法研究[D];辽宁工程技术大学;2018年
8 黄学波;基于NLP的企业产品信息提取分析和推荐的研究与实现[D];青岛理工大学;2018年
9 胡征;面向网络评论的细粒度意见挖掘的研究与应用[D];东华大学;2018年
10 张磊;搜索—体验复合型智能硬件产品的顾客满意度模型研究[D];武汉大学;2018年
【二级参考文献】
中国期刊全文数据库 前10条
1 徐冰;赵铁军;王山雨;郑德权;;基于浅层句法特征的评价对象抽取研究[J];自动化学报;2011年10期
2 张莉;钱玲飞;许鑫;;基于核心句及句法关系的评价对象抽取[J];中文信息学报;2011年03期
3 杨晓东;晏立;尤慧丽;;CCRF与规则相结合的中文机构名识别[J];计算机工程;2011年08期
4 刘鸿宇;赵妍妍;秦兵;刘挺;;评价对象抽取及其倾向性分析[J];中文信息学报;2010年01期
5 宋晓雷;王素格;李红霞;;面向特定领域的产品评价对象自动识别研究[J];中文信息学报;2010年01期
6 贾美英;杨炳儒;郑德权;杨靖;;采用CRF技术的军事情报术语自动抽取研究[J];计算机工程与应用;2009年32期
7 郭剑毅;薛征山;余正涛;张志坤;张宜浩;姚贤明;;基于层叠条件随机场的旅游领域命名实体识别[J];中文信息学报;2009年05期
8 章剑锋;张奇;吴立德;黄萱菁;;中文观点挖掘中的主观性关系抽取[J];中文信息学报;2008年02期
9 刘康;赵军;;基于层叠CRFs模型的句子褒贬度分析研究[J];中文信息学报;2008年01期
10 赵世奇;刘挺;李生;;一种基于主题的文本聚类方法[J];中文信息学报;2007年02期
中国硕士学位论文全文数据库 前10条
1 王礼敏;面向法律文书的中文命名实体识别方法研究[D];苏州大学;2018年
2 彭乾慧;领域知识图谱的自动化构建[D];重庆大学;2017年
3 王蕾;基于神经网络的中文命名实体识别研究[D];南京师范大学;2017年
4 朱游娟;初中数学问题的全知识图谱设计与实现[D];电子科技大学;2016年
5 吴琼;中文时间表达式自动识别的研究[D];大连理工大学;2015年
6 程志刚;基于规则和条件随机场的中文命名实体识别方法研究[D];华中师范大学;2015年
7 王龙龙;Web实体事件重复检测问题研究[D];山东大学;2014年
8 熊佳茜;基于CRF的中文微博交通信息事件抽取[D];上海交通大学;2014年
9 孙虹;中文地名识别研究[D];太原理工大学;2013年
10 王荣洋;评价对象抽取关键技术研究[D];苏州大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 徐枞巍;科学技术发展与面向产品对象的工科学科建设[J];高等工程教育研究;1995年02期
2 ;年轻派营销怎么做?[J];销售与市场(渠道版);2017年12期
3 姚振强,张雪萍;机械产品对象的系统性设计策略[J];机械工程学报;2000年06期
4 史阿云 ,何永熹 ,赵淑红;PDM中产品信息管理模型的研究[J];CAD/CAM与制造业信息化;2002年08期
5 ;面向SOA构架的PLM——Siemens PLM Software大中华区执行副总裁寿宇澄[J];中国制造业信息化;2008年02期
6 汪洋;钱贵平;张宇;;基于PDM的集成化CAPP系统研究[J];电脑学习;2006年03期
7 金政华,李莉敏,方明伦;基于PDM的集成化CAPP系统的研究和开发[J];上海大学学报(自然科学版);1999年01期
8 连殿冬;;刍议我国体育产品的营销策略[J];中国商贸;2012年21期
9 凌冉;PDM的应用与集成[J];上海微型计算机;2001年03期
10 徐彬炎;;組織混合工作組是改善劳动組織的一个好办法[J];劳动;1956年11期
中国重要会议论文全文数据库 前10条
1 卞真旭;;一种关键词抽取方法研究[A];2011年安徽省智能电网技术论坛论文集[C];2011年
2 宋涛;李素建;;基于流形排序的领域词抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 罗斐;毛宇光;;基于领域分类的查询接口模式抽取方法[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
4 王裴岩;张桂平;白宇;;一种基于核函数的技术关键词连接关系抽取方法[A];第六届全国信息检索学术会议论文集[C];2010年
5 刘昊;王健;林鸿飞;;一种模板与图核融合的蛋白质关系抽取方法[A];第六届全国信息检索学术会议论文集[C];2010年
6 吴楠;王庆林;刘禹;;基于百科词条的领域本体关系抽取方法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
7 栗春亮;朱艳辉;徐叶强;;中文产品评论中属性词抽取方法研究[A];第六届全国信息检索学术会议论文集[C];2010年
8 张龙凯;王厚峰;;文本摘要中的句子抽取方法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 翁伟;王厚峰;;基于LDA的关键词抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 张苇如;孙乐;韩先培;;基于维基百科和模式聚类的实体关系抽取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国重要报纸全文数据库 前6条
1 王世焕;我国CIMS技术取得新进展[N];中国机电日报;2000年
2 聂斐斌;衡冶节能试走多条路[N];中国工业报;2003年
3 ;立法还须考虑国情[N];中华工商时报;2004年
4 储备 蔡青;协同呼唤NCAD[N];中国计算机报;2002年
5 施成;现代集成制造系统技术取得新进展[N];中国乡镇企业报;2000年
6 记者 蔡瑰;湖北分行请低质低效产品“出局”[N];中国城乡金融报;2006年
中国博士学位论文全文数据库 前6条
1 秦彦霞;多层次表达的事件抽取方法研究[D];哈尔滨工业大学;2018年
2 路扬;面向小样本不平衡数据的生物医学事件抽取方法研究[D];吉林大学;2019年
3 李昊迪;医学领域知识抽取方法研究[D];哈尔滨工业大学;2018年
4 康旭琴;疾病相关实体关联抽取方法研究[D];军事科学院;2018年
5 刘胜宇;生物医学文本中药物信息抽取方法研究[D];哈尔滨工业大学;2016年
6 李丽双;领域本体学习中术语及关系抽取方法的研究[D];大连理工大学;2013年
中国硕士学位论文全文数据库 前10条
1 王佳;基于序列标注的汽车产品对象抽取方法研究[D];山西大学;2020年
2 周锐;基于PDM的异地产品协同开发技术与实施方法研究[D];清华大学;2002年
3 原旎;医学疾病表型实体及其关系抽取方法研究[D];北京交通大学;2019年
4 王亚岛;基于远程监督的关系抽取方法研究[D];哈尔滨工业大学;2019年
5 吴文涛;基于表示学习的事件抽取方法研究[D];苏州大学;2019年
6 丁志远;基于证据匹配的案件质量评估方法设计与实现[D];贵州大学;2019年
7 谢文慧;基于图结构的实体关系抽取方法研究[D];吉林大学;2019年
8 AUNG HLA MOE(张家富);基于汉-缅双语语料的双语实体抽取方法研究[D];昆明理工大学;2018年
9 周伟光;基于位置标签的复合词抽取方法研究[D];湖南大学;2015年
10 郭柏宽;X射线类同轴相衬成像的相位抽取方法及质量评价研究[D];天津大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026