收藏本站
《大连理工大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义表示的多视图短文本序列分类研究

孙铭阳  
【摘要】:序列数据作为常见的数据类型,既拥有相邻子序列间的局部特征,又包含整体序列的全局特征。短文本可以被看成是由词组成的特殊序列,现有的短文本序列表示方法忽视了词间强语义组合的存在,造成显著特征的丢失,并且现有短文本分类方法忽视了数据间的高阶语义关联。此外,现有的分类方法仅基于短文本序列中的局部或全局特征,单一视图难以全面描述数据固有的特征。本文将针对上述问题展开研究工作。本文以短文本序列的有效表示为出发点,提出了基于语义表示的短文本序列分类算法,利用短文本间的高阶语义关联进行分类决策。算法首先采用改进的密度聚类算法对预训练的词向量进行聚类,然后利用聚类结果挖掘文本序列中潜在的语义单元,将原始文本表示成语义单元序列,完成短文本序列的语义表示。随后使用卷积神经网络学习序列中的局部高阶特征表示,并以此构建超图模型,利用样本间的高阶语义关联,实现短文本序列的分类。为了学习短文本序列中更全面的特征表示,进一步提高分类模型的可靠性,本文提出了短文本序列的多视图特征学习算法。该算法利用两种深度计算模型,构建集成的短文本序列建模方式,提取数据中的全局特征。然后利用深度典型相关分析将局部与全局特征进行融合,得到第三视图融合特征表示。进而构建多视图超图模型,利用样本间多视图特征的高阶关联,完成短文本序列的分类任务。本文在五个基准数据集上对基于语义表示的短文本序列分类算法进行验证。实验结果表明,所提出的短文本表示方法,以及超图对样本间高阶关联的挖掘,可以有效提升分类准确率。在相同的数据集上,使用提出的多视图特征学习方法提取短文本序列中的全局特征和融合特征,并对多视图分类模型进行评估。结果表明,多视图特征有助于模型性能的提升。此外,本文对所提出的序列分类框架在航空发动机故障诊断中的应用进行了初探,并取得了较满意的结果。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 小米;;818型海警巡逻舰多视图[J];军事文摘;2016年18期
2 田泽;杨明;陈哲;石爱业;;基于视图内字典原子不一致的多视图字典学习算法[J];南京信息工程大学学报(自然科学版);2019年03期
3 段桂江;孙飞;唐晓青;;集成质量系统与企业资源计划系统的多视图融合机制研究[J];计算机集成制造系统;2005年12期
4 邓强;杨燕;王浩;;一种改进的多视图聚类集成算法[J];计算机科学;2017年01期
5 罗爱民;罗雪山;黄力;;基于多视图的信息系统体系结构描述方法研究[J];计算机科学;2007年02期
6 李波;赵健康;戴金海;;飞行器设计并行工程中多视图响应分析[J];计算机仿真;2006年09期
7 胡树根,李涨生,卓守鹏,董进;一种基于约束的多视图尺寸驱动方法及实现[J];中国机械工程;1998年07期
8 石艳玲;单文档多视图的多种实现方式[J];计算机应用研究;1999年10期
9 洪敏;贾彩燕;李亚芳;于剑;;样本加权的多视图聚类算法[J];计算机研究与发展;2019年08期
10 邱立坤;金澎;王厚峰;;基于依存语法构建多视图汉语树库[J];中文信息学报;2015年03期
中国重要会议论文全文数据库 前8条
1 张秀芬;裴承慧;胡志勇;;在OpenGL中实现多视图表示[A];第十四届全国图学教育研讨会暨第六届制图CAI课件演示交流会论文集(下册)[C];2004年
2 赵旭;刘克;吴威;;多视图三维重建技术和不确定问题[A];第八届中国不确定系统年会论文集[C];2010年
3 唐帅;项志宇;马子昂;;基于多视图一致性低秩稀疏学习的视频目标跟踪[A];浙江省信号处理学会2015年学术年会论文集[C];2015年
4 葛冰峰;陈英武;廖良才;舒宇;;基于多视图的武器装备体系结构描述方法研究[A];和谐发展与系统工程——中国系统工程学会第十五届年会论文集[C];2008年
5 李诚;陈志军;;基于多视图像的岩心三维建模与虚拟展示初探[A];第十三届全国数学地质与地学信息学术研讨会论文集[C];2014年
6 张岩;杨冬青;唐世渭;;Web仓储中的多视图一致性维护[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 张强;梁奎;陈志军;;多视图立体视觉的岩矿手标本三维重建与三维交互设计[A];第十三届全国数学地质与地学信息学术研讨会论文集[C];2014年
8 颜志军;;基于UML的多视图动态企业模型框架研究[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 王强;多视图机器学习分类及聚类算法研究[D];国防科技大学;2018年
2 韩璐;多视图的子空间学习及在图像分类中的应用研究[D];南京邮电大学;2018年
3 董西伟;有监督和半监督多视图特征学习方法研究[D];南京邮电大学;2018年
4 王岳青;多视图学习算法和应用研究[D];国防科学技术大学;2017年
5 朱信忠;多视图聚类算法研究[D];西安电子科技大学;2018年
6 周彬;多视图视觉检测关键技术及其应用研究[D];浙江大学;2019年
7 吴飞;多视图特征学习方法研究[D];南京邮电大学;2016年
8 沈肖波;多视图嵌入学习方法及其应用研究[D];南京理工大学;2017年
9 钱强;复杂场景下的多视图学习方法研究[D];南京航空航天大学;2013年
10 李晋;基于多视图鉴别特征学习的分类算法[D];中国矿业大学(北京);2016年
中国硕士学位论文全文数据库 前10条
1 何云;面向多视图数据的降维与聚类算法研究[D];南京师范大学;2019年
2 胡梦磊;不完整多视图聚类[D];南京航空航天大学;2019年
3 姬名书;基于稀疏嵌入框架的不完全多视图聚类[D];南昌大学;2019年
4 周扬;缆索表面图像拼接与多视图重建研究[D];哈尔滨工业大学;2019年
5 陈东皓;车辆检测和识别系统的设计与实现[D];中国电子科技集团公司电子科学研究院;2019年
6 黄静;加权多视图子空间聚类算法研究[D];广东工业大学;2019年
7 孙铭阳;基于语义表示的多视图短文本序列分类研究[D];大连理工大学;2019年
8 仇希如;基于非负矩阵分解的多视图特征学习研究[D];大连理工大学;2019年
9 殷勤;多视图归纳矩阵补全算法及应用研究[D];南京邮电大学;2019年
10 庞石伟;多视图数据分类研究[D];西安电子科技大学;2019年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026