收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

惩罚性矩阵分解及其在文本主题聚类中的应用

冯世佳  
【摘要】:文本信息的合理表示对文本主题聚类、信息检索等的研究有重要作用。在传统向量空间模型(VSM)的基础上,共现潜在语义向量空间模型(CLSVSM)运用共现分析深度挖掘了特征词之间的潜在语义信息,使文本聚类效果得到提高。然而,随着文本资源数量的增加,表达模型的维数较高,致使模型稀疏和计算复杂。虽然基于CLSVSM构建的语义核函数,合并了词间的语义信息,但仍未充分提取核心特征词之间的语义信息,且维数不低。针对此问题,本文利用惩罚性矩阵分解(PMD)对文本表示模型进一步研究,以提高文本主题聚类的精度。首先,本文将惩罚性矩阵分解应用于文本向量空间模型VSM和CLSVSM中,利用该矩阵分解方法对文本表示向量进行稀疏约束,提取核心特征词,进而实现原始数据的重建,增强其解释性。其次,通过共现分析理论,在PMD的基础上构建语义核函数(PMD_K),深度挖掘核心特征词之间的语义信息。最后,考虑到数据结构复杂、异常值多相关的特征,而引入L_(2,1)范数进行去噪,提出基于L_(2,1)范数的惩罚性矩阵分解算法(L_(2,1)PMD),从而更有效地对数据进行处理,也避免了经典算法在此领域的不足。实验中选用了自采数据和公开数据,基于上述方法进行文本主题聚类实验。实验结果表明,本文所提出方法的聚类效果均明显优于传统方法,PMD_K方法在英文数据集中较以往的95%CLSVSM_K方法,_1F值提高了21.9%。基于L_(2,1)范数的PMD算法的聚类纯度、_1F值在文本数据集中分别较PMD算法提高了4.1%和5.4%,熵值降低了9.3%,充分说明了该算法的有效性。将PMD应用于文本表示模型,在提高了文本主题聚类效率和精度的同时,还避免了对高维矩阵的复杂运算。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 牛奉高;冯世佳;黄琛;;基于CLSVSM的惩罚性矩阵分解及其在文本主题聚类中的应用[J];计算机与现代化;2021年05期
2 林思岑;;基于去相关化的低秩矩阵分解对口语能力的评估方法[J];微型电脑应用;2021年02期
3 郭磊;余文森;吴清寿;;融合信任关系的联合矩阵分解推荐算法仿真[J];计算机仿真;2021年02期
4 袁晓峰;钱苏斌;周彩根;;基于填充先验约束的矩阵分解算法[J];南京大学学报(自然科学);2021年02期
5 田震;潘腊梅;尹朴;王睿;;深度矩阵分解推荐算法[J];软件学报;2021年12期
6 黄继风;白国臣;熊乃学;魏建国;;基于低秩稀疏矩阵分解的非接触心率估计[J];图学学报;2020年01期
7 周双;宾晟;孙更新;;融合多关系的矩阵分解社会化推荐算法[J];复杂系统与复杂性科学;2020年01期
8 杨金劳;刘虹明;;群组信息优化矩阵分解的群组推荐方法[J];机械设计与制造;2020年04期
9 宋玉龙;马文明;刘彤彤;;基于概率矩阵分解的组推荐系统研究[J];电子技术与软件工程;2020年11期
10 尹青山;;基于群组信息改进矩阵分解的群组推荐方法[J];计算机应用与软件;2020年09期
11 王宇;韦锦涛;;基于图正则化协同矩阵分解预测miRNA-疾病关联[J];电子技术与软件工程;2020年19期
12 王建芳;张朋飞;谷振鹏;刘冉东;;一种优化的带偏置概率矩阵分解算法[J];小型微型计算机系统;2017年05期
13 蔡国永;夏彬彬;;基于联合矩阵分解的图像情感分析研究[J];小型微型计算机系统;2017年05期
14 田贤忠;沈杰;;大数据环境下基于概率矩阵分解的个性化推荐[J];计算机科学;2017年S1期
15 彭鹏;米传民;肖琳;;基于用户信任和兴趣的概率矩阵分解推荐方法[J];计算机系统应用;2017年09期
中国重要会议论文全文数据库 前8条
1 黄奕晖;赵金奎;王孜;郭迪;屈小波;;人工智能与快速磁共振波谱:深度低秩Hankel矩阵分解[A];2021第二十一届全国波谱学学术年会论文摘要集[C];2020年
2 丁秉公;黄昌宁;黄德根;;文本主题识别研究及应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 胡岸勇;柳重堪;苗俊刚;万国龙;;基于降晰矩阵分解与POCS的高斯降晰图像复原[A];全国第二届信号处理与应用学术会议专刊[C];2008年
4 史铭;张焰;陈立佳;;基于Spark框架的文本主题特征提取与分类[A];中国新闻技术工作者联合会2015年度“新闻科技论文”优秀论文集[C];2015年
5 钟茂生;;文本主题分割技术的研究进展[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 郭亦鸿;曾楠;何宏辉;何永红;马辉;;各向异性介质的穆勒矩阵分解偏振光学特征[A];中国光学学会2011年学术大会摘要集[C];2011年
7 李叶青;丁帅;黄辉;汪家欣;;考虑隐含相似关系医生推荐方法研究[A];第十九届中国管理科学学术年会论文集[C];2017年
8 王春江;王人鹏;钱若军;王颖;;矩阵分解技术在体系性态综合分析中的初步应用[A];“力学2000”学术大会论文集[C];2000年
中国博士学位论文全文数据库 前20条
1 房毅宪;基于矩阵分解的跨模态检索研究[D];山东师范大学;2019年
2 代祥光;矩阵分解相关模型的优化算法研究[D];西南大学;2018年
3 宋凯嵩;基于矩阵分解的社会媒体文本个性化情感分析技术研究[D];东北大学;2017年
4 李雪;基于流形嵌入的矩阵分解算法研究[D];南京理工大学;2017年
5 赵谦;具有稀疏与稳健特性的低秩矩阵分析方法研究[D];西安交通大学;2018年
6 赵科科;低秩矩阵分解的正则化方法与应用[D];浙江大学;2012年
7 郭亦鸿;利用穆勒矩阵分解定量测量各向异性介质微观结构[D];清华大学;2014年
8 徐振兴;基于地理标注照片的景点推荐方法研究[D];浙江大学;2017年
9 胡祥;融合社会辅助信息的社会化推荐研究[D];北京邮电大学;2017年
10 王小芳;文本主题域划分与无监督特征提取[D];吉林大学;2009年
11 闫文;社交与信息网络中的数据挖掘研究[D];东南大学;2020年
12 傅慧妮;前景检测前沿技术研究[D];国防科技大学;2020年
13 常鹏;基于词共现的文本主题挖掘模型和算法研究[D];天津大学;2010年
14 张维玉;社交网络链路预测方法研究[D];北京邮电大学;2016年
15 肖延辉;基于矩阵分解的图像表示理论及其应用研究[D];北京交通大学;2014年
16 吴宾;多样化数据的推荐方法研究[D];郑州大学;2020年
17 张伟娜;基于深度学习与矩阵分解的推荐算法研究[D];华南理工大学;2020年
18 周望;基于机器学习的推荐系统关键技术及其应用研究[D];电子科技大学;2020年
19 李方方;非独立同分布推荐系统研究[D];北京理工大学;2014年
20 沈筱譞;深度学习推荐方法及应用研究[D];华中师范大学;2020年
中国硕士学位论文全文数据库 前20条
1 冯世佳;惩罚性矩阵分解及其在文本主题聚类中的应用[D];山西大学;2021年
2 董芮冰;基于融合深度学习和矩阵分解的推荐系统研究[D];厦门大学;2019年
3 张晓婷;基于稀疏梯度与结构化矩阵分解的显著性目标检测[D];深圳大学;2019年
4 李幸幸;基于集成学习的推荐模型研究[D];北京交通大学;2019年
5 张洪磊;结合图嵌入与矩阵分解的社会化推荐系统研究[D];北京交通大学;2019年
6 卢雁青;基于遗忘函数和多属性特征提取的矩阵分解推荐算法研究[D];内蒙古工业大学;2019年
7 何李杰;融合文档上下文感知的社会化推荐研究[D];重庆邮电大学;2018年
8 毛欧阳;基于矩阵分解的推荐算法优化及实现[D];重庆邮电大学;2019年
9 欧辉思;基于张量分解的跨领域推荐方法及其应用[D];上海交通大学;2016年
10 陈思乾;基于有监督集体矩阵分解的跨模态情感分析[D];上海交通大学;2018年
11 高崇铭;轨迹语义表征与地点推荐研究[D];电子科技大学;2019年
12 李同欢;基于深度学习的推荐模型研究[D];西南大学;2019年
13 胡一飞;稀疏非负矩阵分解算法研究[D];广东工业大学;2019年
14 罗健键;基于低秩矩阵分解的协同过滤推荐算法的研究[D];成都理工大学;2019年
15 郭辰;基于概率矩阵分解的协同过滤推荐[D];大连理工大学;2019年
16 蔡念;基于改进矩阵分解与跨通道CNN结合的推荐模型研究[D];广东工业大学;2019年
17 王蕾;基于矩阵分解的在线哈希最近邻搜索方法研究[D];西安电子科技大学;2019年
18 巫锦铭;基于贝叶斯局部概率矩阵分解推荐方法研究[D];国防科技大学;2017年
19 刘雪庆;基于不完全偏好值的双边匹配模型与算法研究[D];青岛大学;2019年
20 张晨;基于生成对抗网络的音乐推荐算法的设计与实现[D];华中科技大学;2019年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978