收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于主题模型的科技文献主题探测研究

雷亚莉  
【摘要】:信息时代的到来,促使科学研究领域也有了突飞猛进的发展,由此产生的科技文献资源大量增长,但要能更精确的找到我们所需要的信息却变得难上加难。对于大量的论文期刊,仅采用简单的关键词搜索,其搜索结果准确性较低。因此我们需要用新的算法、新的工具来帮助我们整理、搜索如此大量的信息。本文以生物信息学的科技文献为例,作为生物信息学领域的一个新的尝试,将LDA模型运用到生物信息学的科技文献主题探测中,是对文本进行分类整理的一个较好的方法。 本文提出的基于主题模型的科技文献主题探测系统旨在通过发现文本集中的主题以了解其内容及分析研究热点。首先尝试了通过K-means聚类方法来获得主题的分布,虽然该方法易于实现,且对一般的短文本分析效果良好,但在面对相似度较高的科技文献时表现欠佳,因此引进了最新的LDA主题模型进行主题探测。该方法以带参数的概率模型为基础,通过多次迭代反复修正估计的模型参数,最终返回文本-主题分布和主题-关键词分布。使用LDA方法后,分析效率与结果都有了显著提高。本文最后还对Bioinformatics期刊上的论文摘要进行主题探测、热点预测,并给出其结果分析。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 娄人树;;建立地区性医学过刊中心的意义[J];医学信息学杂志;1988年02期
2 陈爱芬;;国外科技文献的搜订与利用[J];图书馆论坛;1989年03期
3 邱祖斌;;我国科技文献检索期刊的发展和现状[J];情报科学技术;1995年03期
4 孙体如,王育民;江苏林业科技文献数据库研建初报[J];江苏林业科技;1996年03期
5 张祖权;科技文献易混标符刍议[J];科技与出版;1996年06期
6 ;科技文献新书架[J];机电一体化;2001年01期
7 檀林,张永奎;一种协调迭代的科技文献分类方法[J];山西大学学报(自然科学版);2004年03期
8 宋戈;构建甘肃省虚拟科技文献信息中心的思考[J];图书馆理论与实践;2004年05期
9 王金龙;;面向文献数据的挖掘[J];青岛理工大学学报;2007年03期
10 陈京莲;;论科技文献逻辑增长方程中系数的约束条件[J];情报杂志;2007年10期
11 张苏;夏立娟;;科技文献搜索引擎Scirus的优势[J];内蒙古科技与经济;2007年19期
12 范铮;;科技文献咨询工作的分析[J];情报科学;1981年05期
13 熊第志;严仁缉;;综合性期刊的重要性与科技文献的“老化”——从医学文献谈起[J];图书馆学刊;1981年04期
14 殷景峰;;对情报咨询工作的认识和实践[J];图书与情报;1986年Z1期
15 张凤荣;;科技文献也要为乡镇企业服务[J];现代情报;1987年02期
16 袁国政;;科技文献与检索(三)[J];现代情报;1989年03期
17 要弘;;略论科学文献的开发与利用[J];现代情报;1989年05期
18 王崇德;邓顺国;;叙词统计在农业科研管理上的应用[J];农业图书情报学刊;1992年04期
19 潘玉田;明末清初西方科技文献在中国的交流[J];图书馆理论与实践;1997年01期
20 黄华美;专科学校科技文献检索教学尝试[J];继续教育研究;1997年04期
中国重要会议论文全文数据库 前10条
1 贺亮;李芳;;基于话题模型的科技文献话题发现和趋势分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 冯立良;夏召增;;俄语科技文献特点及其翻译之探讨[A];外语语言教学研究——黑龙江省外国语学会第十次学术年会论文集[C];1996年
3 邓白罗;;科技文献价值的动态分析及其应用[A];出版科学探索(第8辑)[C];2008年
4 王晓梅;徐建民;;共知、共建、共享——江苏省科技文献资源共享机制创新实践与探索[A];中国图书馆学会专业图书馆分会2009年学术年会论文集[C];2009年
5 张祖权;;科技文献中插图编辑加工刍议[A];科技期刊编辑研究文集(第四集)[C];1996年
6 吕立宁;;浅谈科技文献的评价问题[A];中国生理学会论文汇编2004年第二期[C];2004年
7 王文平;;地市级科技文献信息资源服务平台建设模式探讨[A];信息时代——科技情报研究学术论文集(第二辑)[C];2006年
8 罗紫初;柴玉舟;刘婷婷;;关于大学生利用网上科技文献的调查报告[A];陕西省科技期刊编辑学会学术年会论文集[C];2006年
9 杨红春;毛原宁;李树国;;互联网环境下的科技文献管理与服务[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
10 程代荣;张祖权;;科技文献中表格编辑加工刍议[A];编辑工作论丛[C];1997年
中国博士学位论文全文数据库 前7条
1 赵丹阳;数字环境下科技文献信息开发利用与服务模式研究[D];吉林大学;2012年
2 姜静清;最小二乘支持向量机算法及应用研究[D];吉林大学;2007年
3 彭达池;《黄帝内经》注释与大型辞书编纂[D];陕西师范大学;2007年
4 徐和祥;Deep Web集成中若干技术研究[D];复旦大学;2008年
5 杨欣;稳定融合表达拮抗Aβ_(1-42)肽细胞内毒性的适配子策略及其作用机制的研究[D];吉林大学;2008年
6 余一娇;基于文件复制的对等网络搭便车抑制技术研究[D];华中科技大学;2009年
7 张博;面向农业科研人员的虚拟化信息服务研究[D];中国农业科学院;2010年
中国硕士学位论文全文数据库 前10条
1 崔金英;网络科技文献推荐系统的设计与实现[D];华东师范大学;2010年
2 陈柯;五代十国时期科技文献汇编研究[D];辽宁大学;2012年
3 李响;明朝与它国科技文献交流研究[D];辽宁大学;2012年
4 高源;清代“抄纂之书”中的科技文献[D];辽宁大学;2013年
5 张秀红;我国古代科技文献的保存与流传[D];西北师范大学;2004年
6 钟惠中;科技文献自动辅助阅读系统[D];华中科技大学;2012年
7 乔治;《四库全书》中科技文献与科技史料研究[D];辽宁大学;2013年
8 贺亮;基于话题模型的科技文献话题发现与趋势分析[D];上海交通大学;2012年
9 刘芳芳;先秦简帛科技文献研究[D];辽宁大学;2012年
10 刘继才;科技文献自动分类系统设计与实现[D];河南工业大学;2013年
中国重要报纸全文数据库 前10条
1 通讯员 马晓华;扬州发挥科技文献平台作用为企业服务[N];江苏科技报;2007年
2 中国科学院院士 温诗铸;机械工程学科发展与科技文献建设[N];科技日报;2005年
3 顾钢;德限制网上下载和传送科技文献[N];科技日报;2007年
4 蓝有林;上海科技文献社版权工作走出新天地[N];中国图书商报;2007年
5 记者 盛利;四川40TB科技文献平台“上线”[N];科技日报;2010年
6 何绍庚;《四库全书》中的科技文献[N];光明日报;2004年
7 本报记者 张益;我省加快构建科技文献共享平台[N];贵州日报;2006年
8 蓝有林;上海科技文献社深挖央视资源尝甜头[N];中国图书商报;2007年
9 记者 李峰;甘肃科技文献共享平台达到国内领先水平[N];甘肃日报;2010年
10 重庆 SunnyMan;网上查询科技文献[N];电脑报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978