收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向概念查询的生物医学多文档摘要技术研究

商玥  
【摘要】:近年来,随着生命科学的不断发展,生物医学文献数量呈指数级增长,海量的数据为研究人员提供了丰富的资源的同时,也为知识的检索和理解带来了巨大挑战。在生物医学文献数据库中,一个生物医学概念可以检索到大量的文献,有些疾病概念可以检索到几万篇相关研究论文,一个基因也能找到上千篇参考文献,逐一阅读相关文献将是十分费时耗力的工作。因此,自动整合生物医学概念的相关资源,使用户能快速掌握查询概念的相关信息对生物医学研究人员有重要意义。 文本自动摘要技术是对文本内容进行自动概括和精炼的过程,能利用较少的语句概括文本的主要信息,使用户对文本内容有快速的认识。将自动摘要技术应用于生物医学文本挖掘中有助于提高研究人员查阅和分析相关资料的效率,快速理解和掌握生物医学概念的相关知识。本文利用自动摘要技术对两类生物医学概念,即疾病和基因,针对各自语料和资源的特点,分别进行多文档自动摘要的抽取和生成。 面向疾病概念的摘要,本文提出了一种利用生物医学语义关系进行多文档摘要抽取的方法,旨在从语义层面比较全面的覆盖查询疾病概念的多方面内容。本文对查询疾病的相关语义关系进行分析,根据语义关系获取相关句子并对句子按语义相关性排序。实验中分析了24种常见病,生成的概念涉及了致病原因、类型、防治策略等语义类型。实验结果表明,利用语义关系特征抽取摘要的方法能提高摘要的性能,且由于增加了生物医学语义层面内容,使生成的摘要更符合研究人员的查询需要。 面向基因概念的摘要,本文提出了一种利用排序学习生成基因摘要的方法。本文提出了三种特征作为候选摘要句选取的依据,即基因本体相关性、主题相关性以及TextRank,并利用排序学习方法自动从训练集获取三类特征在句子重要性排序中的权重。实验结果表明,利用三种特征衡量候选摘要句的重要程度序能提高摘要的性能,而利用排序学习方法从训练集中自动学习特征权重的方法也有利于特征的进一步扩展,为引入更多有效的句子重要性评价特征提供的便利。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 史磊,王永成;英文文献自动摘要系统研究[J];情报学报;1999年06期
2 李蕾,孙春葵,杨晓兰,钟义信;一种特定领域中文自动摘要系统[J];北京邮电大学学报;2000年01期
3 张雷生,万绍俊,许鹏文;简单中文自动摘要系统研究[J];装备指挥技术学院学报;2004年03期
4 刘洋,王永成;基于Web服务自动摘要系统的安全实现方案[J];计算机工程与应用;2005年15期
5 陈桂林,王永成;Internet网络信息自动摘要的研究[J];高技术通讯;1999年02期
6 谭种;陈跃新;;自动摘要方法综述[J];情报学报;2008年01期
7 ;计算机中文文本自动摘要系统通过专家鉴定[J];预防医学文献信息;1996年03期
8 王继成 ,武港山 ,周源远 ,张福炎;一种篇章结构指导的中文Web文档自动摘要方法[J];计算机研究与发展;2003年03期
9 张筱丹;胡学钢;;基于向量空间模型的自动摘要冗余处理研究[J];合肥工业大学学报(自然科学版);2010年09期
10 黄水清;李志燕;梁刚;;面向计算机类文献的自动摘要系统的研究与实现[J];图书与情报;2006年03期
11 陈珂;殷凡;;中文自动摘要综述[J];福建电脑;2007年02期
12 王永成;刘功申;刘传汉;胡佩华;孙展;;论文本的自动摘要[J];中国索引;2003年02期
13 阿热帕提·尕依提;维尼拉·木沙江;;基于统计的维吾尔文网页自动摘要提取研究[J];电脑知识与技术;2011年01期
14 沈洲,王永成,韩客松;一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践[J];高技术通讯;2001年09期
15 刘郑;杜祝平;;浅析英文自动摘要技术[J];魅力中国;2008年28期
16 王麒;江开忠;杨静;顾君忠;;基于领域本体的文档自动摘要算法[J];华东师范大学学报(自然科学版);2007年05期
17 王永成,王继才;中文文本摘要的自动编制[J];微型电脑应用;1998年02期
18 张奇,黄萱菁,吴立德;一种新的句子相似度度量及其在文本自动摘要中的应用[J];中文信息学报;2005年02期
19 耿焕同,蔡庆生,赵鹏,于琨;一种基于词共现图的文档自动摘要研究[J];情报学报;2005年06期
20 尹存燕;戴新宇;陈家骏;;Internet上文本的自动摘要技术[J];计算机工程;2006年03期
中国重要会议论文全文数据库 前10条
1 章彦星;张铭;邓志鸿;;基于特征的用户评论自动摘要[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 李芳;何婷婷;;面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 苗家;马军;陈竹敏;;一种基于HITS算法的blog文摘方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 杨潇;马军;杨同峰;杜言琦;邵海敏;;基于主题模型LDA的多文档自动摘要[A];第五届全国信息检索学术会议论文集[C];2009年
6 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
7 王荀;李素建;宋涛;姜伯平;;服务于内容侧面发现的框架识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 多拉;扎西加;欧珠;大罗桑朗杰;;信息处理用藏文词类及标记集规范(征求意见稿)[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 宋锐;林鸿飞;;面向中文新闻领域的移动摘要系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 陈杰;;应用智能搜索 实现数据挖掘[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
中国博士学位论文全文数据库 前8条
1 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
4 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
5 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
6 金锋;文档摘要算法的研究与应用[D];清华大学;2011年
7 生龙;二型模糊系统理论及应用[D];电子科技大学;2012年
8 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 阿热帕提·尕依提;基于统计的维吾尔网页自动摘要提取研究[D];新疆大学;2011年
2 余博;基于维基百科的多文档自动摘要系统研究[D];武汉科技大学;2011年
3 商玥;面向概念查询的生物医学多文档摘要技术研究[D];大连理工大学;2011年
4 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
5 李阜;基于滑窗取词的单文档自动摘要技术研究[D];国防科学技术大学;2010年
6 章芝青;基于语义的单文档自动摘要研究[D];浙江大学;2010年
7 熊芝;中文网页自动摘要系统的设计与实现[D];华南理工大学;2011年
8 李振鹏;针对UGC数据进行的数据挖掘的研究与实现[D];北京邮电大学;2013年
9 张文静;搜索引擎返回结果的自动摘要研究[D];中国石油大学;2010年
10 鲁凡;基于分形理论的自动摘要[D];吉林大学;2004年
中国重要报纸全文数据库 前6条
1 马海兵;网络舆情及其分析技术[N];光明日报;2007年
2 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年
3 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
4 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
5 ;谷尼国际:精确监控网络舆情[N];中国计算机报;2009年
6 ;线点科技:轻松管理互联网[N];中国计算机报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978