收藏本站
《重庆大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

定义问答检索关键技术研究

龙华  
【摘要】:问答式信息检索(简称问答检索)是信息检索领域的一个重要研究方向。定义问答检索是问答检索的一个重要分支,其根据指定的目标概念,从开放领域(或指定)的文本中检索得到该概念的释义文本。由于概念的种类及其属性繁多且描述概念的方式较多,造成对其进行描述的释义文本形式差别巨大,从而使得当前定义问答检索方法对释义文本的识别具有一定困难。 当前方法以孤立语法标识为特征的对释义文本进行形式化不利于释义文本中释义语义的表示和计算,因为其形式化过程没有涉及到语义内容。不同种类概念及描述方式之间的差异造成释义文本的语言形式差别大,以所有定义样例为基础的学习及模式匹配的识别率低。传统的基于统计分析方法的定义识别中未能有效地计算语义特征在学习语料中出现的模糊性,降低了定义的识别率。当前定义问答检索的传统评价主要基于人工方式,一些基于自动评价的算法的形式化只以词汇为基础,没有考虑答案文本的语法和语义特征,从而降低评价语义上的准确性。针对释义文本中语义内容形式化问题、候选答案的评分过程中识别率低的问题、语义计算过程中涉及模糊性的问题和定义问答检索方法自动评价中的语义问题,本文探索使用释义内容单元(ECU)形式化释义文本,并将基于案例推理的消极学习法应用于定义评分过程,然后使用云模型进行候选答案评分,最后在定义问答检索方法的自动评价过程中使用金字塔模型。 归纳起来,本文的主要创新成果包括: ①提出了基于案例推理的定义问答检索方法。在文本检索领域,基于案例推理的学习方法通常用来处理复杂的文本检索问题(如法律案例检索)。因此,本文首次将其用于定义问答检索。本文首先将概念的释义文本进行依存语法解析获得其句法树,然后根据释义元语言将句法树转换为释义内容单元作为释义文本的形式化表示,从而构建定义案例。该方法检索与候选答案(查询案例)相似的定义案例集合,然后使用该集合对候选答案进行评分,减少相关性较低的定义案例对评分的影响。通过BCU-ECU方法增加案例检索过程将其构造为BCU-CASE方法,实验对比BCU-CASE、BCU-ECU和DT基准方法的F值的宏平均。实验结果显示,BCU-CASE比DT提高24%,BCU-CASE比BCU-ECU提高6%。基于案例推理的定义问答检索方法有效,且优于DT,其能改善一般基于统计分析的定义问答检索方法的性能。 ②提出了基于云模型的定义问答评分算法。自然语言的不确定性,尤其是模糊性和随机性一直是自然语言量化过程需要解决的主要问题,云模型通常用于量化自然语言的模糊性和随机性,因此,本文首次将其用于定义问答评分。本文以定义案例的释义内容单元为基础建立云模型的定量论域,然后将查询案例的释义内容单元作为云滴计算其特征值,以特征值为基础计算查询案例的评分值。通过将BCU-CASE方法的案例识别阶段的算法替换为该评分算法从而获得CLOUD-CASE方法,实验通过对比CLOUD-CASE、BCU-CASE和DT基准方法的F值的宏平均。实验结果显示,CLOUD-CASE比DT提高27%,CLOUD-CASE比BCU-CASE提高3%。基于云模型的定义问答评分算法有效,且优于DT,云模型具有优于基于统计分析的案例识别性能。 ③提出了基于释义内容单元的释义文本形式化方法。本文首先利用依存句法树结构的层次性句法和释义元语言对释义文本进行分析,获得用于释义的单元结构。实验基于BCU方法使用释义内容单元对句子进行形式化从而构建BCU-ECU方法。实验结果显示,BCU-ECU与DT基准方法的F值的宏平均,前者比后者提高18%,释义内容单元形式化有效,且能够改善定义问答检索方法的性能。 ④提出了基于金字塔模型的定义问答检索的自动评价算法APDQE。在自动摘要的评价领域,金字塔算法已经被用来作为评价的标准之一。因此,本文首次将其用于定义问答的自动评价。为了建立金字塔模型,本文以标准答案的释义内容单元为基础建立金字塔,然后获得被测答案中每个释义内容单元的权重值,最后计算出标准答案的得分。实验通过APDQE、POURPRE和人工评价不同定义问答检索算法的输出结果,以此基础计算APDQE和POURPRE分别与人工评价结果之间的判定相关系数R2,APDQE比POURPRE提高7%,实验结果显示APDQE有效且略优于POURPRE。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP391.3

【参考文献】
中国期刊全文数据库 前10条
1 苏新春;汉语释义元语言的功能特征与风格特征[J];辞书研究;2004年05期
2 苏新春;汉语释义元语言的结构、词义、数量特征[J];辞书研究;2005年03期
3 王树西;问答系统:核心技术、发展趋势[J];计算机工程与应用;2005年18期
4 王宇;战学刚;蔡建山;;基于网络的中文问答系统的研究[J];计算机工程与应用;2006年07期
5 龙华;何中市;伍星;李双庆;;基于依存内容单元的金字塔自动摘要评估[J];计算机工程;2009年13期
6 杨晓明;罗振声;;模式匹配在中文问答系统中的应用研究[J];科学技术与工程;2006年03期
7 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
8 张艳,宗成庆,徐波;汉语术语定义的结构分析和提取[J];中文信息学报;2003年06期
9 许勇,荀恩东,贾爱平,宋柔;基于互连网的术语定义获取系统[J];中文信息学报;2004年04期
10 吴友政,赵军,段湘煜,徐波;问答式检索技术及评测研究综述[J];中文信息学报;2005年03期
【共引文献】
中国期刊全文数据库 前10条
1 曾文雄;;中西语言哲学“语用学转向”新解[J];安徽大学学报;2006年04期
2 詹全旺;;新闻言语行为分析[J];安徽大学学报(哲学社会科学版);2009年01期
3 曹德和;;如何界定普通话的内涵和外延——学习《国家通用语言文字法》的思考[J];安徽大学学报(哲学社会科学版);2011年01期
4 张小红;;语言背后的镜子——简析预设在语言概念功能中的深层特征[J];安徽农业大学学报(社会科学版);2010年01期
5 李先华;;唐诗词语隐含义个案考察及相关问题研究[J];安徽师范大学学报(人文社会科学版);2006年06期
6 林莉兰;;奥斯汀言语行为二分说述评[J];安徽师范大学学报(人文社会科学版);2010年02期
7 胡萍英;;语言游戏说与大学英语教学方式[J];安徽工业大学学报(社会科学版);2009年02期
8 朱晓红;周家春;;言语教学的哲学基础及实践策略研究[J];安徽工业大学学报(社会科学版);2009年06期
9 宋荣超;;语言范畴观的历史演进[J];安徽工业大学学报(社会科学版);2010年04期
10 张庆华;;蒯因“翻译不确定性”论题的哲学内涵[J];安徽工业大学学报(社会科学版);2011年05期
中国重要会议论文全文数据库 前10条
1 陈红兵;;基于XML的电子政务信息集成框架[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 罗继英;;日语拟声拟态词的汉译[A];首届海峡两岸外语教学与研究学术研讨会暨福建省外国语文学会2011年会论文集[C];2011年
3 刘红婴;;论法定程序的“以言行事”[A];边缘法学论坛[C];2005年
4 孙衢;王永玉;;基于云模型的非线性系统智能滑模控制[A];第二十九届中国控制会议论文集[C];2010年
5 叶琼;李绍稳;张友华;刘恺;;农业领域本体知识的云化方法研究[A];中国农业工程学会2011年学术年会论文集[C];2011年
6 斯·劳格劳;华沙宝;萨如拉;;基于统计方法的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 张燕;;弗雷格意义理论浅析[A];语言与文化研究(第六辑)[C];2010年
8 黄建军;杨勋;谢维信;;基于类云模型的C均值聚类算法[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
9 楼巍;许为民;;技性科学观:科学的当代性和复杂性[A];全国科学技术学暨科学学理论与学科建设2008年联合学术年会浙江大学论文集[C];2008年
10 黄建华;;序言[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 施佳胜;经典 阐释 翻译——《文心雕龙》英译研究[D];上海外国语大学;2010年
2 原雪;二语/外语语境下的批判性阅读理论构建研究[D];上海外国语大学;2010年
3 武克勤;英伽登文学本体论思想研究[D];苏州大学;2010年
4 刘娜;哲学语用学视域中的教育实践[D];南开大学;2010年
5 孙小龙;规范、推论与社会实践[D];南京大学;2011年
6 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
7 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
8 方忠;中韩文化创意产业经济效应比较研究[D];福建师范大学;2010年
9 张爱珍;模糊语义研究[D];福建师范大学;2010年
10 徐元;知识产权贸易壁垒研究[D];东北财经大学;2010年
中国硕士学位论文全文数据库 前10条
1 樊敬川;Deep Web数据库的选择研究[D];河北大学;2009年
2 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
3 王宇红;《俄汉详解大词典》视域下的观念词счастье[D];哈尔滨师范大学;2010年
4 石卉;全国人民代表大会会议议程研究[D];华东政法大学;2010年
5 任芝;请求言语行为的俄英对比研究[D];上海外国语大学;2010年
6 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
7 向楷;软件构件的可信评价及其组装方法的研究[D];大连理工大学;2010年
8 焦阳;现代汉语类词缀“坛”、“界”、“圈”比较研究[D];辽宁师范大学;2010年
9 温婷桢;媒介融合背景下的报纸营销研究[D];湘潭大学;2010年
10 冯晶晶;面向软件测试领域的自动问答系统[D];河南理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前9条
1 苏新春;同形词与“词”的意义范围──析《现代汉语词典》的同形词词目[J];辞书研究;2000年05期
2 秦兵;刘挺;王洋;郑实福;李生;;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
3 张永奎,赵辄谦,白丽君,陈鑫卿;基于互联网的中文问答系统[J];计算机工程;2003年15期
4 苏新春;元语言研究的三种理解及释义型元语言研究评述[J];江西师范大学学报;2003年06期
5 孙乐,金友兵,杜林,孙玉芳;平行语料库中双语术语词典的自动抽取[J];中文信息学报;2000年06期
6 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
7 张艳,宗成庆,徐波;汉语术语定义的结构分析和提取[J];中文信息学报;2003年06期
8 崔桓,蔡东风,苗雪雷;基于网络的中文问答系统及信息抽取算法研究[J];中文信息学报;2004年03期
9 周明,黄昌宁;面向语料库标注的汉语依存体系的探讨[J];中文信息学报;1994年03期
中国重要会议论文全文数据库 前1条
1 吴友政;赵军;段湘煜;徐波;;构建汉语问答系统评测平台[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国硕士学位论文全文数据库 前1条
1 贾爱平;科技文献中术语定义的语言模式研究[D];北京语言文化大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 张飞舟,晏磊,范跃祖,孙先仿;基于云模型的车辆定位导航系统模糊评测研究[J];控制与决策;2002年05期
2 岳训,李全忠,孙忠林,张艳奇;定性预测系统的建模方法[J];计算机工程;2001年09期
3 岳训,孙忠林,张艳琦,李光忠;基于云模型的网页吸引度定性测试的研究[J];计算机工程;2001年12期
4 杜鹢,李德毅;基于云的概念划分及其在关联采掘上的应用[J];软件学报;2001年02期
5 张利民;李静;;基于云模型的案例推理研究[J];福建电脑;2010年05期
6 韦修喜;曾海文;周永权;;云人工鱼群算法[J];计算机工程与应用;2010年22期
7 蒋嵘;基于形态表示的时间序列相似性搜索[J];计算机研究与发展;2000年05期
8 田永青,杜国宁,李志,朱仲英;基于云理论神经网络决策树的生成算法[J];上海交通大学学报;2003年S2期
9 郑恩让;回立川;;时滞系统的云模型智能控制[J];计算机工程与应用;2006年26期
10 姜伟;高知新;李本喜;;基于多维云模型的入侵检测[J];计算机工程;2006年24期
中国重要会议论文全文数据库 前10条
1 邸凯昌;李德仁;李德毅;;云模型的扩展及其在空间数据发掘中的应用[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
2 刘闯;陈前;;人工神经网络与基于案例推理结合用于故障诊断[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
3 孙波;倪文琦;温海英;廖芳;;基于CBR的智能决策支持系统模型研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
4 吴清烈;冯勤超;;基于案例推理技术在企业并购决策中的应用[A];2002年中国管理科学学术会议论文集[C];2002年
5 栾媛媛;张沫;秦培玉;;基于云模型的客户终端偏好模型研究[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
6 胡华超;贾鑫;吴彦鸿;初晓;陈颖颖;;基于云模型的SAR干扰图像效果评估研究[A];第八届全国信息获取与处理学术会议论文集[C];2010年
7 胡华超;贾鑫;吴彦鸿;武威;;基于AHP-云模型的SAR干扰图像效果评估[A];第八届全国信息获取与处理学术会议论文集[C];2010年
8 王波;张斌;;一种基于云模型的时间序列特征表示方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
9 谢骏;胡均川;;基于案例推理的水下目标识别系统[A];中国声学学会2007年青年学术会议论文集(下)[C];2007年
10 杜红梅;刘明盛;;基于云模型的风险评估方法研究[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 甘仞初(中国):北京理工大学管理与经济学院首席教授,IFIP中国计算机辅助生产管理专委会主席;基于案例推理的信息系统总体设计[N];中国计算机报;2000年
2 黄永明;金字塔建造之谜新解[N];南方周末;2007年
3 方舟子;又见“金字塔神奇的能量”[N];中国文化报;2008年
4 浙江师范大学 孙炳海;用“金字塔模型”整合评价内容体系[N];中国教育报;2009年
5 刘慧;谁赋予了金字塔神奇的能量?[N];科技日报;2008年
6 刘会;建构中国医药企业基业常青的金字塔[N];中国医药报;2008年
7 薛峰;千方百计寻找VIP[N];中国计算机报;2002年
8 本报特约记者  萧笑;做大昆明“科技金字塔”底部[N];大众科技报;2006年
9 何忠平;四川定义法官品质关键词:不可收买[N];21世纪经济报道;2006年
10 本报实习记者 周渝利;郎咸平诠释企业战略新思维[N];中国知识产权报;2008年
中国博士学位论文全文数据库 前10条
1 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
2 田瑞;应急交通保障辅助决策支持系统相关模型与方法研究[D];吉林大学;2011年
3 赵鹰;FDI集群研究:以长三角为例[D];华东师范大学;2004年
4 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年
5 江迎;基于云模型和GIS/RS的坝堤溃决风险分析及灾害损失评估研究[D];华中科技大学;2012年
6 杨振刚;CBR ANN智能决策支持方法及应用[D];华南理工大学;2007年
7 刘妍;高速公路建设期安全风险智能管理研究[D];大连理工大学;2011年
8 林亚忠;基于Gibbs随机场模型的医学图像分割新算法研究[D];第一军医大学;2004年
9 甘志刚;仿人机器人数字仿真与虚拟示教关键技术研究[D];华南理工大学;2009年
10 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘闯;人工神经网络和基于案例推理相结合用于故障诊断[D];南京航空航天大学;2005年
2 胡春梅;基于案例推理技术的教学案例知识管理系统的设计与实现[D];首都师范大学;2005年
3 陈琦;CBR在知识管理系统中的应用[D];华中科技大学;2006年
4 曹洁;案例推理技术在保险市场拓展项目中的应用[D];上海交通大学;2010年
5 张勇;基于数据仓库与案例推理的机组产能模型研究与应用[D];大连理工大学;2005年
6 李晓栋;面向虚拟采办的概念设计系统研究[D];华中科技大学;2007年
7 李建洋;基于粗糙集的案例推理智能决策支持系统的研究[D];安徽大学;2003年
8 房明;基于CBR的技术推广研究与应用[D];华中科技大学;2004年
9 聂艳召;基于案例推理的羊病诊断专家系统研究与实现[D];西北农林科技大学;2007年
10 杨阿琴;民航机务维修差错预警专家系统中推理机制的研究[D];武汉理工大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026