收藏本站
《复旦大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于模式知识库的问题回答关键技术研究

杜永萍  
【摘要】:随着计算机可读的文本信息日益增多,有效查找和利用这些信息的迫切需求使得信息检索与信息抽取技术日益重要。但传统的搜索引擎存在的一些弊端给用户带来了一定的不便,如:用户的检索需求简单表示为一组关键词,往往会丢失很多语义信息;检索返回的结果为相关链接或文档列表,用户仍需阅读文档或片段以定位到真正需要的信息。问题回答的研究解决了这些存在的问题,首先,用户可将信息检索的需求表达为自然语言描述的问题,其次,问题回答将在文档集合中搜索并返回问题的精确答案。这个任务看似简单,但对于计算机具有很大的挑战性。本文正是在这种前提下,对问题回答技术进行了探索性研究。 论文的工作主要集中在基于模式知识库实现问题回答的关键技术上,设计并实现了问题回答系统,参加了国际文本检索会议的评测。以此为基础,我们将模式匹配技术应用到了一个相关的更新的研究领域-阅读理解,并取得了好的效果。 实现模式匹配策略最关键也是最核心的任务,即建立一个完善的模式知识库。我们提出了一种基于答案类型与问题模式的问题分类体系,同时保留了问题的语义信息与结构信息。借助TREC的评测问题集作为我们的训练与测试数据,对不同的问题分类类型进行答案模式的自动学习与评价。 我们对具有复杂结构的问题实现了模式学习,包含多个问题元素的较复杂的答案模式对于抽取出正确答案更有效更可靠。这是简单模式所无法覆盖的。同时,我们对模式匹配得到的侯选答案增加了语义类型约束,使其有更高的准确率。 为了使学习到的答案模式有更好的可扩展性,我们采取了泛化策略,在模式中加入了实体名的信息,这样,模式组成结构中不仅包含词形,也融入了语义信息,使其具有较好的鲁棒性。 答案模式的评价指标采用了数据挖掘中的可信率(Confidence)与支持率(Support)。高可信率的答案模式有更高的可靠性抽取到正确答案。 在阅读理解系统的实现中,我们引入了WordNet的同义词信息、模式匹配和上下文辅助策略,取得了明显的效果,进一步提高了系统性能,性能超过了之前的最好结果。
【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前5条
1 王宝勋;刘秉权;孙承杰;王晓龙;;网络问答资源挖掘综述[J];智能计算机与应用;2012年06期
2 李渝;罗军;;基于本体的语义查询系统模型[J];信息技术;2010年02期
3 郝晓燕;李济洪;由丽萍;刘开瑛;;中文阅读理解语料库构建技术研究[J];中文信息学报;2007年06期
4 李济洪;王瑞波;王凯华;李国臣;;基于最大熵模型的中文阅读理解问题回答技术研究[J];中文信息学报;2008年06期
5 李济洪;杨杏丽;王瑞波;张娜;李国臣;;基于规则的中文阅读理解问题回答技术研究[J];中文信息学报;2009年04期
中国重要会议论文全文数据库 前2条
1 张娜;李济洪;;基于语义标注的中文阅读理解语料库的建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 李济洪;王凯华;王瑞波;;基于最大熵模型的中文阅读理解技术研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前2条
1 金慧;学习支持问题库的设计策略研究[D];华东师范大学;2008年
2 林锋;问题回答和对话系统中置信度的研究[D];复旦大学;2008年
中国硕士学位论文全文数据库 前4条
1 张可培;基于阅读理解模式的中文问答系统研究[D];宁波大学;2011年
2 张娜;基于规则的阅读理解问题回答技术研究[D];山西大学;2008年
3 梁文婷;汉语文本主题分析技术的研究与实现[D];重庆大学;2008年
4 李渝;本体查询及自动完善系统研究[D];重庆大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 刘椿年,宋霞;基于Boosting的半结构化信息抽取[J];北京工业大学学报;2005年02期
2 何章鸿;董守斌;;基于XPath的广告数据提取研究[J];江西师范大学学报(自然科学版);2008年02期
3 何友全;徐澄;徐小乐;唐华姣;;一种基于统计学特征和DOM树的网页去噪技术[J];重庆理工大学学报(自然科学版);2011年01期
4 李绍英;;基于代理技术的比较购物研究[J];当代经理人;2006年10期
5 孙铁利;教巍巍;刘淑华;;Web-Based Information Extraction Technology[J];Journal of Donghua University(English Edition);2007年02期
6 贺令亚;柳佳刚;;基于Web的包装器技术的现状与发展[J];电脑开发与应用;2007年06期
7 刘军;;基于支持向量机的网页主题信息提取算法[J];电脑知识与技术(学术交流);2007年02期
8 李向阳,陆建江,张亚非;基于竞争分类的Web信息抽取[J];电子学报;2004年11期
9 柳佳刚;刘高嵩;贺令亚;陈山;;基于Web的信息抽取技术现状与发展[J];福建电脑;2007年07期
10 魏晶晶;于然;廖祥文;;基于分隔符的中文论坛信息抽取[J];福建电脑;2011年06期
中国重要会议论文全文数据库 前10条
1 陈红兵;;基于XML的电子政务信息集成框架[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
3 刘秉权;王喻红;葛冬梅;李佳;;基于结构树解析的网页正文抽取方法[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
4 ;A Classification Method for Web Information Extraction[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年
5 汪建伟;高军;王腾蛟;杨冬青;;一种基于显示属性的网页信息提取方法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
6 叶娜;吴雪军;朱靖波;陈文亮;;基于相似计算的信息抽取模板自动获取方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 叶娜;罗海涛;朱靖波;张斌;;基于归纳逻辑编程的多槽信息抽取规则自动学习方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 左南;李涓子;唐杰;;基于SVM的肖像照片抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前10条
1 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
2 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
3 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
4 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
5 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
6 寇月;Deep Web实体搜索的关键技术研究[D];东北大学;2009年
7 俞方桦;互联网信息资源整合研究[D];东华大学;2001年
8 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
9 郑桂华;基于网络的语文校本课程研究与实践[D];华东师范大学;2004年
10 邓绪斌;面向复杂数据源的数据抽取模型和算法研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 樊敬川;Deep Web数据库的选择研究[D];河北大学;2009年
2 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
3 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
4 王培正;基于Deep Web的网络信息抽取技术研究[D];华南理工大学;2010年
5 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年
6 王葛;Deep Web接口集成与数据标注方法研究[D];长春工业大学;2010年
7 黄亮;知识产权预警机制在服务外包平台中的应用研究[D];南昌大学;2010年
8 赛子龙;日志分析数据同步机制在区域微软技术中心营运平台中的应用研究[D];南昌大学;2010年
9 胡少荣;一种舆情信息预处理平台的研究与实现[D];北京交通大学;2010年
10 杨奕锦;Web页面用户评论信息抽取技术研究[D];浙江大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 段建勇;李俊;张梅;马礼;;限定领域的自动问答系统研究[J];北方工业大学学报;2010年01期
2 高瑞利;美国教学设计理论从ID1到ID2的发展[J];比较教育研究;2003年02期
3 衷克定;教师策略性知识的成分与结构特征研究[J];北京师范大学学报(人文社会科学版);2002年04期
4 梅翔;孟祥武;陈俊亮;徐萌;;一种基于语义关联的查询优化方法[J];北京邮电大学学报;2006年06期
5 朱靖波,姚天顺;文本内容主题的识别方法[J];东北大学学报;2002年05期
6 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
7 麻志毅,林鸿飞,姚天顺,马佳琳;基于情境的文本中的时间信息分析[J];东北大学学报;1999年03期
8 陈向东,王兴辉,高丹丹,张际平;博客文化与现代教育技术[J];电化教育研究;2003年03期
9 David H.Jonassen ,钟志贤,谢榕琴;基于良构和劣构问题求解的教学设计模式(上)[J];电化教育研究;2003年10期
10 王晓东,高宏卿;基于语义Web的学习支持系统构架[J];电化教育研究;2005年03期
中国重要会议论文全文数据库 前3条
1 孙景广;蔡东风;吕德新;董燕举;;基于知网的中文问题自动分类[A];第三届学生计算语言学研讨会论文集[C];2006年
2 郝晓燕;刘伟;李茹;刘开瑛;;汉语框架语义知识库及软件描述体系[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 王凯华;李济洪;张国华;王瑞波;;基于最大熵模型的中文阅读理解问答系统技术研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
2 陈品德;基于Web的适应性学习支持系统研究[D];华南师范大学;2003年
3 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
4 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
5 王树西;基于文本模式推理的问答系统研究[D];中国科学院研究生院(计算技术研究所);2005年
6 郭文英;基于SWRL推理的语义关联发现及其在本体映射与集成中的应用[D];浙江大学;2006年
7 夏天;研究性学习支持系统[D];华东师范大学;2007年
8 李妍;乔纳森建构主义学习环境设计研究[D];华东师范大学;2007年
9 文坤梅;基于本体知识库推理的语义搜索研究[D];华中科技大学;2007年
10 徐晓华;图上的随机游走学习[D];南京航空航天大学;2008年
中国硕士学位论文全文数据库 前10条
1 李清;一种基于动态知识库的搜索引擎的技术研究[D];暨南大学;2002年
2 吴曾;文本主题切分技术和ROCCHIO模型在信息检索中应用的研究[D];中国科学院研究生院(软件研究所);2004年
3 于娟;基于本体语言OWL的知识表示及推理算法研究[D];青岛大学;2006年
4 王慧慧;基于自然语言处理的问答系统研究[D];电子科技大学;2006年
5 杨涛;基于本体的案例推理系统框架研究[D];南京航空航天大学;2006年
6 陈宏;基于本体的知识表示研究[D];长沙理工大学;2006年
7 文勖;中文问答系统中问题分类及答案候选句抽取的研究[D];哈尔滨工业大学;2006年
8 黄际洲;聊天机器人知识库自动抽取算法的研究与实现[D];重庆大学;2006年
9 熊淼;本体知识库的自然语言查询接口研究[D];上海交通大学;2007年
10 刘伟;本体整合查询的研究及其系统实现[D];天津大学;2006年
【二级引证文献】
中国期刊全文数据库 前6条
1 常娜;;基于网络英语在线学习系统的研究与开发[J];信息安全与技术;2012年06期
2 李茹;宋小香;王文晶;;基于汉语框架网的中文问题分类[J];计算机工程与应用;2009年31期
3 李济洪;杨杏丽;王瑞波;张娜;李国臣;;基于规则的中文阅读理解问题回答技术研究[J];中文信息学报;2009年04期
4 阿里甫·库尔班;吾买尔江·库尔班;尼加提·阿不都肉苏力;;维吾尔语框架语义知识库的概念设计[J];中文信息学报;2010年04期
5 刘开瑛;;汉语框架语义网构建及其应用技术研究[J];中文信息学报;2011年06期
6 赵文娟;闫红梅;王蔚林;;基于汉语框架网的语义角色标注算法[J];图书情报工作;2011年06期
中国博士学位论文全文数据库 前2条
1 王萍;网络环境下的领域知识挖掘[D];华东师范大学;2010年
2 张志昌;开放域阅读理解关键技术研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 李永瑾;基于本体的MPI+OpenMP并行检索研究与应用[D];西北大学;2011年
2 张可培;基于阅读理解模式的中文问答系统研究[D];宁波大学;2011年
3 李雪峰;社保审计领域语料库构建研究[D];哈尔滨工程大学;2011年
4 康旭珍;框架元素语义核心词自动识别研究[D];山西大学;2011年
5 赵晶;信息技术支持下面向问题解决的学习策略的应用设计与实践[D];东北师范大学;2011年
6 李兆福;基于K最短路径的中文分词算法研究与实现[D];哈尔滨工程大学;2009年
7 宋小香;基于汉语框架网的中文问句分类研究[D];山西大学;2010年
8 高琦;基于Bootstrapping的本体标注方法研究[D];重庆大学;2010年
9 张洪波;增强现实技术在教学中的应用研究[D];河南大学;2012年
10 李青朝;新疆农产品网络交易平台设计与实现[D];大连理工大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 杜永萍;何明;;基于多策略的单文档问答式信息检索技术[J];计算机科学;2009年07期
2 谢丽聪;模式匹配的一种新方法[J];福州大学学报(自然科学版);2003年03期
3 宋婉娟;张剑;;基于机器学习的网络入侵检测[J];科技信息;2009年23期
4 林敏;;基于机器学习的网络攻击检测综述[J];数字技术与应用;2010年10期
5 周荃;王崇骏;王珺;周新民;陈世福;;基于人工智能技术的网络入侵检测的若干方法[J];计算机应用研究;2007年05期
6 何琳;杜慧平;侯汉清;;领域本体的半自动构建方法研究[J];图书馆理论与实践;2007年05期
7 张宝燕;毛海飞;;汉语框架网络学习策略研究[J];山西电子技术;2008年06期
8 吴启明;阮忠;;基于XML个性化教学系统的设计[J];科技创新导报;2008年26期
9 吕建;徐家福;;软件自动化的智能化途径[J];科学通报;1993年02期
10 胡俊翘,胡友兰,李德群;改进的基因遗传算法在专家系统机器学习中的应用[J];计算机辅助工程;1994年01期
中国重要会议论文全文数据库 前10条
1 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
2 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 谢世朋;胡茂林;;基于局部仿射区域对稀疏纹理分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
5 张郴;;基于神经网络集成的旅游需求预测模型[A];中国地理学会百年庆典学术论文摘要集[C];2009年
6 吴宪祥;于培松;万旻;倪伟;郭宝龙;;RoboCup中智能体的参数优化和学习[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
7 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 杨磊;黎志成;胡斌;;基于人工神经网络的调度规则确定专家系统[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
9 张燕;张付志;;跨系统个性化服务方法和用户模型研究[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
10 陈时敏;韩心慧;;基于机器学习的网页木马识别方法研究[A];第26次全国计算机安全学术交流会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 记者 赵秋丽 通讯员 付永;山东7所高校改革英语教学[N];光明日报;2006年
2 肥城市实验中学 李海滨;认清规律,注重方法,巧解阅读[N];学知报;2011年
3 肥城市泰西中学 刘红星;我的阅读课堂[N];学知报;2011年
4 大连三十六中 王慧慧;高中英语阅读理解的解题技巧[N];大连日报;2008年
5 冷梅华;高中英语阅读理解解题技巧[N];黔西南日报;2009年
6 主讲人:胡国燕(特级教师);高考英语阅读理解复习[N];福建日报;2003年
7 东营市垦利县实验中学 曲英红;英语阅读变量对阅读理解的影响[N];学知报;2010年
8 王长喜;重视阅读理解 树立大阅读观念[N];中国教育报;2004年
9 江西省万年中学 李红英;浅析怎样提高高中生英语阅读理解能力及解题技巧[N];学知报;2010年
10 ;阅读理解猜词练习[N];福建日报;2003年
中国博士学位论文全文数据库 前10条
1 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
2 何斌;基于可拓逻辑的机器学习理论与方法[D];华南理工大学;2005年
3 王国胜;支持向量机的理论与算法研究[D];北京邮电大学;2008年
4 胡崇海;基于图的半监督机器学习[D];浙江大学;2008年
5 刘长安;基于实例归纳的工艺规划方法及集成CAPP系统研究[D];山东大学;2003年
6 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
7 钟志;基于异常行为辨识的智能监控技术研究[D];上海交通大学;2008年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
10 牛晓太;多模式智能谈判支持系统的理论与方法研究[D];武汉大学;2004年
中国硕士学位论文全文数据库 前10条
1 郑文怡;XML标签语义匹配的研究及应用[D];江苏大学;2005年
2 唐艳鸣;试论中职生英语有效阅读教学策略[D];福建师范大学;2005年
3 谭蔚;非英语专业大学生的ESL词汇知识对阅读理解之影响[D];西南交通大学;2005年
4 沈小兰;从阅读的心理过程谈高中英语阅读“三阶段”教学模式[D];华中师范大学;2006年
5 沈菊芬;大学生英语阅读理解元认知策略的培养[D];上海外国语大学;2007年
6 赵艳妮;词汇衔接模式在英语专业学生阅读理解教学中的应用[D];西北师范大学;2010年
7 艾琳;关联理论及其对阅读理解的启示[D];上海外国语大学;2004年
8 赵秀红;合理删词完形填空与外语学习中阅读能力考察[D];山西大学;2006年
9 王丹;对非英语专业学生阅读策略元认知意识的实证分析[D];辽宁师范大学;2009年
10 贺创新;图式理论与英语阅读理解[D];湖南师范大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026