收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于模式知识库的问题回答关键技术研究

杜永萍  
【摘要】:随着计算机可读的文本信息日益增多,有效查找和利用这些信息的迫切需求使得信息检索与信息抽取技术日益重要。但传统的搜索引擎存在的一些弊端给用户带来了一定的不便,如:用户的检索需求简单表示为一组关键词,往往会丢失很多语义信息;检索返回的结果为相关链接或文档列表,用户仍需阅读文档或片段以定位到真正需要的信息。问题回答的研究解决了这些存在的问题,首先,用户可将信息检索的需求表达为自然语言描述的问题,其次,问题回答将在文档集合中搜索并返回问题的精确答案。这个任务看似简单,但对于计算机具有很大的挑战性。本文正是在这种前提下,对问题回答技术进行了探索性研究。 论文的工作主要集中在基于模式知识库实现问题回答的关键技术上,设计并实现了问题回答系统,参加了国际文本检索会议的评测。以此为基础,我们将模式匹配技术应用到了一个相关的更新的研究领域-阅读理解,并取得了好的效果。 实现模式匹配策略最关键也是最核心的任务,即建立一个完善的模式知识库。我们提出了一种基于答案类型与问题模式的问题分类体系,同时保留了问题的语义信息与结构信息。借助TREC的评测问题集作为我们的训练与测试数据,对不同的问题分类类型进行答案模式的自动学习与评价。 我们对具有复杂结构的问题实现了模式学习,包含多个问题元素的较复杂的答案模式对于抽取出正确答案更有效更可靠。这是简单模式所无法覆盖的。同时,我们对模式匹配得到的侯选答案增加了语义类型约束,使其有更高的准确率。 为了使学习到的答案模式有更好的可扩展性,我们采取了泛化策略,在模式中加入了实体名的信息,这样,模式组成结构中不仅包含词形,也融入了语义信息,使其具有较好的鲁棒性。 答案模式的评价指标采用了数据挖掘中的可信率(Confidence)与支持率(Support)。高可信率的答案模式有更高的可靠性抽取到正确答案。 在阅读理解系统的实现中,我们引入了WordNet的同义词信息、模式匹配和上下文辅助策略,取得了明显的效果,进一步提高了系统性能,性能超过了之前的最好结果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杜永萍;何明;;基于多策略的单文档问答式信息检索技术[J];计算机科学;2009年07期
2 谢丽聪;模式匹配的一种新方法[J];福州大学学报(自然科学版);2003年03期
3 宋婉娟;张剑;;基于机器学习的网络入侵检测[J];科技信息;2009年23期
4 林敏;;基于机器学习的网络攻击检测综述[J];数字技术与应用;2010年10期
5 周荃;王崇骏;王珺;周新民;陈世福;;基于人工智能技术的网络入侵检测的若干方法[J];计算机应用研究;2007年05期
6 何琳;杜慧平;侯汉清;;领域本体的半自动构建方法研究[J];图书馆理论与实践;2007年05期
7 张宝燕;毛海飞;;汉语框架网络学习策略研究[J];山西电子技术;2008年06期
8 吴启明;阮忠;;基于XML个性化教学系统的设计[J];科技创新导报;2008年26期
9 吕建;徐家福;;软件自动化的智能化途径[J];科学通报;1993年02期
10 胡俊翘,胡友兰,李德群;改进的基因遗传算法在专家系统机器学习中的应用[J];计算机辅助工程;1994年01期
11 阎明印,栾江南,杨叔子;具有学习功能的机械设备智能诊断系统[J];沈阳工业学院学报;1997年04期
12 高阳;周志华;孙晨;陈兆乾;陈世福;;从FTART网络中抽取if-then规则[J];模式识别与人工智能;1999年04期
13 吴艳;刘建波;;电子邮件自动处理的用户模型设计[J];沈阳化工学院学报;2005年04期
14 胡彩霞;;利用决策树获取搜索结果页面中的匹配数[J];科技咨询导报;2007年06期
15 刘星毅;农国才;;几种不同缺失值填充方法的比较[J];南宁师范高等专科学校学报;2007年03期
16 鲁晓南;接标;;一种基于个性化邮件特征的反垃圾邮件系统[J];计算机技术与发展;2009年08期
17 王存睿;文晋;;基于人脸检测的教室信息智能采集系统[J];大连民族学院学报;2009年05期
18 阎巍;;基于决策树的软件项目估算方法[J];计算机工程与科学;2009年08期
19 王厚峰;;计算语言学歧义消解研究——兼介绍北京大学计算语言学教育部重点实验室[J];术语标准化与信息技术;2010年03期
20 苏剑波;;第3届IEEE机器学习与控制论国际会议[J];国际学术动态;2005年02期
中国重要会议论文全文数据库 前10条
1 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
2 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 谢世朋;胡茂林;;基于局部仿射区域对稀疏纹理分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
5 张郴;;基于神经网络集成的旅游需求预测模型[A];中国地理学会百年庆典学术论文摘要集[C];2009年
6 吴宪祥;于培松;万旻;倪伟;郭宝龙;;RoboCup中智能体的参数优化和学习[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
7 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 杨磊;黎志成;胡斌;;基于人工神经网络的调度规则确定专家系统[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
9 张燕;张付志;;跨系统个性化服务方法和用户模型研究[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
10 陈时敏;韩心慧;;基于机器学习的网页木马识别方法研究[A];第26次全国计算机安全学术交流会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
2 何斌;基于可拓逻辑的机器学习理论与方法[D];华南理工大学;2005年
3 王国胜;支持向量机的理论与算法研究[D];北京邮电大学;2008年
4 胡崇海;基于图的半监督机器学习[D];浙江大学;2008年
5 刘长安;基于实例归纳的工艺规划方法及集成CAPP系统研究[D];山东大学;2003年
6 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
7 钟志;基于异常行为辨识的智能监控技术研究[D];上海交通大学;2008年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
10 牛晓太;多模式智能谈判支持系统的理论与方法研究[D];武汉大学;2004年
中国硕士学位论文全文数据库 前10条
1 郑文怡;XML标签语义匹配的研究及应用[D];江苏大学;2005年
2 唐艳鸣;试论中职生英语有效阅读教学策略[D];福建师范大学;2005年
3 谭蔚;非英语专业大学生的ESL词汇知识对阅读理解之影响[D];西南交通大学;2005年
4 沈小兰;从阅读的心理过程谈高中英语阅读“三阶段”教学模式[D];华中师范大学;2006年
5 沈菊芬;大学生英语阅读理解元认知策略的培养[D];上海外国语大学;2007年
6 赵艳妮;词汇衔接模式在英语专业学生阅读理解教学中的应用[D];西北师范大学;2010年
7 艾琳;关联理论及其对阅读理解的启示[D];上海外国语大学;2004年
8 赵秀红;合理删词完形填空与外语学习中阅读能力考察[D];山西大学;2006年
9 王丹;对非英语专业学生阅读策略元认知意识的实证分析[D];辽宁师范大学;2009年
10 贺创新;图式理论与英语阅读理解[D];湖南师范大学;2003年
中国重要报纸全文数据库 前10条
1 记者 赵秋丽 通讯员 付永;山东7所高校改革英语教学[N];光明日报;2006年
2 肥城市实验中学 李海滨;认清规律,注重方法,巧解阅读[N];学知报;2011年
3 肥城市泰西中学 刘红星;我的阅读课堂[N];学知报;2011年
4 大连三十六中 王慧慧;高中英语阅读理解的解题技巧[N];大连日报;2008年
5 冷梅华;高中英语阅读理解解题技巧[N];黔西南日报;2009年
6 主讲人:胡国燕(特级教师);高考英语阅读理解复习[N];福建日报;2003年
7 东营市垦利县实验中学 曲英红;英语阅读变量对阅读理解的影响[N];学知报;2010年
8 王长喜;重视阅读理解 树立大阅读观念[N];中国教育报;2004年
9 江西省万年中学 李红英;浅析怎样提高高中生英语阅读理解能力及解题技巧[N];学知报;2010年
10 ;阅读理解猜词练习[N];福建日报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978