收藏本站
《河南大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

常识知识问答系统中知识库构建的研究与设计

汤赛丽  
【摘要】:知识库作为问答系统中用来储存知识的仓库,在整个系统中起到了非常重要的作用。一个功能和知识完备的知识库能够大大提高问答系统的效率与准确率。因此本文主要讨论问答系统的知识库构建的思想方法。 本文知识库的设计主要针对常识知识问答系统,由于常识知识的领域范围较广,知识的稳定性较差,因此知识的搜集和分类整理以及长期的维护将是知识库的一项重要任务。为了克服传统的基于知识库的问答系统需要建立大规模知识库,消耗大量的人力物力,以及基于传统信息检索与信息提取的问答系统答案准确性不高的缺点;同时充分发挥前者问答准确,可以进行一定的推理计算的优点,本文将上述两种方法结合起来,扬长避短,构建高效的知识库。本文主要从以下几个方面进行了研究: 1.基于问题的面向对象知识表示方法是本文构建知识库的主要方法,它是 以面向对象表示法为主体,每个对象以一个单独的文本来描述。将用户针对该对象经常提出的问题的类型名作为类或对象的属性名,能够回答该问题的文本内容作为属性的值。本文将用户问题分为十类,每一类对应一个属性名称,该属性名称作为标记将标注到描述对象的文本中。 利用基于问题的面向对象的知识表示方法,可以避免人工将知识形式化为知识点的繁杂过程。 2.研究利用“简单向量距离法”对入库的文本进行自动分类。 3.研究利用特征词典通过对句子进行特征提取的方法对原始文本进行自动标记。 本文对于知识的搜集分类以及文本的标注均采用机器自动为主,人工干预为辅的策略,在减少人力的同时大大提高了准确率。 4.利用本文构建的知识库高效准确地获取答案的方法。
【关键词】:问答系统 知识表示 面向对象 知识库 特征提取 相似度
【学位授予单位】:河南大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP311.52
【目录】:
  • 摘要2-3
  • Abstract3-7
  • 第1章 绪论7-14
  • 1.1 自然语言理解与问答系统7
  • 1.2 论文的目的和意义7-9
  • 1.3 问答系统概述9-12
  • 1.3.1 国内外的研究现状9-11
  • 1.3.2 存在的主要问题11-12
  • 1.4 常识知识问答系统的模型和论文的组织结构12-14
  • 第2章 关于常识知识表示的研究14-27
  • 2.1 知识表示概述14-15
  • 2.2 常识知识15-17
  • 2.2.1 常识知识的有关概念15
  • 2.2.2 常识知识和专业知识的区别15-16
  • 2.2.3 常识知识的重要性16
  • 2.2.4 常识知识表示的难点16-17
  • 2.3 基于问题的面向对象常识知识表示17-25
  • 2.3.1 基本思想18-19
  • 2.3.2 面向对象的知识表示方法19-20
  • 2.3.3 基于问题的面向对象知识表示的结构20-23
  • 2.3.4 常见问题与面向对象知识表示的属性对照分析23-25
  • 2.4 常识知识的关系数据库表示25-26
  • 2.5 本章小结26-27
  • 第3章 知识源文本的自动分类27-50
  • 3.1 词语切分与词性标注的研究27-35
  • 3.1.1 汉语自动分词方法30-32
  • 3.1.2 汉语词性自动标注技术32-35
  • 3.2 文本自动分类35-46
  • 3.2.1 自动分类概述35-36
  • 3.2.2 自动分类的意义36
  • 3.2.3 分类的定义36-37
  • 3.2.4 自动分类技术37-43
  • 3.2.5 特征提取43-46
  • 3.3 知识库文本自动分类功能实现46-49
  • 3.3.1 训练算法与分类算法47-48
  • 3.3.2 匹配阈值的选取48-49
  • 3.4 本章小结49-50
  • 第4章 知识源文本自动标记50-52
  • 4.1 句子的特征提取50-51
  • 4.2 自动标注算法51
  • 4.3 本章小结51-52
  • 第5章 知识库答案提取的研究52-60
  • 5.1 答案提取的目的52-54
  • 5.2 问题答案的提取54-59
  • 5.2.1 问句与答案候选句相似度的计算55-58
  • 5.2.2 知识库的简单推理功能58-59
  • 5.3 本章小结59-60
  • 第6章 应用实例——儿童自然语言对话智力玩具系统的设计模型60-65
  • 6.1 儿童自然语言问答智力玩具系统的总体设计方案60-62
  • 6.2 儿童自然语言问答智力玩具系统的体系结构图62-65
  • 总结与展望65-67
  • 致谢67-68
  • 参考文献68-71
  • 攻读硕士学位期间的论文及科研成果71

【引证文献】
中国硕士学位论文全文数据库 前2条
1 郑智高;非处方药智能咨询系统的研究与开发[D];武汉理工大学;2006年
2 毋琳;特定领域问答系统中通用语义理解框架的设计与实现[D];河南大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
2 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
3 况立群,韩燮;基于对象的XML知识表示方法[J];华北工学院学报;2002年06期
4 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
5 陆伟民;;面向对象程序设计的专家系统研究[J];计算机科学;1990年05期
6 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
7 李彬,刘挺,秦兵,李生;基于语义依存的汉语句子相似度计算[J];计算机应用研究;2003年12期
8 俞士汶,朱学锋,王惠;《现代汉语语法信息词典》的新进展[J];中文信息学报;2001年01期
9 郑家恒,钱揖丽,李竞;二字词词义组合推理方法的研究[J];中文信息学报;2001年06期
10 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
【共引文献】
中国期刊全文数据库 前10条
1 徐江胜;;试论古汉语句子的焦点和焦点的凸显方式[J];安徽广播电视大学学报;2006年01期
2 李龙澍;;PROLOG线性归结的研究与设计[J];安徽大学学报(自然科学版);1997年03期
3 邵世磊;周国民;;昆虫信息数字化模型初步研究[J];安徽农业科学;2007年10期
4 濮永仙;;贝叶网在农业专家系统中的研究与应用[J];安徽农业科学;2011年07期
5 孙敏;姚海燕;;园艺植物专家系统研究概况与发展趋势[J];安徽农业科学;2012年02期
6 胡德明;;从反问句生成机制看“不是”的性质和语义[J];安徽师范大学学报(人文社会科学版);2008年03期
7 田金莲;;双数量否定供动可逆句的不对称性考察[J];安徽文学(下半月);2006年08期
8 何甫权;;英语指代与翻译[J];安徽文学(下半月);2008年08期
9 程玉胜,任广永;基于ROUGH集的决策树测试属性选择方法[J];安庆师范学院学报(自然科学版);2004年04期
10 程玉胜;Rosetta实验系统在机器学习中的应用[J];安庆师范学院学报(自然科学版);2005年02期
中国重要会议论文全文数据库 前10条
1 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
2 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 文齐;印桂生;杨光;;基于端口扫描和插件的网络漏洞扫描器的设计[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
4 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 徐德宽;;现代汉语双宾构造中两个宾语的题元角色[A];第六届汉语词汇语义学研讨会论文集[C];2005年
6 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
7 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
8 袁根根;;ERP系统下的交互式按需报告[A];中国会计学会高等工科院校分会2006年学术年会暨第十三届年会论文集[C];2006年
9 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
10 伍春香;陈世鸿;;基于本体的教育资源检索机制研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
2 郑军红;基于知识工程的智能夹具设计系统构建研究[D];浙江大学;2010年
3 王强;空间信息服务聚合的关键技术研究[D];解放军信息工程大学;2010年
4 戴小鹏;知识网格及其在农业生物灾害预警中关键技术研究[D];湖南农业大学;2010年
5 龙又珍;现代汉语寒暄系统研究[D];武汉大学;2009年
6 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
7 刘贵;精毛纺织品虚拟加工中的预报与反演模型研究[D];东华大学;2010年
8 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年
9 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
10 李青;现代汉语把字句主观性研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 赵桂阳;现代汉语“不是X的X”结构考察[D];哈尔滨师范大学;2010年
2 冯海瑛;《万历野获编》分词理论与实践[D];广西师范学院;2010年
3 刘婧一;元代笔记分词理论与实践[D];广西师范学院;2010年
4 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
5 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
6 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
7 解保忠;计算机在矽肺病早期诊断及预测中的应用研究[D];哈尔滨工程大学;2010年
8 耿倩;基于文本相似度计算的文本聚类算法研究与实现[D];哈尔滨工程大学;2010年
9 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年
10 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 姚一波,王纪亮;医疗诊断系统专家知识的表达与获取方法[J];信息技术;2002年02期
2 周爱武,汪海威;基于“规则架+规则体”知识库的一致性与冗余性检查[J];合肥工业大学学报(自然科学版);1998年03期
3 杨莉,杨权,胡守仁;FKMS不精确知识库管理系统的设计与实现[J];计算机研究与发展;1993年12期
4 杨天奇;数据库中的模糊规则获取方法[J];计算机工程与应用;2002年23期
5 吴顺祥;基于数据库的专家系统的研究[J];计算机工程与应用;1996年05期
6 曾绍华,杨国才,夏国恩;面向Internet的养蚕专家咨询系统设计[J];计算机与农业.综合版;2003年11期
7 胡志洁,李潭溪;慢性肺原性心脏病计算机诊断专家系统[J];计算机应用研究;2003年02期
8 杨毅,张曦,陶琳丽,吴兴勇,曹志勇;基于Internet的动物营养与饲料专家咨询系统设计与关键技术研究[J];计算机应用与软件;2003年09期
9 刘树安,于大鹏;基于推理网络的文本检索模型[J];控制与决策;2001年S1期
10 张普;信息处理用现代汉语语义分析的理论与方法[J];中文信息学报;1991年03期
中国博士学位论文全文数据库 前1条
1 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
中国硕士学位论文全文数据库 前10条
1 郭方芳;不确定推理规则确定度的研究[D];辽宁师范大学;2001年
2 张春雨;中国枣网上智能专家系统[D];河北农业大学;2002年
3 何方强;非处方药营销体系研究[D];中南大学;2002年
4 宋超;我国非处方药市场分析与预测[D];沈阳药科大学;2003年
5 吴钊;模糊口腔癌症诊疗专家系统的设计与实现[D];武汉理工大学;2002年
6 钟文;不确定推理在多源信息融合中的若干应用研究[D];南京理工大学;2003年
7 吴恒洋;模糊推理的数学结构及其应用[D];上海师范大学;2004年
8 闫建红;基于产生式规则的税务稽查系统的研究[D];太原理工大学;2004年
9 萧海东;基于知识库的知识网络研究[D];兰州理工大学;2004年
10 董军;知识库技术在企业文档管理中的应用[D];武汉大学;2004年
【二级引证文献】
中国硕士学位论文全文数据库 前4条
1 江磊;领域词典的构建及其在语法分析中的应用[D];南京邮电大学;2011年
2 陈建伟;基于WEB的中医营养学专家系统的研究与实现[D];厦门大学;2009年
3 郝殿;基于B/S模式的矿井通风信息决策与处理系统研究[D];河南理工大学;2009年
4 薛冰;一种基于知网的社会化问答系统研究与实现[D];西安电子科技大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
2 张晋,陈立潮,田容;未来基于Web的通用数据格式——XML[J];华北工学院学报;2001年02期
3 郭艳华,周昌乐;一种汉语语句依存关系网协动生成方法研究[J];杭州电子工业学院学报;2000年04期
4 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
5 朱寰,阮彤,于庆喜;文本分割算法对中文信息过滤影响研究[J];计算机工程与应用;2002年13期
6 陆伟民;;面向对象程序设计的专家系统研究[J];计算机科学;1990年05期
7 周强;;基于语料库和面向统计学的自然语言处理技术[J];计算机科学;1995年04期
8 王挺;陈火旺;史晓东;;语料库和机器翻译[J];计算机科学;1996年02期
9 王厚峰;;句类中E块的作用及其判定策略[J];计算机科学;2000年05期
10 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
中国重要会议论文全文数据库 前1条
1 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 汤赛丽,郑逢斌;基于问题的面向对象知识表示方法的研究[J];现代计算机;2005年08期
2 马闯,周军,钟志华;面向对象知识表示方法在冲压模具初始设计中的应用[J];模具技术;2001年05期
3 陈新中,蔺丽华,王道平;面向对象的知识表示方法研究[J];西安科技学院学报;1999年04期
4 刘凤琴;张孟杰;杨庆;;一个面向对象知识表示系统的设计与实现[J];农业网络信息;1993年03期
5 冯豪,何玉林,麻芳兰,杜静;面向对象知识表示方法在摩托车设计中的应用[J];重庆大学学报(自然科学版);2005年01期
6 沈玉利;刘双印;徐龙琴;冯大春;;农业科技服务知识体系的研究与系统构建[J];仲恺农业技术学院学报;2008年04期
7 刘群;刘杰;陈述;刘大昕;刘健民;;一个工程应用型专家系统——ADPGE[J];哈尔滨工程大学学报;1996年01期
8 镇璐;蒋祖华;刘超;梁军;;语义Web中工程设计类知识表示研究[J];计算机工程;2007年12期
9 杜建新,吴捷,吴文振;IDSS中的信息表示一致化[J];教育信息化;1999年06期
10 王猛,车永才,汤国水;矿业专家系统面向对象知识方法研究[J];辽宁工程技术大学学报;2003年S1期
中国重要会议论文全文数据库 前10条
1 钱震林;符雪桐;;一种面向对象的FMS调度知识表示方法[A];1998中国控制与决策学术年会论文集[C];1998年
2 罗文新;何敢想;毛维伦;许腊英;罗锎;;面向对象的中医理论体系[A];中医药学术发展大会论文集[C];2005年
3 杨卫东;施于宏;葛亮;施伯乐;;面向对象的Web应用建模[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
4 陶维青;;基于BORLAND C_(++)类库的专家系统知识库设计方法[A];1995中国控制与决策学术年会论文集[C];1995年
5 王晓红;李玉刚;项曙光;韩方煜;;面向对象的乙烯裂解工段动态模型[A];过程系统工程2001年会论文集[C];2001年
6 柳诚飞;居德华;;面向对象的数据库在CASE环境中的应用[A];第九届全国数据库学术会议论文集(上)[C];1990年
7 王传国;董逸生;;一种面向对象的关系数据库辅助设计工具[A];第十届全国数据库学术会议论文集[C];1992年
8 丁国良;张春路;刘建;魏文建;Masae Nakayama;Masaharu Fukaya;Gaiken OH;Takefumi Inagaki;;面向对象的整体式翅片管换热器快速仿真软件开发[A];上海市制冷学会二○○三年学术年会论文集[C];2003年
9 饶上荣;李士才;;基于对象模型的规则组合表格模板设计[A];全国第13届计算机辅助设计与图形学(CAD/CG)学术会议论文集[C];2004年
10 刘付娥;葛宁;;在面向对象的SoC设计中应用设计模式[A];中国通信集成电路技术与应用研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 崔林 吴鹤龄;2001年图灵奖“面向对象”[N];计算机世界;2002年
2 旷;《基于项目的软件工程:面向对象研究方法》[N];中国图书商报;2002年
3 ;产品数据管理(PDM)简述[N];中国船舶报;2003年
4 浙江大学能源工程学系副主任 教授 博士生导师 邱利民;移动通信基站空调应采用面向对象的冷却方法[N];人民邮电;2010年
5 张丽娜 记者 孙悦群;依兰投资60万创建农业科技信息平台[N];黑龙江经济报;2006年
6 郑鸿海叶聿辉;轻点鼠标 要点尽览[N];人民公安报;2007年
7 周传刚;解读数据库[N];解放军报;2005年
8 星雨;从通用走向实用[N];中国计算机报;2004年
9 任利民;我家我设计[N];中国电脑教育报;2002年
10 本报记者 熊文新 本报特约记者 周老九;清华五杰世纪之邀[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 蔡永昌;流形方法的理论与应用研究[D];重庆大学;2001年
2 李平;面向对象遗传算法及其在铁路行车指挥中的应用[D];铁道部科学研究院;2001年
3 田波;面向对象的滩涂湿地遥感与GIS应用研究[D];华东师范大学;2008年
4 张家安;市场条件下多区域电力系统分布式暂态稳定仿真[D];天津大学;2004年
5 郭健强;面向对象软件测试理论与技术的研究[D];西安电子科技大学;1999年
6 杜相文;面向对象的彩色视频四维矩阵DCT编码[D];吉林大学;2005年
7 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
8 路遥;用户交互式问答系统中问题推荐机制的研究[D];中国科学技术大学;2012年
9 黎新;面向问答系统的段落检索技术研究[D];中国科学技术大学;2010年
10 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 汤赛丽;常识知识问答系统中知识库构建的研究与设计[D];河南大学;2005年
2 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
3 刘祥;基于课程知识的问答系统研究与应用[D];大连海事大学;2010年
4 李旭锋;中文问答系统中问句理解和相似度计算的研究与实现[D];华南理工大学;2010年
5 刘渊杰;社区问答系统最佳回答机制的研究[D];上海交通大学;2010年
6 胡家豪;基于互联网的WEB舆情问答系统[D];电子科技大学;2011年
7 孙林;基于在线论坛的问答对识别研究与问答系统实现[D];哈尔滨工业大学;2010年
8 高艳影;中文问答系统中的问题分类研究[D];合肥工业大学;2011年
9 张诚;基于领域知识的限定域中文问答系统研究[D];上海交通大学;2010年
10 张兰轩;基于潜在语义分析的大学概况中文问答系统[D];大连理工大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026