收藏本站
《华东交通大学》 2014年
收藏 | 手机打开
二维码
手机客户端打开本文

自动问答系统中问句相似度计算方法研究

徐海洲  
【摘要】:问句相似度计算方法是是基于常问问题集的问答系统中的关键部分,汉语句子相似度计算与词法分析、句法分析技术有重要的关系,然而目前的句法分析技术仍然有待提高;另外根据语义词典进行语义分析时,未登录词也会影响分析的结果。基础工作的不成熟制约了句子相似度计算方法的研究。问句是一种特殊形式的句子,汉语问句通常用语调、疑问词、语气词等进行提问。本文根据问句的特点,结合现在较成熟的词法分析技术对问句相似度计算进行了深入的研究。本文的主要研究工作如下: (1)首先从一般形式句子和问句形式的句子两个方面对已有的句子相似度计算方法进行了介绍,然后对各种方法的优缺点进行了分析和比较,最后对汉语句子相似度计算方法的难点进行了分析。 (2)根据问句的特点,结合现在较成熟的词法分析技术,抽取出了问句中的核心成分主题和焦点,并据此提出了一种基于Topic-Focus的问句相似度计算方法。文中按照问句预处理、核心词识别、问句相似度计算三部分对该算法进行了描述,创新点在于提出了一种不依赖于句法分析工具和外部语义词典的问句主题和焦点的抽取方法,并在计算问句相似度时考虑了主题和焦点的影响。实验中显示该方法效果较好。 (3)将本文提出的算法用在旅游领域的问答系统中。本文设计了问句检索的模型,详细描述了检索的流程、检索中的关键技术等。然后介绍了旅游领域问答系统中各个模块的具体实现方法,包括问句分析、信息检索和问句相似度计算。最后编程实现了旅游领域内的问答系统,并对本文的算法和系统性能进行测试,给出了评测结果。
【学位授予单位】:华东交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 穗志方,俞士汶;汉语单句谓语中心词识别知识的获取及应用[J];北京大学学报(自然科学版);1998年Z1期
2 秦兵,刘挺,王洋,郑实福,李生;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
3 玄玥;焦点问题研究综述[J];汉语学习;2002年04期
4 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
5 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
6 曹志娟;李祖枢;刘朝涛;;自动问答系统中的问题理解研究[J];计算机科学;2005年11期
7 王品;黄广君;;信息检索中的句子相似度计算[J];计算机工程;2011年12期
8 唐娟;杜亚军;王可亮;;一种基于形式概念分析的问答系统答案抽取的研究[J];计算机应用;2007年03期
9 毛先领;李晓明;;问答系统研究综述[J];计算机科学与探索;2012年03期
10 吴友政,赵军,段湘煜,徐波;问答式检索技术及评测研究综述[J];中文信息学报;2005年03期
【共引文献】
中国期刊全文数据库 前10条
1 余足云;“是……的”句式的比较与系统分析[J];阿坝师范高等专科学校学报;2003年03期
2 罗长寿;张峻峰;孙素芬;魏清凤;;基于改进VSM的农业实用技术自动问答系统研究[J];安徽农业科学;2009年28期
3 段建勇;李俊;张梅;马礼;;限定领域的自动问答系统研究[J];北方工业大学学报;2010年01期
4 李智;;义素分析法与词典释义[J];北方论丛;2007年02期
5 吴娜炯;;格语法在主观题自动阅卷中的应用[J];办公自动化;2010年08期
6 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期
7 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
8 陈康;樊孝忠;刘杰;贾可亮;;基于问句语义表征的中文问句相似度计算方法[J];北京理工大学学报;2007年12期
9 何晓彦;黄家琳;;中文口语开放域问答系统中问句分析处理方法的研讨[J];北京工商大学学报(自然科学版);2007年06期
10 秦莉;;从“工薪族”、“上班族”二个词语看民族人的词类观[J];才智;2008年19期
中国重要会议论文全文数据库 前10条
1 加米拉·吾守尔;瓦依提·阿布力孜;吐尔根·依布拉音;;《现代维吾尔语语法信息词典》数据库建设的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系统中的应用研究[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
3 徐海;;英、汉分类词典编纂刍议[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
4 王红军;徐林;张继宏;;一种模糊综合决策汉语谓词识别算法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
5 熊文新;宋柔;;信息检索查询语句的表述分析[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
6 刘国刚;;人工智能客户服务体系的研究与实现[A];2008年中国通信学会无线及移动通信委员会学术年会论文集[C];2008年
7 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
8 余晓峰;刘鹏远;赵铁军;;一种基于《知网》的汉语词语词义消歧方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 张宇;刘挺;文勖;;基于改进贝叶斯模型的问题分类[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 赵妍妍;秦兵;刘挺;张俐;苏中;;基于多特征融合的句子相似度计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
2 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
3 方清明;现代汉语名名复合形式的认知语义研究[D];暨南大学;2011年
4 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
5 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
6 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
7 朴锦海;汉韩频率副词对比研究[D];中央民族大学;2011年
8 胡晓慧;动词后“上”与“下”、“来”与“去”的语义演变及其不对称性[D];浙江大学;2010年
9 冀芳;济宁方言义位研究[D];山东大学;2011年
10 许浩;《名公书判清明集》词汇研究[D];山东大学;2011年
中国硕士学位论文全文数据库 前10条
1 李敏;对罗斯福和奥巴马就职演说的及物性分析[D];山东科技大学;2010年
2 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
3 宋文平;现代汉语“A而不B”格式的多角度研究[D];哈尔滨师范大学;2010年
4 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
5 刘国峰;数据模板匹配研究及在社保审计中的应用[D];哈尔滨工程大学;2010年
6 程国斌;基于指示词语义扩展的词义识别方法的研究[D];哈尔滨工程大学;2010年
7 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年
8 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
9 张瑶;英汉机器翻译中的英语动词汉译研究[D];大连理工大学;2010年
10 谢亮亮;俄语原因意义的表达及与汉语的对比研究[D];辽宁师范大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期
2 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
3 冯志伟;汉字和汉语的计算机处理[J];当代语言学;2001年01期
4 赵飞;周涛;张良;马鸣卉;刘金虎;余飞;查一龙;李睿琪;;维基百科研究综述[J];电子科技大学学报;2010年03期
5 赵巾帼;徐德智;罗庆云;;汉语句子相似度计算方法比对之研究[J];福建电脑;2007年10期
6 罗森林;韩磊;潘丽敏;冯扬;刘盈盈;;汉语句义结构模型及其验证[J];北京理工大学学报;2013年02期
7 郭艳华,周昌乐;自然语言理解研究综述[J];杭州电子工业学院学报;2000年01期
8 林鸿飞,战学刚,姚天顺;基于概念的文本结构分析方法[J];计算机研究与发展;2000年03期
9 林鸿飞,李业丽,姚天顺;中文文本过滤的信息分流机制[J];计算机研究与发展;2000年04期
10 李蕾,钟义信,郭祥昊;面向特定领域的理解型中文自动文摘系统[J];计算机研究与发展;2000年04期
中国重要会议论文全文数据库 前1条
1 吴友政;赵军;段湘煜;徐波;;构建汉语问答系统评测平台[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国硕士学位论文全文数据库 前7条
1 许林杰;中文文本分词研究[D];山东师范大学;2003年
2 刘文涛;信息处理用同音同形词研究[D];山东师范大学;2003年
3 丁豪;基于自然语言处理的文本自动校对系统[D];电子科技大学;2006年
4 刘小宇;基于语义理解的中文常问问答系统的研究[D];大连理工大学;2006年
5 李立;中文信息检索系统研究[D];华中师范大学;2008年
6 蔡刚山;中文自动问答系统研究[D];华中科技大学;2007年
7 朱红权;基于HowNet多特征结合的句子相似度计算[D];湖南大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 赵军;胡栓柱;樊兴华;;一种新的词语相似度计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
2 蔡东风;白宇;于水;叶娜;任晓娜;;一种基于语境的词语相似度计算方法[J];中文信息学报;2010年03期
3 丁政建;张路;;一种改进的本体相似度计算方法[J];计算机工程;2010年24期
4 朱珍元;郑诚;;一种改进的本体相似度计算方法[J];微型机与应用;2011年01期
5 崔韬世;麦范金;;词语相似度计算方法分析[J];网络安全技术与应用;2012年05期
6 王国春;郑山红;赵辉;董亚则;;基于阶段递进的综合本体相似度计算方法[J];吉林大学学报(信息科学版);2014年02期
7 张忠平;田淑霞;刘洪强;;一种新的本体相似度计算方法[J];计算机应用研究;2008年10期
8 赵欢;李仁发;王家琴;张在美;;综合多层信息的本体概念相似度计算方法的研究[J];通信学报;2009年06期
9 李改;李章凤;李磊;;一种新的社会化相似度计算方法[J];计算机应用研究;2013年09期
10 曾辉;徐海洲;钟茂生;;基于主题和焦点的问句相似度计算方法[J];科学技术与工程;2014年06期
中国重要会议论文全文数据库 前8条
1 白宇;于水;叶娜;蔡东风;任晓娜;;一种基于语境的词语相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
2 乔林;黄维通;孟威;;一种改进的知网系统词语相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 菅小艳;郑家恒;;一种改进的句子相似度计算方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 卢延科;尹宝生;张桂平;苗雪雷;白宇;;基于伪LCS的中文专利句子相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
5 章志凌;虞立群;罗海飞;邵晓敏;;基于改进Corpus库的词语相似度计算方法[A];第二十四届中国控制会议论文集(下册)[C];2005年
6 章成志;李斌;;基于混合策略的查询串相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 陈希友;冯少荣;张东站;薛永生;;基于反馈的用户访问预测模型[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
8 李天宁;肖桐;朱靖波;;科技论文的IPC自动标注[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国硕士学位论文全文数据库 前10条
1 陈欣;一种基于多属性本体的概念相似度计算方法的研究[D];东北师范大学;2010年
2 唐中林;基于本体的概念相似度计算方法的研究[D];武汉理工大学;2013年
3 徐海洲;自动问答系统中问句相似度计算方法研究[D];华东交通大学;2014年
4 王莹莹;中文短语相似度计算方法研究及应用[D];长沙理工大学;2008年
5 俞云飞;多特征融合的电影相似度计算方法研究[D];华东师范大学;2012年
6 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
7 江阿古丽·哈依达尔;哈萨克语句子相似度计算方法的研究[D];新疆大学;2012年
8 贾娜;基于本体的食品投诉文档文本分类研究[D];东北师范大学;2011年
9 牛庆鹏;博客朋友推荐技术的研究[D];东北大学;2009年
10 牛庆鹏;博客潜在朋友推荐技术的研究[D];东北大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026