收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于汉语框架网的中文问句分类研究

宋小香  
【摘要】: 计算机和网络的出现方便了人们对信息的获取,随着互联网的飞速发展和计算机的迅猛更新,如何从互联网上更快地获取到更准确的有用信息成了人们的关注热点。现有的搜索引擎返回给用户的都只是一些与搜索内容信息相关的网页,这就需要用户自己再从这些网页中进一步寻求所需信息。显然这给人们查询信息带来了许多不便,而且无形中降低了查询效率。而问答系统(Question Answering System, QA)只需用户给出简单的问句,便可以返回给用户简洁、准确的信息,快速而有效地满足了用户对信息的检索需求。因此,问答系统的研究逐渐受到国内外众多学者的广泛关注,并已经取得了一定的研究成果。 问句分类即确定问句所属的类型,是问答系统中必不可少的一部分,分类的准确性直接影响问答系统的性能。本文基于汉语框架网(Chinese FrameNet, CFN)提出了一种用于中文问句分类的新方法,该方法通过构建一系列CFN语义特征来表达每个问句的语义信息。首先选择五种汉语框架网特征作为候选特征,根据每一类别的分类精度对单个特征的分类能力进行排序,然后通过特征组合进行实验,选出具有最好分类效果的组合特征。 本文的主要工作包括: (1)通过调查问卷的形式收集并整理了山西旅游的相关问句2155条,并参照哈工大信息检索研究室的问句分类标准,结合山西旅游问句的特点,给出适合山西旅游的问句分类体系,分为7大类,73小类,进一步丰富了原有的中文问题分类体系。 (2)对CFN标注的问句集进行分析和整理,选出五种CFN语义特征,使用最大熵分类模型进行实验。首先对单个特征的分类能力进行排序,然后分别对这些特征的组合进行实验;通过实验,得到了其中三种特征的组合可以达到最好的分类效果;进一步从理论上分析了这三种特征对问句分类的重要性。最后本文还给出了每类问题的准确率、召回率以及F值。 (3)采用SVM分类器进行对比实验,实验结果表明,相比较于SVM分类器,最大熵分类模型比较适合于处理问句的分类。 问句分类是问答系统对问句进行处理的重要步骤,对后续模块起着很好的指导作用,提高问句分类的准确率可提高整个问答系统的性能。本文针对问句分类方法的尝试与探索进一步丰富和发展了中文问题分类的研究,并为设计高效的问答系统提供了一定的基础。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张洪莲;;电视谈话节目中问句与权势关系[J];吉林省教育学院学报;2008年12期
2 程显毅;朱倩;韩飞;;基于HNC和描述逻辑的问句语义块分析[J];广西师范大学学报(自然科学版);2010年03期
3 王程;;从一个例句看问号的使用[J];新闻战线;1981年11期
4 由丽萍;秦雅楠;董文博;裴夏璇;;框架与Petri网相结合的中文情境知识表示方法研究[J];情报理论与实践;2011年03期
5 杨永林;EAME:一种基于问句驱动、镜像模拟基础之上的文本生成系统[J];现代外语;2000年03期
6 多杰卓玛;;基于信息处理的藏文框架语义关系研究[J];西北民族大学学报(自然科学版);2010年01期
7 秦雅楠;由丽萍;董文博;裴夏璇;;一种基于框架的情境知识表示方法[J];情报杂志;2011年01期
8 贾可亮;樊孝忠;张禹;;基于HowNet语义相似度的FAQ研究[J];计算机应用;2007年09期
9 许莉;王大玲;夏秀峰;;基于句法和语义信息的问句特征提取方法[J];计算机工程;2010年21期
10 ;科技英语常识(五)[J];中外公路;1983年03期
11 张亮;王树梅;黄河燕;张孝飞;;面向中文问答系统的问句句法分析[J];山东大学学报(理学版);2006年03期
12 付斌;樊孝忠;;基于神经元网络的问句组块分析[J];计算机技术与发展;2006年10期
13 郭雁军;;基于英文文档的WHY问句自动问答技术研究[J];科技传播;2010年12期
14 蒋昌金;彭宏;马千里;林正春;王成;;受限领域中文问答系统问句分析研究[J];计算机工程与设计;2010年11期
15 张亮;陈肇雄;黄河燕;;问题分类的计算模型研究[J];计算机科学;2006年04期
16 叶忠杰;;基于课程本体的智能FAQ系统的设计[J];计算机时代;2007年12期
17 柴秀荣;王大为;;基于浅层语义的农业FAQ检索系统[J];农业网络信息;2009年08期
18 郭海旭;吕国英;李茹;;面向数据分析的中文问句句法研究[J];计算机工程与科学;2009年10期
19 卜文娟;张蕾;;基于概念图的中文FAQ问答系统[J];计算机工程;2010年14期
20 陈玉;;基于“为什么”问句的中文问答系统研究[J];农业网络信息;2010年11期
中国重要会议论文全文数据库 前10条
1 王荀;李素建;宋涛;姜伯平;;服务于内容侧面发现的框架识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 仇伟;黄高辉;姚天昉;;基于HowNet的汉语情感问句二层分类[A];第六届全国信息检索学术会议论文集[C];2010年
3 林丽;毕玉德;;越南语给予类动词的语义结构和层级分类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 张娜;李济洪;;基于语义标注的中文阅读理解语料库的建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 张惠春;由丽萍;谷波;刘开瑛;;面向框架语义分析的汉语句法分析模型[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 吾买尔江·库尔班;阿里甫·库尔班;;维吾尔语框架语义知识库语义角色描述体系研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 刘立;余正涛;王蒙;毛存礼;郭剑毅;;结合词相关特征与流行学习的中文问句分类[A];第六届全国信息检索学术会议论文集[C];2010年
8 洪颖楠;;框架语义理论与近义词辨析[A];首届海峡两岸外语教学与研究学术研讨会暨福建省外国语文学会2011年会论文集[C];2011年
9 王晓辉;;汉英语法对比的认知解释[A];江西省语言学会2010年年会论文集[C];2010年
10 康旭珍;李双红;李茹;;框架元素语义核心词自动识别研究[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 李茹;汉语句子框架语义结构分析技术研究[D];山西大学;2012年
2 李济洪;汉语框架语义角色的自动标注技术研究[D];山西大学;2010年
3 祁峰;现代汉语焦点研究[D];复旦大学;2012年
4 王君泽;基于大规模问答语料的问题检索系统[D];华中科技大学;2010年
5 司罗红;句子功能的线性实例化研究[D];华中师范大学;2011年
6 杨迎春;媒体访谈的引发与应答研究[D];黑龙江大学;2012年
7 张琳;汉语口语对话系统中口语语言分析[D];上海交通大学;2008年
8 谢元春;女性修辞研究[D];复旦大学;2011年
9 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
10 肖开容;翻译中的框架操作[D];西南大学;2012年
中国硕士学位论文全文数据库 前10条
1 宋小香;基于汉语框架网的中文问句分类研究[D];山西大学;2010年
2 王林娟;中学语文课堂话语问句的批评性分析[D];华东师范大学;2010年
3 刘跃红;问句依存句法及语义分析研究[D];昆明理工大学;2011年
4 王宇亮;面向时间敏感问句识别及检索的问答系统[D];哈尔滨工业大学;2010年
5 李姗;柳宗元散文中的问句研究[D];湖北师范学院;2012年
6 阿里甫.库尔班;维吾尔语框架语义知识库信息管理系统的设计与实现[D];电子科技大学;2011年
7 高亚慧;汉语框架自动识别中的歧义消解[D];山西大学;2011年
8 苏晓芳;《后汉书》测度问句研究[D];南京师范大学;2011年
9 张芊;蒙城方言“可VP”问句研究[D];河南大学;2012年
10 吴娟;《警世通言》疑问句研究[D];曲阜师范大学;2012年
中国重要报纸全文数据库 前10条
1 本报记者 王治军 张磊 周洋 实习生 张玉宏;代表提问句句不离民生[N];大庆日报;2011年
2 殷雪梅;快速成交有窍门[N];中国商报;2000年
3 石夫;还有几个“最后”?[N];人民日报;2001年
4 本报记者 叶闪;宽带社区淘金路[N];计算机世界;2001年
5 秦仁杰;成功的答案不止一个[N];厂长经理日报;2001年
6 汤登仲;敲打“词眼”:溅出人格精神的火花[N];中国教育资讯报;2002年
7 本报记者 蔡云锦;国内软件企业追杀微软.NET[N];中国经营报;2000年
8 点戈;“公交司机问好”如何复制?[N];佛山日报;2011年
9 刘宇艳 杨玉婷 黄艳玲;牟平:创新乡村游产品 推出别样农家乐[N];中国旅游报;2010年
10 孙立极;发展好不好 百姓说了算[N];人民日报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978