收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于历史信息的中文多层次句法分析研究

耿向好  
【摘要】: 伴随着计算机综合能力的日益强大和互联网的迅猛发展,社会的信息化程度越来越高,自然语言作为信息的重要载体,对它的计算机处理就显得格外重要。句法分析是自然语言处理的一个基本问题。基于历史信息的句法分析模型将句法分析树的构建转换为一系列的分类问题,由于其采用机器学习的方法,且与具体的语言和文法关联较少,因此具有较强的灵活性和可扩展性。 本文基于统计的方法,提出了一种基于历史信息的中文多层次句法分析方法,在正确分词的基础上,实现了一个包括词性标注、基本短语识别、深层句法分析的基于词的句法分析系统。系统采用最大熵模型进行参数学习,在每层处理过程中,优先识别出容易识别的组块,在此基础上根据更丰富的上下文信息循环进行复杂组块的识别,直至识别出根结点。实验证明本系统取得了较好的性能。 本文还实现了基于词的句法分析树到基于字的句法分析树的转换,最终实现了一种基于自动分词的句法分析系统,系统的分词准确率在96%左右,在宾州中文树库测试集Section271-300上,实验分析了系统的性能,并进一步分析了不同分词结果对句法分析的影响。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵法兴;赵伟;;平滑的最大熵模型在汉语词性自动标注中的应用[J];长春工业大学学报(自然科学版);2007年02期
2 耿向好;李军辉;周国栋;朱巧明;;一种基于历史信息的多层次中文句法分析方法[J];计算机应用与软件;2009年06期
3 韦小丽;孙涌;张书奎;苗艳军;;基于最大熵模型的本体概念获取方法[J];计算机工程;2009年24期
4 雷雪梅;王大亮;田中贵秋;曾广平;;基于深层特征抽取的日文词义消歧系统[J];北京科技大学学报;2010年02期
5 戴文华,焦翠珍,徐斌;基于统计的自然语言处理模型[J];咸宁学院学报;2005年03期
6 游斓,周雅倩,黄萱菁,吴立德;基于最大熵模型的QA系统置信度评分算法[J];软件学报;2005年08期
7 尹木;肖铮;;词性标注与动词细分类研究[J];电脑知识与技术;2009年24期
8 王永生;柴佩琪;;英文文语转换系统中基于决策树的词性标注的非监督学习[J];计算机应用;2006年03期
9 王保芳;张瑞强;;关于对数线性模型在词性标注中的应用[J];计算机科学;2008年05期
10 刘兴林;郑启伦;马千里;;中文合成词识别及分词修正[J];计算机应用研究;2011年08期
11 赵岩;王晓龙;刘秉权;关毅;;融合聚类触发对特征的最大熵词性标注模型[J];计算机研究与发展;2006年02期
12 于江德;樊孝忠;尹继豪;;隐马尔可夫模型在自然语言处理中的应用[J];计算机工程与设计;2007年22期
13 张立岩;吕玲;王井阳;;基于最大熵算法的全文检索研究[J];河北科技大学学报;2009年02期
14 屈刚,陆汝占;一个改进的汉语词性标注系统[J];上海交通大学学报;2003年06期
15 冯丽萍;焦莉娟;;基于最大熵的中文组织机构名识别模型[J];计算机与数字工程;2010年12期
16 陈笑蓉;秦进;;基于最大熵原理的汉语词义消歧[J];计算机科学;2005年05期
17 康旭珍;李茹;李双红;;框架元素语义核心词自动识别研究[J];中文信息学报;2011年04期
18 胡乃全;孔芳;王海东;周国栋;朱巧明;;基于最大熵模型的中文指代消解系统实现[J];计算机应用研究;2009年08期
19 陈敏杰;;问答系统中问题分析模块的实现[J];经营管理者;2009年13期
20 孟维娟;;自然语言处理中的歧义[J];上海电机学院学报;2006年S1期
中国重要会议论文全文数据库 前10条
1 李军辉;周国栋;朱巧明;钱培德;;基于层次模型的中文句法分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 孙涌;韦小丽;;领域本体构建研究及在专利信息服务中的应用[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
3 帕里旦·吐尔逊;艾山·吾买尔;吐尔根·依布拉音;早克热·卡德尔;阿力木江·艾沙;;基于最大熵的维吾尔语词性标注模型[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 王波;王厚峰;;中文单词聚类的比较研究[A];第三届学生计算语言学研讨会论文集[C];2006年
6 俞士汶;段慧明;朱学锋;;词语兼类暨动词向名词漂移现象的计量分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
8 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
10 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
2 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
3 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
4 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年
5 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
6 袁彩霞;中文功能组块分析及应用研究[D];北京邮电大学;2009年
7 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
8 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
9 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
10 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 耿向好;基于历史信息的中文多层次句法分析研究[D];苏州大学;2008年
2 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
3 杨辉;汉语新词语发现及其词性标注方法研究[D];复旦大学;2008年
4 张慧;汉语句法分析及其在汉英统计翻译中的应用[D];厦门大学;2007年
5 李江;自然语言编程研究[D];北京邮电大学;2008年
6 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
7 乔永波;规则与统计相结合的中文命名实体识别[D];山东大学;2007年
8 罗雪兵;汉语组块识别的研究[D];大连理工大学;2007年
9 于静;汉语句子的组块识别研究[D];大连理工大学;2008年
10 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
中国重要报纸全文数据库 前10条
1 胡敏;生动再现“老扬州”风情[N];扬州日报;2008年
2 李天际 宋云辉 胡世钦;北京白塔寺周边重现仿古街[N];中国建设报;2009年
3 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
4 郭安平;全面保护 延续“历史信息”[N];南充日报;2010年
5 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
6 宋忠祖 分社;乐都文物普查有新成果[N];青海日报;2009年
7 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
8 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
9 王景慧;为何要在原址上保护古建筑[N];光明日报;2006年
10 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978