收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于概率上下文无关语法的句法分析研究与实现

皮晓峰  
【摘要】:本文论述了基于概率的上下文无关语法的句法分析的原理及实现过程。本文首先回顾了自然语言的发展历史和应用范围,同时介绍了句法分析在自然语言中的重要的地位和本文的主要工作。 然后介绍了句法分析的常用的分析方法,并对本文的基于概率的上下文无关语法的句法分析器所采用线图分析法作了重点介绍,分析了这种方法的原理以及优点。 本文的句法分析器是基于概率上下文无关语法的,这种方法是统计分析模型中比较成功的一种模式。在本文的第三章详细介绍了PCFG的排除句子歧义的原理,并用具体实例加以阐述。基于概率的分析,当然最重要的就是概率的提取问题,在本文的第四章给出了提取概率的详细算法及实例,解决了基于概率上下文无关语法的三个重要问题。即采用向内向外算法,在给定一部概率上下文无关语法的前提下,计算句子的概率;采用Viterbi算法,在给定一部概率上下文无关语法以及句子前提下,找出最为可能的分析树。采用向内-向外算法,为语法规则选择概率,使得训练句子的概率最大。 在对真实的句子进行句法分析的时候会遇到很多问题。本文第五章针对一些具体问题提出了一些解决方案,取得了一定的成效。主要有以下几个方面。 1)根据汉语,既缺乏形态变化,又缺乏作为句法标志的黏着成分的外在特征,本文采用了短语本位的思想。 2)针对汉语的具体特点,在本文中设计了预处理系统,系统利用特征词在对句子进行综合分析之前预测句子的句法结构,换句话说,预处理实际上是部分句法分析,它起着导引综合分析的作用,避免了不必要的计算。 3)在本文中针对基于统计句法分析中数据稀疏问题,采取了数据平滑技术,使该问题得以缓解。 4)在汉语中特定的句法范畴与特定词类之间的共现关系,在本文的句法分析器中,句法分析的歧义消解引入这类共现信息。即本文提到的制约法消歧,也就是利用句法、语义等制约条件排除不能满足制约条件的结构,从而达到消歧目的。 在第六章列出了本句法分析器实验结果,并与其它几种统计句法分析模型进行了比较分析。 最后,本文分析了本系统的存在的缺陷及一些改进措施。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 龚纪文,许德如;利用Access97编制科技论文登记及统计数据库[J];华东地质学院学报;2001年01期
2 徐汀荣;统计查询完备化的算法设计与实现[J];微机发展;1992年03期
3 孔繁民,姬爱敏;统计中的查找计数方法[J];郑州轻工业学院学报(自然科学版);1992年03期
4 罗守进,冒晓斌;RAPD文献分布的探讨[J];农业图书情报学刊;1997年S1期
5 刘淑华,傅晓琴,张君晓;1995~1999年《华南理工大学学报》统计与分析[J];华南理工大学学报(自然科学版);1999年12期
6 罗永龙,殷治国;CBMS的性能及设计与开发[J];安庆师范学院学报(自然科学版);2000年01期
7 邓春燕;谈谈数据库多项目的快速统计[J];河池师专学报;2001年02期
8 易东,严中洪,王文昌;用Excel制作统计随机抽样教学课件[J];重庆工业高等专科学校学报;2002年02期
9 涂海青,黄孝群,张红亚;《常熟高专学报》引文统计分析[J];常熟高专学报;2002年05期
10 刘树梅;我国政府R&D经费投入状况研究[J];科技管理研究;2002年02期
11 谢从满,陈敬云;Protel在有线电视网络规划和管理中的应用[J];中国有线电视;2003年14期
12 陈敏,杨持;2002年福建省中医药查新课题统计与分析[J];情报探索;2003年04期
13 杨婷,唐月华,蔺蓉,樊光辉;Excel在医疗统计分析中的应用[J];中国医院统计;2003年04期
14 陈华,柳宏坤;用抽样调查法统计图书拒借率[J];现代情报;2003年11期
15 董佳;《情报理论与实践》(1997~2002)论文主题统计分析[J];现代情报;2004年02期
16 林寿;美国《数学评论》对中国师专论文评论的统计分析[J];怀化学院学报;1995年05期
17 费愉庆;数理统计分析在读者服务中的应用[J];苏州丝绸工学院学报;1998年04期
18 宋建业,李慧,王引乾;路局货运工作统计信息管理系统开发研究[J];铁路计算机应用;1998年04期
19 余英;我国11种地震学期刊的引文统计分析[J];新疆教育学院学报;1999年S1期
20 李惠芝;2000年《晋图学刊》载文分析[J];晋图学刊;2001年03期
中国重要会议论文全文数据库 前10条
1 斯·劳格劳;华沙宝;萨如拉;;基于统计方法的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 邢少伟;朱天答;杨河洲;;汽车造型效果图、线图、模型之间的转换关系及方法[A];经济策论(下)[C];2011年
4 陈劲光;何婷婷;李芳;桂卓民;;基于概率和句法分析的中文句子修剪[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 王丹;姬东鸿;黄玮;;一种基于MIRA和遗传算法的句法分析模型构造方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 才藏太;;基于规则的汉藏机器翻译系统中二分法的句法分析方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 张晓甜;赵海;;基于树结构模式挖掘的非监督中文短语结构句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 赵铁军;李生;孟遥;黄玉;杨沐昀;;机器翻译系统中句法分析技术的研究实践[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
9 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
10 曹海龙;孟遥;李生;赵铁军;;一个改进的头驱动英语句法分析模型[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
2 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
3 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
4 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
5 赵霆雷;线图与若干典型图类的交叉数研究[D];湖南师范大学;2006年
6 吕连忠;类星体多谱勒红移研究[D];中国科学院研究生院(云南天文台);2007年
7 张富文;伽玛暴脉冲时变特征及其对能量的依赖[D];中国科学院研究生院(云南天文台);2008年
8 安新慧;图中的哈密顿圈和图的列表线性荫度[D];新疆大学;2008年
9 唐秀玲;论话题及其在汉语语法分析中的应用[D];上海师范大学;1997年
10 刘娟;图与有向图的高阶连通性[D];新疆大学;2009年
中国硕士学位论文全文数据库 前10条
1 皮晓峰;基于概率上下文无关语法的句法分析研究与实现[D];电子科技大学;2005年
2 刘琍;“程度副词+名词”的语义、语用和句法分析[D];四川师范大学;2005年
3 金天;论汉语及英语中否定歧义的消除[D];广东外语外贸大学;2007年
4 尹鹏;基于SVM的中文组块间依存关系分析[D];大连理工大学;2006年
5 张萍;现代汉语标语语法研究[D];南京师范大学;2006年
6 赵德玉;汉语句法分析技术及其在机器人辅助教育智能接口中的应用研究[D];天津师范大学;2004年
7 顾芸;名词短语移位的句法分析[D];南京师范大学;2006年
8 周吉;自然语言处理及搜索引擎的研究[D];吉林大学;2007年
9 魏蓉;限定领域的基本陈述句句法分析[D];天津师范大学;2008年
10 张耀中;融合语义和句型信息的中文句法分析方法研究与实现[D];北京大学;2008年
中国重要报纸全文数据库 前10条
1 记者 佘峥;全市中小学都将有红线图[N];厦门日报;2010年
2 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
3 戴莹 楚学朋;手握利器灭“四害”[N];中国石化报;2011年
4 上海世基 黄永东 西南证券 赵波 北京首证 董旭海 倍新咨询 严为民 深圳海询 江启堂;再度破位 还有何处可退?[N];重庆商报;2000年
5 李琨;IBM百度共拓企业搜索[N];中国计算机报;2006年
6 孔伟;均线胶着之后……[N];山西经济日报;2002年
7 记者 潘竑;企业搜索:激活被遗忘的信息财富[N];金融时报;2006年
8 黄家坚;K线小连阳 黑马初长成[N];江苏经济报;2001年
9 黄家坚;主力护盘的特征[N];江苏经济报;2000年
10 张军;K线的综合分析[N];财经时报;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978