收藏本站
《内蒙古大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

现代蒙古语依存句法自动分析研究

斯·劳格劳  
【摘要】:本文在蒙古文传统语法研究成果的基础上,充分利用已有的句法分析方法和蒙古文信息处理成果,并借鉴了其它语言句法分析的成功经验设计实现了基于依存语法的蒙古语自动句法分析系统。本文从以下几个方面对蒙古语依存句法进行研究并做了试验。 1)在分析归纳蒙古语句子词语之间的依存关系的基础上借鉴其它语言成功的句法标注体系,研制了基于依存语法的蒙古语句法标注体系。 2)研制了一套基于规则的蒙古语依存句法分析器,在规则描述中采用了上下文相关的多标记节点描述模型。该分析器所用到的静态信息均来自机器词典。为了提高词典的查询速度,采用了基于有限状态自动机的蒙古语词典数据组织模型。 3)利用蒙古语依存句法标注体系和基于规则的自动分析软件,通过自动分析和人工标注的途径构建了具有50余万词的蒙古语依存树库。 4)研制了一套基于统计方法的句法分析器,句法分析器的评测和统计模型的训练均采用了上述树库资源。之后又对基于规则的分析器和基于统计的分析器进行了融合,研制了一种基于混合策略的句法分析器。其中,统计方法采用了词汇依存概率模型。为了提高分析器的运行速度,预先建立了统计信息库,并采用了与机器词典相同的数据组织模型。 5)设计实现了蒙古语依存树库管理软件。该软件具有图形化的句法树显示功能和较为完善的树库编辑、查询和统计功能。 我们在上述依存树库上通过自动评测软件对上述基于规则的、基于统计方法的和基于混合策略的三种不同类型的句法分析器分别进行了性能测试,实验结果表明基于混合策略的依存分析器性能最好,其无标记准确率、有标记准确率和核心词查准率分别达到了77.18%、69.90%和95.44%。
【学位授予单位】:内蒙古大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:H212

【引证文献】
中国博士学位论文全文数据库 前1条
1 包敏娜;基于蒙古语影视剧语料库的话语标记研究[D];内蒙古大学;2012年
中国硕士学位论文全文数据库 前1条
1 陈红霞;从比格形式名词的语义角色辨析研究[D];内蒙古大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 刘海涛;;基于依存树库的汉语句法计量研究[J];长江学术;2008年03期
2 张明杰,张跃,姚天顺;一种基于词汇功能描述的树库构建方法[J];东北大学学报;2000年03期
3 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
4 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
5 魏善德;郑家恒;;汉语句法树库检索系统的设计与实现[J];电脑开发与应用;2006年11期
6 刘知远;郑亚斌;孙茂松;;汉语依存句法网络的复杂网络性质[J];复杂系统与复杂性科学;2008年02期
7 麻旻艳;;汉语链语法句法分析器的设计与分析[J];广西大学学报(自然科学版);2007年S1期
8 王鹏,戴新宇,陈家骏,王启祥;基于规则的汉语句法分析方法研究[J];计算机工程与应用;2003年29期
9 卢俊之;陈小荷;王东波;陈锋;;基于语法功能匹配的汉语句法分析算法[J];计算机工程与应用;2008年16期
10 刘贵全;曾宇斌;;基于最大熵模型的汉语依存分析[J];计算机工程;2006年11期
中国重要会议论文全文数据库 前4条
1 赵铁军;李生;孟遥;黄玉;杨沐昀;;机器翻译系统中句法分析技术的研究实践[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 赵怿怡;关润池;;汉语依存树库的构建[A];第三届学生计算语言学研讨会论文集[C];2006年
3 王跃龙;韩希;;短语结构树到依存树的转换[A];第三届学生计算语言学研讨会论文集[C];2006年
4 刘海涛;;影响依存句法分析的因素探讨[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前7条
1 额尔敦朝鲁;面向信息处理的蒙古语动词语义研究[D];内蒙古大学;2005年
2 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
3 彭艳;短语结构语法与依存语法的心理现实性研究[D];上海外国语大学;2007年
4 淑琴;蒙古文同形词知识库的构建[D];内蒙古大学;2010年
5 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
6 林八鸽;《蒙古语连接形式知识库》的建设[D];内蒙古大学;2009年
7 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年
中国硕士学位论文全文数据库 前2条
1 朱国华;文本信息处理中汉语句法分析方法研究[D];大连理工大学;2006年
2 周俏丽;面向汉语单句的依存句法分析研究[D];沈阳航空工业学院;2006年
【共引文献】
中国期刊全文数据库 前10条
1 王倩;从复合句零主语指代看汉英语言思维的差异[J];安徽大学学报;2005年05期
2 丁俊苗;;不足与需要:论标点符号的语法功能[J];安徽大学学报(哲学社会科学版);2008年04期
3 李龙澍;;PROLOG线性归结的研究与设计[J];安徽大学学报(自然科学版);1997年03期
4 王美华;;词汇化形成的虚词与非词形式在共时平面的体现——以“有点儿”和“可见”为例[J];安康学院学报;2011年05期
5 程玉胜,任广永;基于ROUGH集的决策树测试属性选择方法[J];安庆师范学院学报(自然科学版);2004年04期
6 程玉胜;Rosetta实验系统在机器学习中的应用[J];安庆师范学院学报(自然科学版);2005年02期
7 魏长宏;赵宇;;《金山词霸2006》屏幕取词问题研究[J];鞍山师范学院学报;2007年04期
8 吴华;徐甜;;机器翻译中源语分析的研究与探讨[J];安阳工学院学报;2006年02期
9 王智杰;;“似的”研究综述[J];北方论丛;2006年04期
10 李丹;;UML在存货内控风险调查审计中的应用[J];北京服装学院学报;2006年02期
中国重要会议论文全文数据库 前10条
1 通拉嘎;赵小兵;;论蒙古语词素切分的实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 李艳娇;杨尔弘;;树库中的歧义组合考察[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 周惠巍;黄德根;高洁;杨元生;;最大生成树算法和Nivre算法相结合的中文依存关系解析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 斯·劳格劳;华沙宝;萨如拉;;基于统计方法的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 宋彦;黄昌宁;揭春雨;;中文CCG树库的构建[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 邵艳秋;邱立坤;梁春霞;毛宁;;中文语义依存树库构建及自动分析技术[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 周强;王俊俊;陈丽欧;;构建大规模的汉语事件知识库[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 哈斯那顺乌日图;;蒙古文WordNet名词同义词集合构建算法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 王春荣;宝美荣;王斯日古楞;;内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 胡阿旭;吕士良;格根塔娜;于洪志;;蒙古语松紧元音言语空气动力学研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
中国博士学位论文全文数据库 前10条
1 胡文辉;语言评价理论的价值哲学研究[D];上海外国语大学;2010年
2 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
3 魏芳;语言教育规划视角中的大学外语教育政策研究[D];南开大学;2010年
4 周扬;面向中药药性多维表征体系的中药本体研究[D];山东中医药大学;2010年
5 郑军红;基于知识工程的智能夹具设计系统构建研究[D];浙江大学;2010年
6 王忠军;基于GIS的智能高速公路管理关键技术研究与实现[D];解放军信息工程大学;2009年
7 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
8 许有军;基于扩展规则的若干SAT问题研究[D];吉林大学;2011年
9 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
10 黄雪霞;新加坡华语词汇五十年发展变化研究[D];华中师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
2 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
3 宝乐儿;初级阶段蒙古学生汉语发音偏误分析及相应的教学对策[D];上海外国语大学;2010年
4 林琳;“代词+(的)+名词”结构中“的”字隐现研究[D];上海外国语大学;2010年
5 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
6 张瑶;英汉机器翻译中的英语动词汉译研究[D];大连理工大学;2010年
7 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
8 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
9 杨佳;浅析《训世评话》中的兼语句[D];辽宁师范大学;2010年
10 陈旭;地理编码引擎的设计与实现[D];辽宁工程技术大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 黄大网;《语用学》杂志话语标记专辑(1998)介绍[J];当代语言学;2001年02期
2 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
3 黄大网;话语标记研究综述[J];福建外语;2001年01期
4 何自然,莫爱屏;话语标记语与语用照应[J];广东外语外贸大学学报;2002年01期
5 李勇忠,李春华;话语标记与语用推理[J];国外外语教学;2004年04期
6 于国栋,吴亚欣;话语标记语的顺应性解释[J];解放军外国语学院学报;2003年01期
7 冯志伟;自然语言处理的学科定位[J];解放军外国语学院学报;2005年03期
8 安娜,刘海涛,侯敏;语料库中熟语的标记问题[J];中文信息学报;2004年01期
9 周强;汉语句法树库标注体系[J];中文信息学报;2004年04期
10 刘怀军;车万翔;刘挺;;中文语义角色标注的特征工程[J];中文信息学报;2007年01期
中国博士学位论文全文数据库 前5条
1 何婷婷;语料库研究[D];华中师范大学;2003年
2 刘丽艳;口语交际中的话语标记[D];浙江大学;2005年
3 车万翔;基于核方法的语义角色标注研究[D];哈尔滨工业大学;2008年
4 林八鸽;《蒙古语连接形式知识库》的建设[D];内蒙古大学;2009年
5 李济洪;汉语框架语义角色的自动标注技术研究[D];山西大学;2010年
中国硕士学位论文全文数据库 前2条
1 陈丽江;汉语真实文本的语义角色标注[D];南京师范大学;2007年
2 汪红林;基于依存分析的语义角色标注研究[D];苏州大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 周刚;连词产生和发展的历史要略[J];安徽大学学报;2003年01期
2 陈一;张君;;汉语“广狭同形”词语的规范化问题[J];北方论丛;2006年02期
3 穗志方,俞士汶;汉语单句谓语中心词识别知识的获取及应用[J];北京大学学报(自然科学版);1998年Z1期
4 甘宇慧;词的同形异类现象是否等于兼类现象[J];浙江广播电视高等专科学校学报;2002年04期
5 戚晓杰;关于句子与句类、句型关系的考察[J];昌潍师专学报;2000年03期
6 张玥杰,朱靖波,张跃,姚天顺;基于相似性评估的近似实例求解策略[J];东北大学学报;1999年05期
7 冯志伟;;特思尼耶尔的从属关系语法[J];国外语言学;1983年01期
8 韩万衡;德国配价论主要学派在基本问题上的观点和分歧[J];国外语言学;1997年03期
9 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
10 冯志伟;基于短语结构语法的自动句法分析方法[J];当代语言学;2000年02期
中国重要会议论文全文数据库 前10条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 杨沐昀;赵铁军;于浩;;自底向上的汉语句法标注体系设计与实践[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 孟遥;黄玉;赵铁军;李生;;一个包含复杂特征的统计英语句法分析模型[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 那顺乌日图;刘群;巴达玛敖德斯尔;;面向机器翻译的蒙古语生成[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 周强;;汉语句法知识的自动获取研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
8 华沙宝;巴达玛敖德斯尔;;蒙古语语料库建设现状分析和完善策略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 庞文斌;张国煊;曹恬;;基于规则和统计的汉语浅层句法分析的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 刘海涛;;影响依存句法分析的因素探讨[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前8条
1 额尔敦朝鲁;面向信息处理的蒙古语动词语义研究[D];内蒙古大学;2005年
2 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
3 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
4 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
5 高莲花;生成句法框架内的蒙古语动词及其句法结构研究[D];中央民族大学;2007年
6 雪艳;汉蒙词语对齐及相关技术研究[D];内蒙古大学;2009年
7 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
8 林八鸽;《蒙古语连接形式知识库》的建设[D];内蒙古大学;2009年
中国硕士学位论文全文数据库 前10条
1 王雪霞;现代汉语双音同形词与词典编纂[D];河北师范大学;2002年
2 徐先玉;俄汉语述体动词配价对比分析[D];首都师范大学;2002年
3 刘文涛;信息处理用同音同形词研究[D];山东师范大学;2003年
4 皮晓峰;基于概率上下文无关语法的句法分析研究与实现[D];电子科技大学;2005年
5 张建梅;蒙古文同形异音词的读音识别研究[D];内蒙古大学;2005年
6 淑琴;《蒙古语语法信息词典构形附加成分分库》的设计与实现[D];内蒙古大学;2005年
7 吉日木图;基于模板的英蒙机器翻译系统的研究[D];内蒙古大学;2005年
8 李俊;统计机器翻译中解码算法的研究[D];哈尔滨工业大学;2006年
9 乌达巴拉;基于混合策略的蒙—英机器翻译系统的研究[D];内蒙古大学;2007年
10 包艳花;蒙古文识别文本后处理相关技术研究[D];内蒙古大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 牛雅娴;刘丙丽;万红雅;董艺;;从句法分析看词性标注[J];现代语文(语言研究版);2009年12期
2 姚红;“吃食堂”类动宾结构研究综述[J];文教资料;2005年21期
3 李养龙;刘颖;;字幕英译策略的句法分析[J];四川外语学院学报;2007年01期
4 王立群;;依存关系正确理解的基础上的日中翻译[J];电脑知识与技术;2009年28期
5 王新周;;从句法、语义角度阐释“花园小径现象”形成原因[J];文教资料;2009年36期
6 刘潇;;简述句法与语义分析及其关系[J];广东技术师范学院学报;2011年02期
7 王希杰;论句法分析和句用分析及句子分析的多层次性[J];昭乌达蒙族师专学报;1991年02期
8 易蓉湘,何克抗;计算机汉语文稿校对系统[J];计算机研究与发展;1997年05期
9 沈春华;法律英语翻译的基本方法[J];武汉工业学院学报;2004年03期
10 刘卓琼;;大学生英语语篇认知解读能力的思考与探析[J];山西医科大学学报(基础医学教育版);2004年03期
中国重要会议论文全文数据库 前10条
1 斯·劳格劳;华沙宝;萨如拉;;基于统计方法的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 陈劲光;何婷婷;李芳;桂卓民;;基于概率和句法分析的中文句子修剪[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 张晓甜;赵海;;基于树结构模式挖掘的非监督中文短语结构句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 王丹;姬东鸿;黄玮;;一种基于MIRA和遗传算法的句法分析模型构造方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 张俊萍;;利用CTT的汉语自动分析与对外汉语教学软件的开发[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 才藏太;;基于规则的汉藏机器翻译系统中二分法的句法分析方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
9 赵铁军;李生;孟遥;黄玉;杨沐昀;;机器翻译系统中句法分析技术的研究实践[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
10 张俊萍;冯志伟;;CTT在汉语语法研究和教学中的应用[A];第六届汉语词汇语义学研讨会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 李琨;IBM百度共拓企业搜索[N];中国计算机报;2006年
3 记者 潘竑;企业搜索:激活被遗忘的信息财富[N];金融时报;2006年
4 北京京华英语学校 张占杰;英语培训切勿陷入“名师”误区[N];北京人才市场报;2005年
5 本报记者 霍立峰;中科院免费大餐怎么吃[N];中国高新技术产业导报;2002年
6 ;语言信息处理呼唤知识应用[N];中国计算机报;2003年
7 清华大学外语系 许建平;2005年考研英语阅读、翻译备考要点[N];中国教育报;2004年
8 ;句法语文学科召开工作研讨会[N];中国社会科学院院报;2003年
9 记者 刘晶晶;国企员工建言“和谐社区”发展[N];首都建设报;2010年
10 国良;青海粮食仓容减少 油料罐容增加[N];粮油市场报;2011年
中国博士学位论文全文数据库 前10条
1 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
2 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
3 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
4 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
5 唐秀玲;论话题及其在汉语语法分析中的应用[D];上海师范大学;1997年
6 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
7 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
8 洪淼;现代汉语连动结构研究[D];南京师范大学;2004年
9 吴戈;基于数字水印的文本信息隐藏方法的研究[D];长春理工大学;2011年
10 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 董朝霞;基于无短语标记树库的句法分析方法的研究[D];哈尔滨工业大学;2010年
2 任晓娜;基于统计的汉语依存句法分析研究[D];沈阳航空航天大学;2011年
3 杨雪娇;语义网自动构建中句法分析的研究[D];沈阳工业大学;2012年
4 皮晓峰;基于概率上下文无关语法的句法分析研究与实现[D];电子科技大学;2005年
5 刘琍;“程度副词+名词”的语义、语用和句法分析[D];四川师范大学;2005年
6 金天;论汉语及英语中否定歧义的消除[D];广东外语外贸大学;2007年
7 郎文静;规则与统计相结合的汉语依存句法分析技术研究及其应用[D];沈阳航空航天大学;2012年
8 尹鹏;基于SVM的中文组块间依存关系分析[D];大连理工大学;2006年
9 张萍;现代汉语标语语法研究[D];南京师范大学;2006年
10 哈里旦木·阿布都克里木;基于Chart算法的维吾尔语句法分析系统的设计与实现[D];新疆大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026