收藏本站
《北京大学》 1999年
收藏 | 手机打开
二维码
手机客户端打开本文

面向中文信息处理的现代汉语短语结构规则研究

詹卫东  
【摘要】: 本文面向中文信息处理的实际需要,尝试以形式化的方式对现代汉语短语结构的组合规则进行全面的描写,并探讨解决短语结构歧义问题的途径。全文共七章。 第一章对中文信息处理技术的发展状况以及目前现代汉语语法研究的水平进行了宏观分析。以此为背景,确定了本课题研究所针对的对象为短语结构,预期的目标是完成一个带有丰富约束条件的现代汉语短语结构规则库。特别值得指出的是,这样的短语结构规则库是以一部对现代汉语词语进行了全面句法语义属性描述的电子词典作为底层支撑的。 第二章贯彻词组本位语法理论以功能为原则建立句法范畴的精神,将以往对词的句法功能分类和属性特征的研究进一步全面拓展到短语结构上,得到了一个相对完整的短语结构功能分类体系,并初步确立了一套描述短语结构句法功能属性的范畴体系。同时,本文吸收了汉语配价理论、动词格框架等的具体研究成果并加以拓展,提出了一个面向中文信息处理的综合的语义信息描述框架——“广义配价模式”,以及一个简化的语义分类体系。 第三章在上述句法语义属性范畴基础上,对四类主要的现代汉语短语结构:np、ap、vp、dj的组合规则进行了系统而具体的形式化描写。这部分工作可以概括为,将以往面向人所做的有关汉语短语结构的句法语义研究的成果,加上作者本人的研究和实践,组织成了一部可以为计算机分析汉语短语结构提供直接支持的规则库。从形式上讲,一条短语结构规则包括两部分,产生式规则和合一等式。产生式规则用于描述汉语短语结构的一种组合可能性,合一等式则进一步描述一个特定的组合模式的的整体性质及组合条件。本章总结了有关上述四类短语的规则共89条。 第四章细致分析了计算机处理汉语短语结构时面临的定界歧义和结构关系歧义问题,从不同角度区分了抽象的歧义格式的不同类型:包含终结符的歧义格式与不含终结符的歧义格式;外显型歧义格式与内含型歧义格式;真歧义格式、准歧义格式、伪歧义格式等。在已有短语结构规则的基础上,利用一个简单的分析程序对现代汉语短语结构歧义格式(不含终结符的3项排列歧义格式和含终结符“的”跟“和”的4项和5项排列歧义格式)进行了统计,得到了计算机分析现代汉语短语时可能碰到的歧义格式的一个比较完整的清单。 第五章则在对汉语短语结构歧义有了全面系统的认识基础上,通过对三个典型的短语歧义格式进行分析,进一步探讨了排歧策略,并对难以在短语结构规则层面解决的歧义分析问题,指出困难所在,为将来的排歧研究打下了基础。 第六章以计算机分析实例的结果展示了本文研究所得到的短语结构规则在一个具体的汉语句法分析器中使用的实际效果。 第七章对全文的研究工作进行了总结,包括具体的研究成果,对中文信息处理研究所能提供的支持,以及对汉语语法研究的意义等,最后对进一步的研究工作进行了规划。 本文的研究工作是跨现代汉语语法和中文信息处理两个领域进行的。一方面,研究的具体结果对推进中文信息处理技术的发展有直接的应用和参考价值;另一方面,从中文信息处理的角度来审视现代汉语语法研究,可以为研究工作提供一个清晰的实用背景。不仅可以注意到以往面向人的研究不容易注意到的一些问题,而且也使得语法研究中的许多问题能够在一个形式系统的框架中得到更明确、更规范的表述。
【学位授予单位】:北京大学
【学位级别】:博士
【学位授予年份】:1999
【分类号】:H146

【引证文献】
中国期刊全文数据库 前10条
1 秦颖;王小捷;钟义信;;级联中文组块识别[J];北京邮电大学学报;2008年01期
2 程书秋;;现代汉语短语使用情况的优先序列考察[J];汉语学报;2012年02期
3 张惠春;;基于规则的汉语述宾动词短语自动识别[J];晋城职业技术学院学报;2012年02期
4 卢俊之;陈小荷;王东波;陈锋;;基于语法功能匹配的汉语句法分析算法[J];计算机工程与应用;2008年16期
5 德·青格乐图;;汉—蒙机器翻译中源语言动词短语的转换及消歧方法[J];内蒙古师范大学学报(哲学社会科学版);2010年05期
6 倪廓阔;吕学强;韩艳铧;王涛;;搜索引擎中“N1+N2”型短语查询优化研究[J];计算机应用与软件;2012年09期
7 赵旭;刘振平;;“vp np u〈的〉np”格式的计算机歧义分析[J];长江大学学报(社会科学版);2013年08期
8 程书秋;;说说“词组”和“短语”[J];玉林师范学院学报;2009年06期
9 王宁;;多音节新词语构词规则初探[J];现代语文(语言研究版);2011年04期
10 孔令鹏;张琛;张权;;基于SVM的快速中文组块分析方法[J];现代电子技术;2012年21期
中国重要会议论文全文数据库 前1条
1 卢俊之;陈小荷;曲维光;王东波;陈锋;丁德鑫;;基于语法功能匹配的汉语句法分析算法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前6条
1 赵春利;形名组合的静态与动态研究[D];暨南大学;2006年
2 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
3 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
4 李兵;初等代数证明题答案的自动检测方法研究[D];兰州大学;2012年
5 穆一夫;基于认知的非结构化信息抽取关键技术与算法研究[D];中国矿业大学(北京);2013年
6 徐润华;基于词语搭配知识和语法功能匹配的句法分析器[D];南京师范大学;2013年
中国硕士学位论文全文数据库 前10条
1 严羽;自然语言理解中并列名词歧义消解及其在智能仪器设计领域的应用[D];西安电子科技大学;2011年
2 赵继伟;三维游戏中人物动作与声音的研究[D];哈尔滨工程大学;2011年
3 邢欣;汉语事件描述单元的自动识别[D];山西大学;2011年
4 王彬;汉语人机对话系统中口语处理的研究[D];清华大学;2004年
5 卢俊之;基于语法功能匹配的句法分析算法[D];南京师范大学;2008年
6 张先武;异类词语联合短语研究[D];江西师范大学;2008年
7 张广军;基于XML作战文书理解关键技术研究[D];南京理工大学;2009年
8 姚建仁;领域文本中的概念获取[D];北京邮电大学;2009年
9 高苗红;面向中文信息处理的V+N结构句法与语义关系研究[D];河北大学;2008年
10 柳丹丹;“被”字结构做定语现象研究[D];湖南师范大学;2010年
【参考文献】
中国期刊全文数据库 前10条
1 韩万衡;德国配价论主要学派在基本问题上的观点和分歧[J];国外语言学;1997年03期
2 李讷,石毓智;汉语动词拷贝结构的演化过程[J];国外语言学;1997年03期
3 朱德熙;;自指和转指——汉语名词化标记“的、者、所、之”的语法功能和语义功能[J];方言;1983年01期
4 陆俭明;“VA了”述补结构语义分析[J];汉语学习;1990年01期
5 杨成凯;关于汉语语法单位的反思──汉语语法特点散论之三[J];汉语学习;1994年06期
6 刘丹青;汉语语法单位分级理论的再探讨──杨成凯《关于汉语语法单位的反思》补议[J];汉语学习;1995年02期
7 郭锐;汉语语法单位及其相互关系[J];汉语学习;1996年01期
8 詹卫东;关于“NP+的+VP”偏正结构[J];汉语学习;1998年02期
9 周明,黄昌宁,张敏,白栓虎,吴升;统计与规则并举的汉语句法分析模型[J];计算机研究与发展;1994年02期
10 孙茂松,黄昌宁;汉语中的兼类词、同形词类组及其处理策略[J];中文信息学报;1989年04期
【共引文献】
中国期刊全文数据库 前10条
1 崔山佳;;动词拷贝句补说五题[J];蒲松龄研究;2010年03期
2 杜道流;指称、陈述理论及其对上古语法研究的意义[J];安徽大学学报;2004年01期
3 张大强;;转换生成语法与汉语歧义句的分析[J];安徽文学(下半月);2009年03期
4 王梅洁;;浅析赵岐《孟子章句》中关于谓词转指的注释[J];安徽文学(下半月);2009年05期
5 李明;古代汉语教学中“者”“所”问题的处理[J];安庆师范学院学报(社会科学版);2005年03期
6 余东涛;;英汉否定是非问句答句的语法和语用对比研究[J];安庆师范学院学报(社会科学版);2007年03期
7 安志伟;;现代汉语指人名词的产生途径探析[J];安庆师范学院学报(社会科学版);2011年11期
8 赵彩红;;“烙饼”类同形异构复合词“潜标记”转指的认知[J];辽宁科技大学学报;2010年02期
9 袁本良;“者”“所”“之”在句法转换中的作用——读《中国文法要略》的思考之二[J];安顺师专学报(社会科学版);1997年03期
10 伍铁平;不要玷污历史唯物主义和唯物辩证法,维护语言文字科学的尊严——评《汉字哲学初探》[J];北方论丛;2002年02期
中国重要会议论文全文数据库 前10条
1 万菁;姬东鸿;任函;冯文贺;;汉语复合名词短语特征结构的标注研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 李艳娇;杨尔弘;;树库中的歧义组合考察[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 梅晓娟;;对外汉语词典中语法信息的体现[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
4 刘辉;章宜华;;词典辅助编纂及生成系统的多层C/S结构和数据库[A];中国辞书学会双语词典专业委员会第6届年会暨学术研讨会论文专辑[C];2005年
5 潘雪莲;;词典中名词释义模式的选择[A];中国辞书学会第六届中青年辞书工作者学术研讨会论文集[C];2010年
6 邱立坤;;现代汉语动名语串结构关系的判定[A];第六届汉语词汇语义学研讨会论文集[C];2005年
7 王惠;苏新春;;XHK基于语法知识的汉语词义描述[A];第六届汉语词汇语义学研讨会论文集[C];2005年
8 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
9 徐德宽;;现代汉语双宾构造中两个宾语的题元角色[A];第六届汉语词汇语义学研讨会论文集[C];2005年
10 张俊萍;冯志伟;;CTT在汉语语法研究和教学中的应用[A];第六届汉语词汇语义学研讨会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
2 刘春兰;《训世评话》语法研究[D];南开大学;2010年
3 李青;现代汉语把字句主观性研究[D];吉林大学;2011年
4 莫启扬;语言中的时间性及其操作[D];西南大学;2011年
5 方清明;现代汉语名名复合形式的认知语义研究[D];暨南大学;2011年
6 王媛;事件分解和持续性语义研究[D];北京大学;2011年
7 王俊;现代汉语离合词研究[D];华中师范大学;2011年
8 刘志富;现代汉语领属性偏正结构及其相关句法现象[D];华中师范大学;2011年
9 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
10 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
中国硕士学位论文全文数据库 前10条
1 吴艺彬;俄语三价动词的语义配价与句法模式[D];哈尔滨师范大学;2010年
2 赵桂阳;现代汉语“不是X的X”结构考察[D];哈尔滨师范大学;2010年
3 田洁;现代汉语回声拷贝式“A就A”结构分析[D];上海外国语大学;2010年
4 王彩利;“N的V”的构式研究[D];上海外国语大学;2010年
5 吕韶华;面向中文评论文本的情感倾向性研究[D];大连理工大学;2010年
6 邢鑫岩;基于序列模型的情感分析研究[D];大连理工大学;2010年
7 刘志成;现代汉语疑问句习得研究[D];辽宁师范大学;2010年
8 尹方园;“VA”动结式表层语义分析[D];湘潭大学;2010年
9 王玉丹;基于SVM的汉语依存句法分析研究[D];中国海洋大学;2010年
10 黄勇杰;基于统计NLP技术的甲骨卜辞的分析研究[D];华东师范大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 李子云;动名组合序列的定中结构[J];安徽教育学院学报(哲学社会科学版);1998年04期
2 阮绪和;形名偏正结构的语法功能[J];安徽教育学院学报;2003年02期
3 戴礼荣;人机语声对话特点及系统设计[J];安徽大学学报(自然科学版);1997年04期
4 方小中;定中结构研究综述[J];安庆师范学院学报(社会科学版);2004年04期
5 朱德熙 ,盧甲文 ,马真;关于动词形容词“名物化”的问题[J];北京大学学报(人文科学);1961年04期
6 董大勇;王黎静;袁修干;陈晓;祖媛媛;蒋毅;;人体表面不同部位可达性等级确定的试验研究[J];兵工学报;2010年07期
7 孟建安;小议“N_1A的N_2”格式[J];毕节师专学报;1997年02期
8 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
9 赵宏;浅析英汉“被”字句语义特征[J];本溪冶金高等专科学校学报;2002年S1期
10 李冬梅;;对外汉语语法教学的几点认识[J];才智;2009年08期
中国重要会议论文全文数据库 前6条
1 邱立坤;;现代汉语动名语串结构关系的判定[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 李晋霞;;面向计算机的“V_双+N_双”结构类型研究[A];语言文字应用研究论文集(Ⅱ)[C];2004年
3 杨泉;;机用现代汉语a+a结构消歧研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 张亮;陈家骏;;基于大规模语料库的句法模式匹配研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 刘开瑛;;汉语框架语义网(CFN)构建现状[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 苏伟;基于Web的数学公式输入及可访问性关键问题研究[D];兰州大学;2010年
2 李晋霞;现代汉语定中“V双+N双”结构研究[D];中国社会科学院研究生院;2002年
3 郭忠伟;作战文书自动生成理论及方法研究[D];南京理工大学;2003年
4 邓云华;汉语联合短语的类型和共性研究[D];湖南师范大学;2004年
5 王霜梅;汉语定中结构的认知隐喻研究[D];首都师范大学;2006年
6 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
7 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
8 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
9 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
10 高航;现代汉语名动互转的认知语法考察[D];中国人民解放军外国语学院;2007年
中国硕士学位论文全文数据库 前10条
1 彭沁;基于篇章的名词省略恢复研究及其在机械产品设计中的应用[D];西安电子科技大学;2011年
2 杨枝莉;“N_1+的+N_2”结构歧义分析[D];上海师范大学;2011年
3 林玲;基于网络的《Visual FoxPro程序设计》课程考试系统的分析与设计[D];云南大学;2011年
4 李千驹;汉语定中结构新探[D];广西师范大学;2001年
5 陈珺;意欲形容词的语义特征分析[D];华中师范大学;2002年
6 卢莹;情感形容词研究[D];天津师范大学;2002年
7 刘春卉;“动+名”偏正结构形成原因的考察[D];广西师范大学;2002年
8 张玲秀;现代汉语语法歧义现象分析[D];内蒙古师范大学;2003年
9 马翠霞;定形偏正结构作主宾语考察[D];河南大学;2003年
10 祁峰;定中式[A单+N]中“形名组合”的选择性研究[D];上海师范大学;2003年
【二级引证文献】
中国期刊全文数据库 前10条
1 祁峰;;从黏合式形名组合的角度看单音节形容词做定语的句法功能[J];对外汉语研究;2011年00期
2 吕学强;舒燕;孙立华;程涛;;搜索引擎日志中“V+N_1+N_2”型短语研究[J];广西师范大学学报(自然科学版);2011年01期
3 黄莉;;浅析汉语语言处理中的句法分析方法[J];价值工程;2010年17期
4 赵春利;石定栩;;现代汉语基于形名组合的容貌形容词研究[J];华西语文学刊;2010年01期
5 魏玮;谢慧珍;张丽纯;;命题逻辑中形式推演证明题的自动评阅系统[J];计算机与现代化;2014年02期
6 郭书杰;黄明;梁旭;;陪护机器人口语对话系统设计与实现[J];网络安全技术与应用;2010年12期
7 王东波;谢靖;;基于清华汉语树库的有标记联合结构统计分析[J];现代图书情报技术;2010年04期
8 赵春利;;情感形容词与“得”字补语同现的原则[J];语言教学与研究;2012年04期
9 沈威;;论“特色N_1+地名N_2”[J];语言研究;2013年02期
10 金光赫;王兴伟;曲大鹏;;提高检索性能的朝鲜语布尔查询词生成及扩展[J];小型微型计算机系统;2013年05期
中国重要会议论文全文数据库 前1条
1 臧翰芬;;基于MC-Value的非句蜕广义对象语义块的边界识别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前7条
1 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
2 乔翔;汉英形修名结构对比研究[D];中央民族大学;2011年
3 周日安;名名组合的句法语义研究[D];暨南大学;2007年
4 杨海明;生命度与汉语句法的若干问题研究[D];暨南大学;2007年
5 黄美新;大新壮语形容词研究[D];中央民族大学;2010年
6 江会星;汉语命名实体识别研究[D];北京邮电大学;2012年
7 徐润华;基于词语搭配知识和语法功能匹配的句法分析器[D];南京师范大学;2013年
中国硕士学位论文全文数据库 前10条
1 严羽;自然语言理解中并列名词歧义消解及其在智能仪器设计领域的应用[D];西安电子科技大学;2011年
2 刘德鹏;互联网舆情监控分析系统的研究与实现[D];电子科技大学;2011年
3 杨坡;汉语联合短语结构分析与识别[D];湘潭大学;2011年
4 施书宇;幼儿话语名核结构的语义研究[D];南京师范大学;2011年
5 刘海霞;汉语功能块的自动识别研究[D];大连理工大学;2011年
6 魏莉;汉语完全句法树库一致性检验方法研究[D];山西大学;2011年
7 刘琴琴;对外汉语教学中的歧义现象研究[D];山东师范大学;2012年
8 雷立娜;常用双音节形容词与其后置名词搭配研究[D];北京师范大学;2008年
9 于静;汉语句子的组块识别研究[D];大连理工大学;2008年
10 包志红;《蒙古语语义信息词典形容词分库》的构建[D];内蒙古大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 冯志伟;;特思尼耶尔的从属关系语法[J];国外语言学;1983年01期
2 戴浩一;黄河;;时间顺序和汉语的语序[J];国外语言学;1988年01期
3 徐林;;第二届《国外语言学》编辑工作研讨会纪要[J];国外语言学;1989年01期
4 廖秋忠;;也谈形式主义与功能主义[J];国外语言学;1991年02期
5 袁毓林;认知科学背景上的语言研究[J];国外语言学;1996年02期
6 袁毓林;语言信息的编码和生物信息的编码之比较[J];当代语言学;1998年02期
7 陈庆汉;“N的V”研究综述[J];河南大学学报(社会科学版);1991年02期
8 袁毓林;语言学范畴的心理现实性[J];汉语学习;1993年04期
9 詹卫东;关于“NP+的+VP”偏正结构[J];汉语学习;1998年02期
10 周明,黄昌宁,张敏,白栓虎,吴升;统计与规则并举的汉语句法分析模型[J];计算机研究与发展;1994年02期
【相似文献】
中国期刊全文数据库 前6条
1 金顺德;广义短语结构语法中的句法生成问题[J];外国语(上海外国语学院学报);1989年02期
2 张松松;戴芙蓉;;补足语与嫁接语区分标准新论[J];金陵科技学院学报(社会科学版);2012年01期
3 刘高岑;;试借用乔姆斯基语法分析简单辩证语句[J];逻辑与语言学习;1991年05期
4 刘彬;;英汉机译中的译后编辑及其实现[J];中国电化教育;2010年07期
5 周流溪;近五十年来语言学的发展(上)[J];外语教学与研究;1997年03期
6 王希杰;;说“严禁夹带危险品上车”[J];逻辑与语言学习;1990年05期
中国博士学位论文全文数据库 前1条
1 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
相关机构
>北京大学
相关作者
>詹卫东
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026