联结主义下‘能’的语义排歧研究
【摘要】:
语义排歧(Word Sense Disambiguation)一直是自然语言处理(Natural Language Processing)和语义学研究领域一个非常重要的课题,几乎覆盖了各种自然语言处理系统,其中包括信息检索,机器翻译,关键词的提取,语音识别,文本分类和自动文摘。语言学家和计算机科学家在探索自然语言的歧义问题上做了大量的工作,取得了很大的成绩。但现有的对自然语言排歧的研究主要集中在语法、词典、简单的词汇词义层面上,对上下文、语义、语境、语用等知识和信息虽有涉及,但对这些信息的挖掘还相当有限。对于情态助动词这样语义更加模糊、对语境更为敏感的词类的语义排歧,目前尚未发现。
语义排歧的研究对象是语言,将语言学的研究成果用到语义排歧中,将有利于打破语义消歧的瓶颈,推动其更深入的发展。特别是在情态意义方面,从《马氏文通》开始,语言学家对汉语情态助动词做了深入且全面的研究。这些研究成果为构建汉语情态动词的语义排歧模型的设想提供了充足的理论基础。
另外,语义消歧的发展也将服务于语言学研究。情态助动词的自动语义排歧,能够实现情态助动词的语义的自动标注,从而为语言学家运用大规模语料库研究情态助动词节约大量的时间和精力,提高研究效率。因此,本文的研究结果将对语言学研究具有理论和实践指导意义。
本文基于联结主义的基本理论,采用人工神经网络技术和方法,利用神经网络的自组织、自适应和高容错性等特点,通过对大规模真实语料库的学习,构建了一个针对汉语情态助动词‘能’的语义排歧模型,该模型最终达到了96%的理想排歧正确率。在此基础上,深入研究了情态助动词能与其上下文语义特征的深层关系,以及不同语言变量对神经网络语义排歧效果的影响。
|
|
|
|
1 |
杜兆金;;多元文化对语言歧义理解及运用的影响——以新疆农业垦区为例[J];农业考古;2011年04期 |
2 |
;[J];;年期 |
3 |
;[J];;年期 |
4 |
;[J];;年期 |
5 |
;[J];;年期 |
6 |
;[J];;年期 |
7 |
;[J];;年期 |
8 |
;[J];;年期 |
9 |
;[J];;年期 |
10 |
;[J];;年期 |
11 |
;[J];;年期 |
12 |
;[J];;年期 |
13 |
;[J];;年期 |
14 |
;[J];;年期 |
15 |
;[J];;年期 |
16 |
;[J];;年期 |
17 |
;[J];;年期 |
18 |
;[J];;年期 |
19 |
;[J];;年期 |
20 |
;[J];;年期 |
|