收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向计算的现代汉语明喻句的考察

徐亚芳  
【摘要】:隐喻是人类赖以生存的认知方式和思维方式,对于揭示认知机制具有重大意义。然而,由于隐喻的多样性、隐藏性,隐喻理论的局限性,隐喻的计算化研究一直困难重重。现代隐喻学认为,从隐喻的表现形式分类,隐喻可以分为显性隐喻(明喻)与隐性隐喻,明喻是隐喻中的一种重要形式。现代汉语明喻句的典型句式为“A像B”,点明本体、喻词和喻体。正是由于明喻这种显性特点,大胆结合概念整合理论,可尝试通过计算的方式对明喻的认知机制进行探索。本文第一部分比较了两大隐喻理论:概念隐喻理论和概念整合理论,厘清二者最大的区别在于言外之意的获得。这是概念隐喻理论的局限,也是概念整合理论的发展。二者之间有继承有发展。相较于概念隐喻理论,概念整合理论主要突出了自身体验、自身知识库对于理解的关键作用。本文第二部分选择喻词为“像”的现代汉语明喻句作为研究对象,基于我们以前构建的认知属性语料库(从网上提取的“A像B一样C”的句式,规模为100万句),人工筛选出2110明喻句,标注出明喻句的本体、喻词、喻体和喻底,构建了一个现代汉语明喻语料库,为本文研究提供语料库基础。本文第三部分中,基于语料库做了统计分析。发现替代型的明喻句最多,达到1042句,占49.4%;比喻模式中以“本体—喻词—喻体—喻底”的明喻句有830句,占了39.3%,除此之外还有16种比喻模式。统计比喻成分的长度之后发现,各比喻成分的长度主要集中在6个词以内,各成分长度大于10的情况总体而言较少。本文第四部分,运用概念整合理论中的四空间模型详细解释了两种明喻句——喻底显示型明喻句和喻底隐藏型但能被理解的明喻句,简略解释了喻底同样隐藏但是不能被很好理解的明喻句。在解释时,首次尝试结合我们之前建立的认知属性库中的数据,以数据佐证三种明喻句或被理解或不被理解的原因。被理解或者不被理解,主要取决于当整合空间里发生层创作用时能否将我们自身的体验与认知新事物联系起来,若能联系起来则能够被理解,反之则不能。最后,利用条件随机场(CRFs)模型对像型明喻句的本体、喻体、喻底、喻词进行识别。选择适宜的标注集,选择适当特征模板,添加另外一些语言特征帮助识别,例如词性等。实验证明,在突出“像……一样……”标记作用之后,正确率、召回率和F值都明显提升。效果最优的模板是7w+7p'+3wp'(词语窗长为7,词性窗长也为7,3个词语与3个词性同时共现),F值达到76.11%。


知网文化
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978