收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

《唐诗三百首》意象标注语料库的构建及统计分析

葛四嘉  
【摘要】:意象是诗词创作与理解过程中的重要元素,寄托了深刻的思想情感。意象具有多层性、隐喻性的语义特点,理解意象的语义对于理解诗意有至关重要的作用。传统的意象研究多从文学、美学角度出发,在方法上多是对特定诗人、诗文和具体意象的个案分析。对于意象在古诗中的具体分布、意象与情感的结合方式、意象的作者分布等问题一直缺少较为宏观的定量研究和数据支撑。究其原因,在于传统的研究范式缺少计算方法和数据库技术的支撑,而新兴的数字人文研究,又大都停留在浅层的字面信息统计上。本文以经典的《唐诗三百首》诗词文本为样本,首先建立了新型的深度标注意象语料库,采用深度学习的方法标注了唐诗的分词与词性信息并进行了人工校对,然后又标注了意象的字面义与深层隐喻义等信息,进而统计了意象字面信息内部构成特点,尝试从意象字面义到深层义进行多层次统计分析,并探寻意象与作家风格、题材内容之间的关系。统计得到的意象分布数据和内部词汇构成、深层情感等语义知识,可服务于机器自动作诗等应用。本文的工作主要包含以下几个方面:第一,建立诗词分词词性标注语料库,通过机器自动标注加人工校对的方式,共标注了17718个词的分词和词性信息。对《唐诗三百首》进行机器自动分词和词性标注实验,得到分词和词性标注任务的F值分别为85.59%和77.47%,能够用于机器辅助标注任务中,同时分析了古诗词语料特点,通过对比实验验证了语料规模等因素对标注效果的影响。第二,尝试制定了意象标注体系。针对意象语义多层性、隐喻性的特点,并结合意象的语言单位构成特点,设计了符合意象语义特性的标注体系。该体系涵盖诗词题材、意象字面语义类、意象深层语义类、意象内部语义组成等多个字段,采用知网的义类体系,对《唐诗三百首》分词及词性标注语料进行静态意象的深层标注,重点关注从认知角度分析意象字面义和深层义的语义联系。第三,进行多角度的计量分析。在320首唐诗中标注了4496条意象数据,结合意象的理论研究成果,进行统计分析并得出如下结论:(1)意象用例呈现长尾分布,符合齐夫定律,以“月”“夜”“風”“山”等常见的自然类泛称意象为主,意象语义类分布则相对较为平缓,以各种事物的部件、人物为主,高频意象带有明显的隐喻性。(2)李白、杜甫等著名诗人的作品中,意象分布并不密集,怀古诗、战争诗这两种题材的诗词使用意象频繁,意象能够在一定程度上体现诗人的风格和题材内容。(3)意象的内部构成方面,单个词构成的单纯意象与多个词构成的复合意象占比接近。复合意象内部多个词之间主要呈现并列关系或修饰关系,修饰词以颜色、季节为主,修饰对象主要是“山”“風”“月”等事物。(4)在意象的深层义相关统计方面,将静态意象的深层义按照深层义词性分为认知属性类、隐转喻类和事件类。意象的认知属性表明诗词的整体情感呈现消极倾向;在隐喻和转喻的使用对比上,转喻的使用多于隐喻的使用。隐喻中,花和部件常作为源域;转喻中,整体-部分转喻、范畴-成员转喻是使用最多的转喻类型,呈现“以点带面”的认知倾向;意象所指代的事件主要以思念、战争、隐逸和分离为主,反映了诗歌的主题内容。综上,本文构建的意象语料库能够较为完整地表示意象在语言形式层面、浅层语义层面、深层语义层面的多层次、多维度信息,使用计量统计的方法能够宏观、全面地对比展现意象在不同语义类别、不同诗人、不同表达手法上的分布特点,能够对意象理论研究和诗词文本生成研究提供有益的补充。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李英;;浅谈对中文信息处理的认识[J];电脑知识与技术;2008年09期
2 李康熙;李为山;;基于互联网1至5元文法语料库的多词表达自动提取[J];科技通报;2013年10期
3 余正涛,樊孝忠,宋丽哲;基于问句语料库的受限领域自动应答系统[J];计算机工程与应用;2003年36期
4 傅瑛;;基于语料库的“圣人”英译的认知解读[J];成都大学学报(社会科学版);2019年05期
5 陈虹;;俄语语料库的标注[J];中国俄语教学;2012年02期
6 陈功;;语料库检索的模式、问题及启示[J];当代外语研究;2011年10期
7 胡开宝;陶庆;;汉英会议口译语料库的创建与应用研究[J];中国翻译;2010年05期
8 徐琳宏;林鸿飞;赵晶;;情感语料库的构建和分析[J];中文信息学报;2008年01期
9 史九林,成颖;论语料库技术在自动分类研究中的应用[J];江苏图书馆学报;2000年04期
10 李炀;佟晓敏;;论小规模语料库的构建[J];考试周刊;2010年25期
11 卢植;胡健;;大数据时代背景下的现代语料库研制概览[J];外语与翻译;2018年04期
12 林程;;小型外语教学语料库的构建:理论与实践[J];校园英语;2014年26期
13 董爱华;;专门用途语料库的建设、应用、问题与发展趋势[J];北京印刷学院学报;2013年05期
14 邵建国;柳新华;;工作会议讲话稿语料库构建浅谈[J];秘书;2010年06期
15 李纲;陈璟浩;毛进;;突发公共卫生事件网络语料库系统构建[J];情报学报;2013年09期
16 王先传;彭亮;郭伟;魏澳;;基于语料库的事件知识图谱构建与应用[J];阜阳师范大学学报(自然科学版);2020年04期
17 王克非;符荣波;;语料库口译研究:进展与走向[J];中国翻译;2020年06期
18 Mona Baker;Jan Buts;Henry Jones;赵文静;杨国胜;;用语料库考察概念的跨文化传播——“知识谱系”项目访谈[J];外语教学与研究;2021年01期
19 汤怡宁;;基于“特征—值”结构的茶叶评价可比语料库的构建及其应用[J];英语广场;2021年08期
20 余小梅;陈光明;;华裔美国作家哈金作品《落地》建构的中国形象——基于语料库的考察[J];乐山师范学院学报;2019年11期
中国重要会议论文全文数据库 前20条
1 史中琦;张普;;基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 安娜;刘海涛;侯敏;;语料库中熟语的标记问题[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
3 刘克强;;基于语料库的新闻越南语特征分析[A];外语教育与翻译发展创新研究(第四卷)[C];2015年
4 马玄思;郭曙纶;;基于语料库的“接近”和“靠近”辨析[A];《国际汉语学报》第6卷第2辑[C];2016年
5 陈瑛;李逸薇;黄居仁;;非监督的汉语感情语料库的构建及分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 才让加;头旦才让;周毛先;;藏语语料库加工方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 赵丹;;基于语料库的口译教学研究[A];第十四届全国科技翻译研讨会论文汇编[C];2011年
8 肖健;袁琦;宋金平;;使用三元组可比语料库改进和发展机器翻译系统[A];第十四届全国科技翻译研讨会论文汇编[C];2011年
9 贺琳;吕士楠;冯勇强;初敏;钱瑶;;汉语合成语料库的韵律层级标注研究[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
10 曲清琳;;关于例证语料库的一点想法[A];2004年辞书与数字化研讨会论文集[C];2004年
11 李晓静;;谈语料库系统中已有辞书库的建设及面临的问题[A];2004年辞书与数字化研讨会论文集[C];2004年
12 谢家成;;自建语料库、网上语料库与英语教学与学习[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
13 杨节之;;网络语料库与课堂英语教学[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
14 刘金凤;亢世勇;;基于标注语料库的情景语义成分分析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
15 武光军;;语料库翻译学的范式理据与范式体系[A];中国英汉语比较研究会第八次全国学术研讨会论文摘要汇编[C];2008年
16 李艳娇;杨尔弘;;基于动态流通语料库的连词考察[A];第五届全国青年计算语言学研讨会论文集[C];2010年
17 刘开瑛;由丽萍;;基于语料库的汉语辞书编纂系统[A];2004年辞书与数字化研讨会论文集[C];2004年
18 安娜;侯敏;;语料库中的插入语标注研究[A];第三届学生计算语言学研讨会论文集[C];2006年
19 王桂琼;;基于语料库的对外汉语语法项目教学——以疑问代词“什么”为例[A];2019对外汉语博士生论坛暨第十二届对外汉语教学研究生学术论坛论文集[C];2019年
20 付海燕;顾毅;;中国书法展英文解说词语言特征的语料库考察[A];发挥社会科学作用 促进天津改革发展——天津市社会科学界第十二届学术年会优秀论文集(上)[C];2017年
中国博士学位论文全文数据库 前20条
1 恩和巴雅尔;蒙古国新闻语料库的构建及相关问题研究[D];内蒙古大学;2016年
2 何清顺;基于语料库的英语独立主格结构之系统功能语言学研究[D];西南大学;2013年
3 李二涛;基于博客语料库副词使用的性别差异实证研究[D];华中师范大学;2012年
4 冯聪;基于中英电影语料库比较的英语电影翻译研究[D];华东师范大学;2020年
5 于洋;基于语料库的环境话语中的联合研究[D];山东大学;2013年
6 王俭;基于语料库的海明威小说评论研究[D];上海外国语大学;2012年
7 周小玲;基于语料库的译者文体研究[D];湖南师范大学;2011年
8 吴金星;蒙古语语料库加工集成平台的构建[D];内蒙古大学;2015年
9 刘建鹏;语料库支撑的系统功能语法研究[D];西南大学;2012年
10 李毅;基于语料库的隐喻普遍性与变异性研究[D];山东大学;2012年
11 李斌;用ELAN自建汉语方言多媒体语料库及其应用研究[D];湖南师范大学;2013年
12 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
13 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
14 方秀才;基于语料库的中国英语学习者动词“非限定小句”词汇语法特征研究[D];上海外国语大学;2014年
15 赵天一;中国古典意象史论[D];西南大学;2012年
16 童丹;中国古典诗词俄译时的意象转换[D];上海外国语大学;2009年
17 辛衍君;唐宋词意象的符号学阐释[D];苏州大学;2005年
18 吴建清;中国意象建构中的等级隐喻[D];山东大学;2016年
19 孟勐;基于语料库的中国作者和英语母语作者英文学术论文中评价语言的对比研究[D];上海外国语大学;2007年
20 刘贺娟;都市意象的女性主义书写[D];辽宁大学;2008年
中国硕士学位论文全文数据库 前20条
1 葛四嘉;《唐诗三百首》意象标注语料库的构建及统计分析[D];南京师范大学;2019年
2 徐瑞;一个中文语义语料库的研究与建设[D];苏州大学;2006年
3 郑婧婧;蔬菜种植信息语料库构建方法的分析与设计[D];河北科技师范学院;2017年
4 田霞;和画语料库的设计与实现[D];西北大学;2017年
5 赵晨潇;地书语料库的设计与实现[D];西北大学;2017年
6 王竹青;基于语料库的韩国学生离合词“帮忙”偏误考察[D];湖南大学;2016年
7 李萍;自建小型语料库在辅助译员培训中的应用研究[D];山东师范大学;2015年
8 栗娜;语料库驱动的英语写作中连接副词的使用分析[D];西北民族大学;2013年
9 王海平;英汉平行翻译语料库的构建原则与应用研究[D];西安工程大学;2012年
10 高莉;硬新闻语料库的创建和应用[D];山东大学;2011年
11 卢璐;基于语料库的中美英语新闻中模糊限制语对比分析[D];安徽大学;2012年
12 原灵杰;从建构主义的角度论基于语料库的翻译教学[D];广东外语外贸大学;2009年
13 钱之莹;汉英/英汉平行翻译语料库的设计及其在翻译中的应用[D];华东师范大学;2005年
14 刘偌潆;基于语料库的法律词汇翻译策略研究[D];西南政法大学;2017年
15 张伟;基于语料库的量词“对、双、副”研究[D];华中师范大学;2017年
16 郑重;面向初等数学概率与统计语料库的构建研究[D];华中师范大学;2016年
17 刘娜;基于语料库的儿童分级阅读语言学定量研究[D];山东大学;2015年
18 张硕;基于语料库的2012年度党政机关公文词频分析[D];暨南大学;2013年
19 廖勇;基于语料库的中美财经类博士论文摘要的文体学对比分析[D];西南财经大学;2013年
20 陈安文;基于布朗语料库的《喧哗与骚动》语言特色研究[D];济南大学;2013年
中国重要报纸全文数据库 前20条
1 北京外国语大学北京日本学研究中心 段文晶;以学习者为中心建设语料库[N];中国社会科学报;2019年
2 戴光荣 福建工程学院人文学院;从语料库视角看中国文学作品“走出去”[N];中国社会科学报;2018年
3 国家社科基金重大项目“大规模英汉平行语料库的建立与加工”首席专家、北京外国语大学教授 王克非;构建新型的历时复合语料库[N];中国社会科学报;2016年
4 记者 郝日虹;我国首个质量安全语料库建成[N];中国社会科学报;2014年
5 商报记者 罗添 实习记者 张绪旺;输入法语料库进入“T”时代[N];北京商报;2010年
6 杨希贵 王东;合作开发语料库还仅仅是第一步[N];中国图书商报;2005年
7 本报记者 朱颖婕;人类的1%比AI的99%更重要[N];文汇报;2019年
8 黑龙江大学应用外语学院 关秀娟;语料库推进莎剧汉译研究[N];中国社会科学报;2016年
9 受访者 迈克尔·麦卡锡(《剑桥标准英语教程》首席作者、国际著名语言学家) 采访者 王东(商报记者);语料库技术用于英语教学是全球趋势[N];中国图书商报;2011年
10 殷治纲;语音语料库的建设和作用[N];中国社会科学院院报;2006年
11 记者 王坤宁;商务方正合作开发辞书语料库及编纂系统[N];中国新闻出版报;2002年
12 安徽商贸职业技术学院外语系 李金霞;语料库对商科院校外宣材料作用研究[N];山西青年报;2014年
13 李行健;现代汉语规范词典拒收“屌丝白富美”因品位太低(下)[N];语言文字周报;2014年
14 本报记者 张贵勇;语料库:英语学习的技术突破[N];中国教育报;2011年
15 施晨露;大部头与小图标[N];解放日报;2019年
16 本报记者 周建华;数字战略打造核心竞争力[N];中国图书商报;2001年
17 本报记者 王斯敏 通讯员 吴青;不惧险远 勇开新天[N];光明日报;2013年
18 通讯员 咸俞灵;迫切需要建设完备的汉语中介语语料库[N];科技日报;2012年
19 ;轻松跨越语言障碍[N];中国电脑教育报;2004年
20 本报记者 刘江伟 王国平;如何看待《唐诗三百首》有“硬伤”[N];光明日报;2021年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978