收藏本站
《重庆大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

计算机辅助诗词创作中的风格辨析及联语应对研究

易勇  
【摘要】:作为中国文化传承和精美艺术品的诗词曲联作品,在信息时代面临着重新整理和信息挖掘的问题,而立足于当代,需要运用信息处理工具进行深入分析和智能模拟,由于语料库技术和机器学习技术的发展,解决了海量数据的结构化存储和机器自动处理的问题。在机器学习的框架下,传统诗词的问题得到探索分析的条件已经初步具备,相对而言传统的文学分析能在信息技术的提携下,获得处理理念和视角上的一次更生,使得海量而又错综棘手的古典文学分析研究,在机器辅助下,其结果更加易懂明了,其处理更加自动化。 本文是在国家自然科学基金项目“计算机辅助文学艺术创作——诗词曲联(上)(项目编号60173060)的支持下,进行的是应用驱动型的研究,即“诗词风格的机器评判和联语(对仗)语句的生成”。在本文的研究中,对诗词采用向量空间模型表示,并用基于机器学习中的Na?ve Bayes 等方法,首次提出了古典诗词的豪放和婉约风格辨析计算模型,并用遗传算法等方法对模型进行改进,取得较好的诗词风格评判结果。首次提出了古典诗词的作者辨析计算模型,该模型已经在精典诗词语料的机器学习基础上得以实现,也获得较好的诗词作者评判效果。通过将联语应对问题转化为序列学习建模的问题,进行了联语应对生成的研究,依据输入的上联,机器能较为成功地应对生成下联,并在实际的诗词对联语料数据上进行了大量的实验,实验的结果验证了这些方法的可行性和有效性。本论文的主要研究内容如下: 1) 由于机器学习和古典文学数字化的需要,本文提出的方法和实验研究都基于语料库的数据驱动进行,因此简要介绍了唐诗、宋词和对联语料库的建立。这部分内容主要集中在本文的第二章。 2) 针对高度抽象的艺术概念“风格”的辨析,着重从三个问题展开研究。第一、诗词的风格能否用机器评判,即可行性问题;第二、诗词的风格由机器通过什么方式评判,即怎么做问题;第三、如何提高机器评判的效果,即优化问题。对于第一个问题,本文提出将诗词的风格评判问题转化为一种文本的模式识别问题而得以解决。对于第二个问题,本文探索了诗词的韵部和声调对风格的影响,发现两者对解决诗词风格的评判问题的难度较大,最后采用了用以字为研究对象的向量空间模型来表示诗词,使诗词的风格得以顺利进行。对于第三个问题,结合信息增益挑选用于风格评判的汉字,并用遗传算法等方法改进了诗词风格的评判效果,用55 个汉字获得了88.5%的评判准确度。这部分内容方法论述集中在本文的第三章,实验介绍在第四章。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP399

【相似文献】
中国期刊全文数据库 前10条
1 黄长伟;;自动文摘技术研究现状分析[J];中外企业家;2011年14期
2 刘一宁;;学术定义抽取研究综述[J];情报探索;2011年08期
3 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
4 史晓东;卢亚军;;央金藏文分词系统[J];中文信息学报;2011年04期
5 ;Web 2.0下一步:电脑自动剖析信息[J];黄金时代;2009年03期
6 王利鑫;耿焕同;孙凯;张茜;;基于自然语言处理的文本泄密自动检测技术[J];计算机工程与设计;2011年08期
7 安见才让;;藏语句子相似度算法的研究[J];中文信息学报;2011年04期
8 刘兴林;郑启伦;马千里;;中文合成词识别及分词修正[J];计算机应用研究;2011年08期
9 王波;;基于领域语料的专业英语教学词汇建构[J];电脑知识与技术;2011年13期
10 张海军;彭成;栾静;;基于外部排序的字串左右熵快速计算方法[J];计算机工程与应用;2011年19期
中国重要会议论文全文数据库 前10条
1 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
2 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
4 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
8 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
10 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
4 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
7 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
8 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
9 ;开天辟地第一回[N];计算机世界;2002年
10 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
2 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
3 计峰;自然语言处理中序列标注模型的研究[D];复旦大学;2012年
4 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
5 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
6 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
7 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
8 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
9 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
10 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
2 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
3 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
4 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
5 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
6 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
7 崔昌利;俄语简单句述谓VP的模式化及自动识别[D];黑龙江大学;2005年
8 赵城利;基于Web的信息智能感知技术及应用[D];国防科学技术大学;2004年
9 张学;EBMT系统中翻译模板的抽取与匹配[D];大连理工大学;2006年
10 巩晓婷;基于文本的信息隐藏技术研究[D];福州大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026