收藏本站
《广西师范学院》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

《万历野获编》分词理论与实践

冯海瑛  
【摘要】:明代是汉语发展史中的一个重要时期,近代汉语发展到了这个阶段已进入成熟期,构成近代汉语的诸多要素已经稳定下来,这也意味着近代汉语向现代汉语的演变由此发端,因此这个时期的词汇呈现出承上启下的交汇特点。而对明代汉语语料进行分词及词频统计的研究,可以更全面地了解这个时期的词汇使用概貌。一方面可用作现代汉语中文信息处理研究的补充;另一方面也是为研究近代汉语分词标准及开发自动分词软件提供参考。 本文以明代笔记《万历野获编》中的词为考察对象。首先建立了一个约五十万字的封闭语料库,然后对语料进行分词和词频统计。所完成的研究工作包括:(1)制定分词规范;(2)进行分词实践和词语统计得出《万历野获编》的词频统计表;(3)对词频统计结果进行研究分析,从共时的角度对《万历野获编》的词语基本特征进行描写;(4)将《万历野获编》词频表与《朱子语类》、《现代汉语频率词典》中的常用词频率表作历时比较,以寻找汉语词汇从宋代、明代到现代的基本发展变化及规律。 本文共分为六章,其中“分词标准”、“分词实践”、“词频分析”、“构词特点”、“词频表对比”等问题为各章研究的重点。我们的研究以描写语言学、历史语言学、比较语言学和语法理论为指导,力求在前人研究成果的基础上能有一些突破,为近代汉语断代词汇研究以及近代汉语信息处理研究提供更丰富的资料。
【学位授予单位】:广西师范学院
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:H141

【参考文献】
中国期刊全文数据库 前2条
1 郑继猛;;近年来宋代笔记研究述评[J];甘肃社会科学;2008年04期
2 王锳;近代汉语词汇研究与中古汉语[J];贵州大学学报(社会科学版);2003年04期
中国博士学位论文全文数据库 前1条
1 杨继光;《万历野获编》词汇研究[D];厦门大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 戚晓杰;;从《聊斋俚曲集》看汉语动词拷贝句式的产生年代[J];蒲松龄研究;2006年01期
2 周俊勋;从高诱注看东汉北方代词系统的调整[J];阿坝师范高等专科学校学报;2000年01期
3 王媛媛;;中古汉语中的介词“着”[J];安徽大学学报(哲学社会科学版);2011年03期
4 褚福侠;;元曲“量词+儿”用法考[J];合肥师范学院学报;2009年05期
5 曾良;;明清小说词语俗写考[J];合肥师范学院学报;2010年02期
6 储小旵;张丽;;徽州契约文书方言俗语词辑释[J];合肥师范学院学报;2011年05期
7 曾昭聪;;论明清俗语辞书的编纂目的[J];合肥师范学院学报;2011年05期
8 方云云;;近代汉语“脖子语义场”主导词的历时演变[J];安徽农业大学学报(社会科学版);2010年01期
9 刘光明;《颜氏家训》的被动句研究[J];安徽师范大学学报(人文社会科学版);2005年03期
10 饶宏泉;;量词的性质和数量表达的核心——语序类型学的研究[J];安徽师范大学学报(人文社会科学版);2012年01期
中国重要会议论文全文数据库 前10条
1 唐嘉忆;;汉译英口译材料的难度判断[A];首届海峡两岸外语教学与研究学术研讨会暨福建省外国语文学会2011年会论文集[C];2011年
2 李金;宋阳;梁洪;;语言残障患者医疗辅助系统设计[A];第九届全国信息获取与处理学术会议论文集Ⅱ[C];2011年
3 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 张平忠;;中古以來齒音由細轉洪的雕散式音燮[A];福建省辞书学会第五届会员代表大会暨第十九届年会论文集[C];2009年
7 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
8 程书秋;;“V不V”及其相关结构[A];语言学论文选集[C];2001年
9 陈敏;王翠叶;;中文信息处理的现状与展望[A];语言文字应用研究论文集(Ⅱ)[C];2004年
10 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
中国博士学位论文全文数据库 前10条
1 赵一霖;唐五代人的精怪想象[D];哈尔滨师范大学;2010年
2 邱闯仙;现代汉语插入语研究[D];南开大学;2010年
3 曲丽玮;元刊杂剧复字词汇研究[D];南开大学;2010年
4 李颖玉;基于语料库的欧化翻译研究[D];上海外国语大学;2010年
5 唐树华;有些隐喻为什么不可能[D];上海外国语大学;2010年
6 吴善子;汉韩反诘语气副词对比研究[D];上海外国语大学;2010年
7 魏晓虹;《阅微草堂笔记》研究[D];东北师范大学;2010年
8 刘春兰;《训世评话》语法研究[D];南开大学;2010年
9 杜凤梅;古齐鲁语声母系统构拟[D];南开大学;2010年
10 王用源;汉语和藏语复音词构词比较研究[D];南开大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 谢芳庆;试论《汉语大词典》体系[J];安徽师大学报(哲学社会科学版);1997年01期
2 高兴;古人笔记与《汉语大词典》[J];安徽师大学报(哲学社会科学版);1998年04期
3 郑继猛;马茂军;;妙手作记,图画山水——范成大日记体游记研究[J];安康师专学报;2005年06期
4 李立成;近代汉语词典的收词立目[J];辞书研究;1997年06期
5 祝鸿熹;现代汉语辞书呼唤训诂学[J];辞书研究;1998年06期
6 吴金华,王宝刚;《汉语大词典》商订五题[J];辞书研究;1999年03期
7 周铮;孤证立目当慎重[J];辞书研究;1999年05期
8 高兴;古人笔记与辞书编纂[J];辞书研究;2000年05期
9 胡中文;同素族词语与语素义义项的归纳[J];辞书研究;2001年03期
10 蒋宗许;论近代汉语研究与《汉语大词典》的修订[J];辞书研究;2004年01期
【相似文献】
中国期刊全文数据库 前10条
1 辛红;通过比较讲清语法概念[J];雁北师范学院学报;1994年04期
2 罗小强,王仁华;汉语音节全分词算法[J];中国科学技术大学学报;1995年02期
3 匡世玉,蔡德全;分词(Participle)用法点滴[J];自贡师范高等专科学校学报;1997年02期
4 路式成 ,罗兴伟;英语名词(代词)+“-ing”分词复合结构[J];解放军外国语学院学报;1981年01期
5 周光华;;-ed分词的功能[J];英语知识;1998年07期
6 许国强;论英语“反向心理动词”[J];解放军外国语学院学报;1993年06期
7 惠芡;英语“特殊被动语态”浅探[J];南都学坛;1995年02期
8 朱福荣;内地与香港部分词语对照[J];中国工商;1997年10期
9 张彻;浅议动词中分词的介词作用[J];内蒙古科技与经济;2002年09期
10 石凯民;;不能作定语的第二分词[J];德语学习;2007年03期
中国重要会议论文全文数据库 前10条
1 徐润华;陈小荷;;一种利用注疏的《左传》分词新方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 李怡平;吴飞;;多语言环境下的分布式互联网分词平台[A];第十六届全国数据库学术会议论文集[C];1999年
3 赵伟;路永刚;吴琼;;一种新的基于BMM和RMM分词方法的研究与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 徐冰;姚建民;杨沐昀;赵铁军;;汉语分词在机器翻译评价中的影响[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 陈丽江;;ACL-SIGHAN第一届国际中文分词竞赛评述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 周俊;孙啸;;频繁序列算法在生物信息挖掘中的应用[A];第十次中国生物物理学术大会论文摘要集[C];2006年
8 苏新春;顾江萍;;“人”“机”分词差异及规范词典的收词依据——对645条常用词未见于《现汉》的思考[A];中国辞书论集2000[C];2000年
9 刘桐菊;于浩;赵铁军;;基于标引技术的特定领域XML文本自动生成[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 曲维光;;分词系统计量研究与改进方案[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 高岚;海量在线做搜索引擎“卖水人”[N];中国计算机报;2004年
2 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
3 本报记者 侯闯;让企业不再“眼花”[N];计算机世界;2003年
4 章森 王伟;搜索引擎的工作机制[N];计算机世界;2006年
5 ;大恒FTR全文检索软硬件解决方案[N];计算机世界;2001年
6 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
7 朱艳;术语解释[N];中国电脑教育报;2000年
8 ;语言信息处理呼唤知识应用[N];中国计算机报;2003年
9 郭延礼;都德《最后一课》的首译、伪译及其全译文本[N];中华读书报;2008年
10 ;为什么我搜索不到想要的内容[N];中国电脑教育报;2003年
中国博士学位论文全文数据库 前10条
1 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
2 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
3 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
4 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
5 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
6 杨继光;《万历野获编》词汇研究[D];厦门大学;2007年
7 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
8 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
9 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
10 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
中国硕士学位论文全文数据库 前10条
1 冯海瑛;《万历野获编》分词理论与实践[D];广西师范学院;2010年
2 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
3 陈思;中文文本投诉信息自动分类系统研究[D];东北师范大学;2010年
4 皮鹏;智能搜索引擎系统的研究[D];哈尔滨工程大学;2002年
5 赵春红;外包数据库模型中文本数据完整性检测方案的研究[D];燕山大学;2010年
6 卢育红;半结构化药物数据智能分类技术研究与系统实现(全日制专业学位)[D];北京交通大学;2011年
7 刘婧一;元代笔记分词理论与实践[D];广西师范学院;2010年
8 卢忠良;基于多类的汉语文本自动分类研究[D];中国人民解放军国防科学技术大学;2002年
9 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
10 张楚屏;从分词的静词作用看分词在计算机英语中的翻译方法[D];华中科技大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026