收藏本站
《河南大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

汉字语法语义智能输入法搭配库设计与实现

梁文娟  
【摘要】: 中文信息处理就是利用计算机对汉语信息进行自动处理。在中文信息处理中,解决汉字输入是一项基础而又重要的工作。虽然已经有不依靠键盘输入汉字的产品问世,但汉字键盘输入法还是最普及的方式,也是中文信息处理领域中一个很重要的课题。在已有的键盘输入法中,有以字、词为单位输入的,也有后来以短语和句子为单位来输入的,但是这些输入法在智能处理方面都不太理想。所以设计了汉字语法语义智能输入法,目的是通过应用汉语的词语搭配知识、语法和语义搭配知识来提高输入法的智能性。本文所做的研究就是设计汉字语法语义输入法所使用的这些词语搭配知识库、语法和语义搭配知识库。详细内容如下: 1、设计并实现两词语搭配知识库。动态设定远、近距离搭配窗口,统计窗口内的候选搭配词语,然后根据改进的几个统计模型:近距离搭配强度、远距离搭配强度、近距离搭配离散度、远距离搭配离散度,各个位置上的尖峰值进行候选搭配词的初步筛选,最后根据一些语法语义知识进行进一步的筛选,得出的最终结果填写到本文的两词语搭配知识库中。 2、设计并实现三词语搭配知识库。对两词语搭配库中的每一个词语搭配对作为一个关键词语对其重复两词语搭配库统计的过程步骤,得出的最终结果存入到本文的三词语搭配知识库中。 3、设计并实现语法搭配知识库。短语以及句子内部都有一定的语法结构关系,先建立一系列的语法搭配规则模板,然后对《人民日报》语料库进行模板匹配,自动抽取出一系列的具体语法搭配实例,存入语法搭配知识库中。 4、设计并实现语义搭配知识库。词语搭配对之间也存在一定的语义关系。首先借助《同义词词林》对语义知识进行编码,定义语义搭配的编码形式,采用这种编码方式对两词语搭配知识库中的节点词语实例指派合适的义类,然后给搭配实例中的搭配词指派合适的义类,最后对所有的义类搭配进行合并和统计,得到最终的语义搭配知识库。
【学位授予单位】:河南大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP391.14

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 卫乃兴;基于语料库和语料库驱动的词语搭配研究[J];当代语言学;2002年02期
2 邓飞;计算机语料库在词的使用研究中的应用[J];大连海事大学学报(社会科学版);2005年03期
3 郑逢斌,陈志国,姜保庆,乔保军;语义校对系统中的句子语义骨架模糊匹配算法[J];电子学报;2003年08期
4 徐志明,王晓龙,姜守旭;一种语句级汉字输入技术的研究[J];高技术通讯;2000年01期
5 王轩,王晓龙,藏晓莉;统计与规则相结合的计算机音字相互转换技术[J];哈尔滨工业大学学报;1997年04期
6 郑建新,曾锡山;自由汉字输入法的系统设计与实现[J];华南师范大学学报(自然科学版);1994年03期
7 卫乃兴;专业性搭配初探——语料库语言学方法[J];解放军外国语学院学报;2001年04期
8 卫乃兴;搭配研究50年:概念的演变与方法的发展[J];解放军外国语学院学报;2003年02期
9 郭池 ,陈家骏 ,王启祥;一种基于语料库的词义消歧策略[J];计算机工程与应用;2003年35期
10 曲维光,陈小荷,吉根林;基于框架的词语搭配自动抽取方法[J];计算机工程;2004年23期
中国博士学位论文全文数据库 前1条
1 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
中国硕士学位论文全文数据库 前1条
1 毕丽克孜;现代维吾尔语语料库词频统计实验性研究[D];新疆大学;2003年
【共引文献】
中国期刊全文数据库 前10条
1 祁庆倩;;现代汉语心理动词的内部时间结构[J];安徽大学学报(哲学社会科学版);2011年03期
2 杨晓黎;;传承语素:汉语语素分析的新视角[J];安徽大学学报(哲学社会科学版);2012年02期
3 汪红艳;开启之功 创新之力——略论汉语语法学的草创与革新[J];安徽教育学院学报;2002年05期
4 蒋美丰;;充分把握原文 有效落实译文[J];安徽文学(下半月);2007年11期
5 严芳;;浅谈对外汉语中离合词的教学[J];安徽文学(下半月);2008年04期
6 薛凤生;;动补结构否定形式小议[J];安徽文学(下半月);2008年08期
7 吴国初;刘明;;词汇搭配同现理论与英语词汇教学[J];安徽文学(下半月);2008年10期
8 李锦;;《三国志平话》的程度副词研究[J];安徽文学(下半月);2009年01期
9 刘旭;;浅论“X门”的结构特征[J];安徽文学(下半月);2009年06期
10 苏久;石珍;;“xx门”引起的关于类词缀一点思考——关于汉语外源类词缀的一点思考[J];安徽文学(下半月);2009年09期
中国重要会议论文全文数据库 前10条
1 加米拉·吾守尔;瓦依提·阿布力孜;吐尔根·依布拉音;;《现代维吾尔语语法信息词典》数据库建设的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 刘建华;;词块理论与英语阅读策略[A];语言与文化研究(第一辑)[C];2007年
3 李瑞青;;英语教学中的词汇搭配问题[A];语言与文化研究(第一辑)[C];2007年
4 李政文;;基于语料库的“admit”的对比研究[A];语言与文化研究(第五辑)[C];2010年
5 张思洁;;形合与意合的哲学思辨[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
6 甘灿;孙星明;刘玉玲;向凌云;;一种改进的基于同义词替换的中文文本信息隐藏方法[A];第七届全国信息隐藏暨多媒体信息安全学术大会论文集[C];2007年
7 卢伟清;苏新春;;词义开放处理平台的研究和实现[A];第六届汉语词汇语义学研讨会论文集[C];2005年
8 王惠;苏新春;;XHK基于语法知识的汉语词义描述[A];第六届汉语词汇语义学研讨会论文集[C];2005年
9 俞士汶;朱学锋;段慧明;张化瑞;;以词义为主轴的综合型语言知识库[A];第六届汉语词汇语义学研讨会论文集[C];2005年
10 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 王蕾;中国高水平EFL学习者语言研究:程式语和语言创造性[D];上海外国语大学;2010年
2 卢建平;基于拓扑学和统计学的无字库汉字智能造字研究[D];华南理工大学;2010年
3 王用源;汉语和藏语复音词构词比较研究[D];南开大学;2010年
4 周扬;面向中药药性多维表征体系的中药本体研究[D];山东中医药大学;2010年
5 李滨;自然空间查询语言解译机制研究[D];解放军信息工程大学;2009年
6 彭懿;英汉肤觉形容词的认知语义研究[D];湖南师范大学;2010年
7 龙又珍;现代汉语寒暄系统研究[D];武汉大学;2009年
8 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
9 黄雪霞;新加坡华语词汇五十年发展变化研究[D];华中师范大学;2011年
10 王俊;现代汉语离合词研究[D];华中师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 许旭;韵律对并列结构歧义的消解影响[D];辽宁师范大学;2010年
2 马晶晶;表人名词类词缀“X手”、“X者”、“X员”分析比较[D];辽宁师范大学;2010年
3 张军珲;基于统计的常用汉语副词用法自动识别研究[D];郑州大学;2010年
4 王倩倩;基于语料库的中国英语学习者关于MAKE一词的搭配错误研究[D];上海外国语大学;2010年
5 石娜;从形合意合角度比较《傲慢与偏见》两译本[D];上海外国语大学;2010年
6 张友学;句首介词“在”的隐现及其对外汉教学的启示[D];上海外国语大学;2010年
7 苏杭;汉语对英语动名词搭配的负迁移以及对高中英语教学的启示[D];上海外国语大学;2010年
8 付红艳;Web多文档自动文摘研究[D];哈尔滨工程大学;2010年
9 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
10 姜丹丹;面向对外汉语教学的插入语研究[D];辽宁师范大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 冯志伟;汉字和汉语的计算机处理[J];当代语言学;2001年01期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 卫乃兴;基于语料库和语料库驱动的词语搭配研究[J];当代语言学;2002年02期
4 邓耀臣;词语搭配研究中的统计方法[J];大连海事大学学报(社会科学版);2003年04期
5 王晓龙;汉字编码方案的择优、统一和发展[J];电子学报;1987年01期
6 梅勇,王群生,徐秉铮;基于 FoxPro for Windows 的汉语语料库系统的构造[J];华南理工大学学报(自然科学版);1998年01期
7 卫乃兴;专业性搭配初探——语料库语言学方法[J];解放军外国语学院学报;2001年04期
8 付国宏,王晓龙;汉语词语边界自动划分的模型与算法[J];计算机研究与发展;1999年09期
9 赵军,黄昌宁;结合句法组成模板识别汉语基本名词短语的概率模型[J];计算机研究与发展;1999年11期
10 李晓黎,史忠植;用数据采掘方法获取汉语词性标注规则[J];计算机研究与发展;2000年12期
中国重要会议论文全文数据库 前1条
1 施水才;肖诗斌;王弘蔚;王洪俊;苏东庄;;TRS中文文本信息检索技术的发展——从全文检索到基于自然语言处理的知识检索[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 王素格;杨军玲;张武;;自动获取汉语词语搭配[J];中文信息学报;2006年06期
2 梁文娟;郑逢斌;杜莹;;汉字语法语义智能输入法搭配库的设计与实现[J];计算机工程与设计;2009年21期
3 由丽萍,王素格;汉语动词-动词搭配规则与分布特征[J];计算机工程与应用;2005年23期
4 姜韶华;党延忠;;自动提取含字母词语的领域新术语的研究[J];计算机工程;2007年02期
5 王素格;杨安娜;;基于混合语言信息的词语搭配倾向判别方法[J];中文信息学报;2010年03期
6 陈明远,管汀鹭;打字能比说话更快——几种高速键盘的设计[J];自然杂志;1980年08期
7 唐亚伟;亚伟中文速录机的诞生与应用[J];中文信息;1994年05期
8 胡宜课;信息高速公路与中文信息处理技术[J];计算机工程;1996年S1期
9 张俊林;曲为民;杜林;孙玉芳;;跨语言信息检索研究进展[J];计算机科学;2004年07期
10 罗燕;中文信息检索系统中的自然语言理解技术研究[J];图书情报工作;2005年04期
中国重要会议论文全文数据库 前10条
1 江桂英;;浅议英语单语词典及积极型双语词典对搭配语的处理[A];第二届全国双语词典学术研讨会暨福建省辞书学会第九届年会论文集[C];1996年
2 杨同用;;关于编纂现代汉语常用实词搭配词典的设想——以第二语言学习者为使用对象[A];2004年辞书与数字化研讨会论文集[C];2004年
3 张昱琪;周强;;大规模真实文本中汉语动词语法搭配模板的自动识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 春岭;斯琴;;现代蒙古语词语搭配分布特征初探—以单词GAR、JALAGV为例[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 周红红;;英语搭配和英语搭配词典的编纂原则[A];第二届全国双语词典学术研讨会暨福建省辞书学会第九届年会论文集[C];1996年
6 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
7 陈玉;;英汉学生词典搭配信息的系统处理[A];第二届全国双语词典学术研讨会暨福建省辞书学会第九届年会论文集[C];1996年
8 李向阳;张亚非;;一种基于语义的汉语短语识别方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 赵晨光;蔡东风;;利用语义特征生成搭配[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 王素格;杨安娜;;一种混合语言信息的词语搭配倾向判别方法[A];第五届全国信息检索学术会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 小波;助你解决词语搭配困惑[N];中国图书商报;2002年
2 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
3 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
4 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
5 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年
6 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
7 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
8 记者 段佳;中文信息处理技术加速前行[N];大众科技报;2009年
9 本报记者 毛国兵 通讯员 岚宇;亚伟速录:实现中文信息处理产业化的自主品牌[N];中国贸易报;2008年
10 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
中国博士学位论文全文数据库 前10条
1 张继东;基于科技英语语料库的词语行为特征的异质性研究[D];上海外国语大学;2012年
2 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
3 李芳兰;现代汉语语义韵的理论探索与习得研究[D];中央民族大学;2011年
4 申修瑛;现代汉语词语搭配研究[D];复旦大学;2007年
5 李翠英;搭配的动态观及其应用研究[D];苏州大学;2011年
6 曾小红;汉语“过+宾”结构的多角度分析[D];湖南师范大学;2004年
7 刘荣;面向教育领域的固定短语提取方法研究[D];北京语言大学;2009年
8 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
9 陆军;中国学习者英语型式构成特征研究[D];上海交通大学;2012年
10 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 梁文娟;汉字语法语义智能输入法搭配库设计与实现[D];河南大学;2006年
2 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
3 谢金鑫;积极型汉语学习词典中的动词搭配信息研究[D];华东师范大学;2009年
4 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年
5 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年
6 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
7 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
8 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
9 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
10 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026