收藏本站
《沈阳航空工业学院》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于知网的词对齐技术的研究

刘划  
【摘要】: 词对齐技术一直是机器翻译领域中的一项基础性研究。本文介绍了目前国内外关于词对齐技术的研究现状,阐述了几种具有代表性的词对齐方法,同时分析了它们的理论基础和算法特点。 本文提出将词对齐分为短语过滤、词语完全匹配、相似度计算、语义计算和消歧等多级处理,在短语过滤中优先过滤出部分短语级对齐,降低词语对齐过程中歧义对齐的可能性,从而提高了词对齐的效果;通过对知网与同义词词林的比较,在语义计算中选择知网作为语义资源,对词对齐进行语义层面的扩展,获得更好的对齐效果;针对对齐过程中的歧义对齐现象,提出一种新的歧义分类方法,该方法不区分歧义对齐的形式,能清楚反映歧义对齐现象;提出一种基于锚点词对的通用的最优邻接锚点消歧算法,该算法与各级对齐交替进行,解决了各对齐环节产生的歧义对齐问题。 基于上述理论成果,构建了基于知网的词对齐系统,并在标准评测语料中进行多种对齐方案组合的比较试验,对试验结果的分析比较均表明了基于知网的短语过滤、语义扩展和通用的消歧算法在词语对齐中的有效性。
【学位授予单位】:沈阳航空工业学院
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP391.2

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 晋薇;黄河燕;夏云庆;;基于语义相似度并运用语言学知识进行双语语句词对齐[J];计算机科学;2002年11期
2 邓丹,刘群,俞鸿魁;基于双语词典的汉英词语对齐算法研究[J];计算机工程;2005年16期
3 吕学强,吴宏林,姚天顺;无双语词典的英汉词对齐[J];计算机学报;2004年08期
4 梅立军,周强,臧路,陈祖舜;知网与同义词词林的信息融合研究[J];中文信息学报;2005年01期
5 侯宏旭;刘群;那顺乌日图;;基于实例的汉蒙机器翻译[J];中文信息学报;2007年04期
6 刘小虎,吴葳,李生,赵铁军,蔡萌,鞠英杰;基于词典和统计的语料库词汇级对齐算法[J];情报学报;1997年01期
7 李 沐,吕学强,姚天顺;一种基于E-Chunk的机器翻译模型[J];软件学报;2002年04期
8 常宝宝,张伟;机器翻译研究的现状和发展趋势[J];术语标准化与信息技术;1998年02期
9 张孝飞;陈肇雄;黄河燕;王建德;;基于锚点词对的双语词对齐算法[J];小型微型计算机系统;2006年02期
10 董振东;语义关系的表达和知识系统的建造[J];语言文字应用;1998年03期
中国重要会议论文全文数据库 前1条
1 张孝飞;陈肇雄;黄河燕;张亮;;基于有限资源的双语词对齐算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
【共引文献】
中国期刊全文数据库 前10条
1 李智;;义素分析法与词典释义[J];北方论丛;2007年02期
2 赵欣欣;索红光;刘玉树;张利萍;;基于带权语义距离的网页预取方法[J];北京理工大学学报;2006年08期
3 秦莉;;从“工薪族”、“上班族”二个词语看民族人的词类观[J];才智;2008年19期
4 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期
5 杨松;楼新远;;基于向量空间模型附加词义特征的句子相似度研究[J];成都信息工程学院学报;2012年03期
6 伍莹;;基于“词群—词位变体”理论的现代汉语形容词语义网络构建——以“胖”类形容词为例[J];长江学术;2011年02期
7 高元梓;;基于CEF和WordNet的词汇拓展框架的构建[J];重庆文理学院学报(社会科学版);2010年03期
8 吴佳娣;;现代汉语方位词的界定和甄别[J];时代教育(教育教学);2011年04期
9 胡正微;言语场中解读“厚德博学 强军兴国”[J];长沙理工大学学报(社会科学版);2005年01期
10 张俐,胡明函,李晶皎,何荣伟;满汉计算机辅助翻译系统的满文字符编码[J];东北大学学报;2002年02期
中国重要会议论文全文数据库 前10条
1 加米拉·吾守尔;瓦依提·阿布力孜;吐尔根·依布拉音;;《现代维吾尔语语法信息词典》数据库建设的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 王春荣;宝美荣;王斯日古楞;;内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 徐海;;英、汉分类词典编纂刍议[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
4 王惠;苏新春;;XHK基于语法知识的汉语词义描述[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 张普;;关于大规模真实文本语料库的几点理论思考[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
6 陈慧清;林世平;;基于知网和模式自举的概念间分类关系获取方法[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
7 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
8 陈小荷;;属性分析说略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 周强;陈祖舜;梅立军;;情境描述的构建方法研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
3 方清明;现代汉语名名复合形式的认知语义研究[D];暨南大学;2011年
4 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
5 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
6 朴锦海;汉韩频率副词对比研究[D];中央民族大学;2011年
7 冀芳;济宁方言义位研究[D];山东大学;2011年
8 许浩;《名公书判清明集》词汇研究[D];山东大学;2011年
9 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
10 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
2 程国斌;基于指示词语义扩展的词义识别方法的研究[D];哈尔滨工程大学;2010年
3 吕韶华;面向中文评论文本的情感倾向性研究[D];大连理工大学;2010年
4 张瑶;英汉机器翻译中的英语动词汉译研究[D];大连理工大学;2010年
5 邢鑫岩;基于序列模型的情感分析研究[D];大连理工大学;2010年
6 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
7 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
8 石晶;一种高效垃圾短信过滤系统的实现[D];电子科技大学;2010年
9 赵小曼;英汉平行语料库句子级对齐研究及其在机器翻译中的应用[D];安徽大学;2010年
10 胡家豪;基于互联网的WEB舆情问答系统[D];电子科技大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 张孝飞,陈肇雄,黄河燕,蔡智;词性标注中生词处理算法研究[J];中文信息学报;2003年05期
2 刘洋,刘群,林守勋;机器翻译评测中的模糊匹配[J];中文信息学报;2005年03期
3 张孝飞,陈肇雄,黄河燕,胡春玲;多策略机器翻译系统IHSMTS中实例模式泛化匹配算法[J];中文信息学报;2005年04期
4 徐波;史晓东;刘群;宗成庆;庞薇;陈振标;杨振东;魏玮;杜金华;陈毅东;刘洋;熊德意;侯宏旭;何中军;;2005统计机器翻译研讨班研究报告[J];中文信息学报;2006年05期
5 那顺乌日图;;计算机处理现代蒙古语TAI、TEI形式的尝试[J];民族语文;1991年03期
6 赵斯琴,高光来,何敏;蒙古语语料库的研究与建设[J];内蒙古大学学报(自然科学版);2003年05期
7 敖其尔,王斯日古楞;英蒙机器翻译系统的设计[J];内蒙古大学学报(自然科学版);2003年05期
8 刘小虎,吴葳,李生,赵铁军,蔡萌,鞠英杰;基于词典和统计的语料库词汇级对齐算法[J];情报学报;1997年01期
9 王斌,刘群,张祥;汉英双语库自动分段对齐研究[J];软件学报;2000年11期
10 李 沐,吕学强,姚天顺;一种基于E-Chunk的机器翻译模型[J];软件学报;2002年04期
中国重要会议论文全文数据库 前3条
1 吕雅娟;赵铁军;李生;杨沐昀;;统计和词典方法相结合的双语语料库词对齐[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 刘群;张彤;;汉英机器翻译扩充词典的建造[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
3 黄河燕;陈肇雄;;基于多策略的交互式智能辅助翻译平台总体设计[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
【相似文献】
中国期刊全文数据库 前10条
1 程莉,卢正鼎,文坤梅,李娟;基于语义的模糊匹配探索与应用[J];华中科技大学学报(自然科学版);2003年02期
2 陈铭;李生红;陈秀真;;基于句式结构的评论倾向性识别方法[J];通信技术;2011年02期
3 闫蓉;张蕾;;一种新的汉语词义消歧方法[J];计算机技术与发展;2006年03期
4 田甜;张振国;;主观题自动阅卷技术研究[J];计算机工程与设计;2010年16期
5 张晓孪;王西锋;;基于概念图的汉语语义计算的研究与实现[J];计算机工程与应用;2011年10期
6 柴晓丽;张丽伟;管玉玲;;基于HowNet自动文摘的研究[J];电脑编程技巧与维护;2009年S1期
7 杨喜权;代书;;基于知网的概念匹配细粒度化研究[J];计算机应用;2008年11期
8 唐歆瑜;乐文忠;李志成;李军义;;基于知网语义相似度计算的特征降维方法研究[J];科学技术与工程;2006年21期
9 丁建立;慈祥;黄剑雄;;网络评论倾向性分析[J];计算机应用;2010年11期
10 贾可亮;樊孝忠;张禹;;基于HowNet语义相似度的FAQ研究[J];计算机应用;2007年09期
中国重要会议论文全文数据库 前10条
1 白宇;蔡东风;赵环宇;季铎;;基于语义计算的中文相似问句抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 丁德鑫;曲维光;于丽丽;陈小荷;李惠;;基于词频和语义信息的组合型歧义消解[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 王红玲;吕强;徐瑞;;一种基于知网的中文语义相关度计算模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
7 邓辉;林柏钢;;一种基于《知网》的敏感信息预测技术[A];第十届中国科协年会论文集(三)[C];2008年
8 崔磊;陈清才;郭鸿志;王晓龙;;HowNet与维基百科知识融合中的义类属性自动构建方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 刘林;刘臻;;基于知识的网上监控系统的研究[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
10 陈慧清;林世平;;基于知网和模式自举的概念间分类关系获取方法[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 世经政所 任海平;百岁世界航空工业[N];中国社会科学院院报;2003年
2 本报记者 宋亚林;同心协力 “直九”振翅[N];中国航空报;2008年
3 记者焦静波;北航大学生充满信心[N];中国航空报;2009年
4 中航工业凯天电子总经理 赵勇 党委书记 薛亚声汉航集团公司党委书记 罗宝军庆安集团有限公司董事长、总经理 丁凯 党委书记 靳武强中航供销总公司党委书记 尹智辉;扎实搞好学习实践活动 为航空工业发展提供强大动力[N];中国航空报;2009年
5 ;凝聚思想 坚定信念 众志成城 创新超越[N];中国航空报;2009年
6 龚兴;我国航空工业发展任务和目标明确[N];中国工业报;2008年
7 中国航空工业集团公司总经理 林左鸣;航空强国大国崛起的必由之路[N];中国企业报;2008年
8 中国航空工业集团公司;壮志凌云——腾飞的中国航空工业[N];中国航空报;2009年
9 冯俊 聂颖;航空报国创辉煌 亮剑图强谱新篇[N];经济信息时报;2009年
10 孟萌;巴西航空工业公司参加迪拜国际航展[N];中国航空报;2009年
中国博士学位论文全文数据库 前10条
1 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
2 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年
3 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
4 赵京雷;汉语动词名物化复合结构的语义解释[D];上海交通大学;2008年
5 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
6 夏卿;飞机发动机排放对机场大气环境影响评估研究[D];南京航空航天大学;2009年
7 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年
8 罗群辉;航空工业结构调整的机理研究[D];南京航空航天大学;2009年
9 史先敏;中国栽培灵芝三萜成分的高效液相指纹图谱研究[D];南京农业大学;2008年
10 卢湖川;人脸识别中几个关键算法研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 陈锐;基于概念图的信息检索查询扩展模型研究与实现[D];西北大学;2009年
2 张磊;基于知网的汉语隐喻自动处理[D];兰州大学;2007年
3 余超;基于知网的词汇语义计算研究及应用[D];沈阳航空工业学院;2007年
4 唐琦;基于语义分析的句子相似度计算研究[D];华北电力大学(北京);2009年
5 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
6 郭丽;基于上下文的词语相似度计算及其应用[D];沈阳航空工业学院;2009年
7 柴晓丽;自动文摘技术的研究与应用[D];长春理工大学;2007年
8 李佳;基于知网的中文本体映射研究[D];北京邮电大学;2007年
9 李剑;基于分块的句子语义相似度研究[D];安徽工业大学;2011年
10 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026