收藏本站
《沈阳航空工业学院》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于条件随机场的汉语词义消歧方法研究

苗雪雷  
【摘要】:词语消歧一直以来都是自然语言处理领域中的一个热点和难点,对于机器翻译、信息检索、句法分析、文本分类等领域的研究都具有十分重要的理论和实践意义。 本文调研了国内外词义消歧研究的历史和现状,分析了目前词义消歧的算法和采用的相关技术。现阶段,无指导词义消歧方法虽然可以节省大量人工标注的工作,但是其标注正确率相对较低,难以满足实际应用的需求。有指导的词义消歧仍然是当前实际应用中的主流方法。 本文提出并构建了一个基于知网的汉语语义实例库(CSIC)来解决有指导词义消歧任务中的知识源问题。目前该实例库正在建设中,已经完成了实例库的总体结构设计、标注规范制定、标注平台开发、标注语料整理和评测模块开发等主要工作,为后面开展大规模词义标注工作提供了较好的基础。 为了快速建立大规模、高质量的汉语语义实例库,本文开发了一个标注平台来提高人工标注的效率,自动维护标注的一致性,检查标注中出现的错误。同时,标注平台还能够方便的进行不同消歧方法的实验,并提供算法评价模块。 条件随机场是近年来提出的一种条件概率模型,主要用于序列标注和分割,是一个基于统计的机器学习方法。目前在自然语言处理领域,条件随机场模型多用于词语切分、词性标记和浅层语义分析等领域。本文尝试在词义消歧过程中引入条件随机场模型来从CSIC中学习消歧知识。实验结果表明,条件随机场模型取得了较高的词义标注正确率。
【学位授予单位】:沈阳航空工业学院
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP391.1

手机知网App
【引证文献】
中国期刊全文数据库 前3条
1 车玲;张仰森;;面向词义消歧的条件随机场模型库构建[J];计算机工程;2012年20期
2 周溢辉;昝红英;穆玲玲;;基于条件随机场的语气词用法自动识别研究[J];计算机工程与设计;2011年11期
3 屠明萍;;基于贝叶斯分类器和条件随机场模型的词义消歧对比研究[J];文教资料;2011年36期
中国硕士学位论文全文数据库 前5条
1 张军珲;基于统计的常用汉语副词用法自动识别研究[D];郑州大学;2010年
2 袁应成;基于用法属性的现代汉语介词短语边界识别研究[D];郑州大学;2011年
3 洪鹿平;汉语复句关系自动判定研究[D];南京师范大学;2008年
4 张剑豪;基于潜在语义分析的军事情报检索系统的研究与实现[D];东北大学;2009年
5 于光;中文分词系统的设计与实现[D];电子科技大学;2012年
【参考文献】
中国期刊全文数据库 前5条
1 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
2 卢志茂,刘挺,张刚,李生;基于依存分析改进贝叶斯模型的词义消歧[J];高技术通讯;2003年05期
3 鲁松,白硕,黄雄,张健;基于向量空间模型的有导词义消歧[J];计算机研究与发展;2001年06期
4 俞士汶,段慧明,朱学锋,张化瑞;综合型语言知识库的建设与利用[J];中文信息学报;2004年05期
5 全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期
中国重要会议论文全文数据库 前1条
1 张仰森;俞士汶;段惠明;吴云芳;;汉语词义自动标注研究软件平台的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国硕士学位论文全文数据库 前1条
1 陈晴;基于条件随机场的自动分词技术的研究[D];东北大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 谢宇;张仰森;肖建涛;;规则与统计相结合的汉语词义消歧模型[J];北京机械工业学院学报;2007年03期
2 张仰森;郭江;;四种统计词义消歧模型的分析与比较[J];北京信息科技大学学报(自然科学版);2011年02期
3 索娟娟;;信息时代计算语言学在英语教学中的应用[J];毕节学院学报;2008年01期
4 李玉森;张雪英;袁正午;;面向GIS的地理命名实体识别研究[J];重庆邮电大学学报(自然科学版);2008年06期
5 李建平;王慧强;卢爱平;郝洪亮;冯光升;;基于条件随机场的网络安全态势量化感知方法[J];传感器与微系统;2010年10期
6 吕学强,李清隐,任飞亮,姚天顺;基于统计的汉英法律文献亚句子级对齐[J];东北大学学报;2003年01期
7 于江德;李学钰;樊孝忠;;信息抽取中领域本体的设计和实现[J];电子科技大学学报;2008年05期
8 黄德根;李泽中;万如;;基于SVM和CRF的双层模型中文机构名识别[J];大连理工大学学报;2010年05期
9 黄明;王慧;梁旭;;最大熵模型的语义句法分析在陪护机器人中的应用[J];大连交通大学学报;2011年05期
10 谭勋;吐尔根·依布拉音;艾山·吾买尔;艾山·毛力尼亚孜;;汉维哈柯双语语料库加工系统句子对齐技术的研究[J];电脑知识与技术;2011年28期
中国重要会议论文全文数据库 前10条
1 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 何正焱;王厚峰;;商品品牌名称挖掘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 潘治文;李怡平;;一个基于语料库的葡中翻译系统[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
4 苏新春;王惠;卢伟清;秦少康;;语言知识库的内化与细化——完善词义知识库之设想[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 俞士汶;朱学锋;段慧明;张化瑞;;以词义为主轴的综合型语言知识库[A];第六届汉语词汇语义学研讨会论文集[C];2005年
6 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 王惠;;汉英机器翻译中基于大型语义词典的汉语词义消歧[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
8 刘晓月;杨沐昀;赵铁军;;迭代策略和词典相结合的机器翻译词典获取[A];第一届学生计算语言学研讨会论文集[C];2002年
9 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 陈浩;何婷婷;代玲;;基于向量空间模型的无导词义消歧[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 李建平;面向异构数据源的网络安全态势感知模型与方法研究[D];哈尔滨工程大学;2010年
2 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
3 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
4 张浩;视频运动人体行为识别与分类方法研究[D];西安电子科技大学;2011年
5 刘运;DDoS Flooding攻击检测技术研究[D];国防科学技术大学;2011年
6 于建平;英语情态动词语义智能排歧研究[D];上海外国语大学;2011年
7 范冬梅;基于统计学习的词义识别方法研究[D];哈尔滨工程大学;2011年
8 刘荣辉;多阶段自适应差分进化算法及应用研究[D];东华大学;2012年
9 Xu Luomai;[D];广东外语外贸大学;1999年
10 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 程国斌;基于指示词语义扩展的词义识别方法的研究[D];哈尔滨工程大学;2010年
2 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
3 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
4 杨晓东;中文命名实体识别及若干相关问题的研究[D];江苏大学;2010年
5 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
6 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
7 王慧;最大熵模型的语义句法分析在问答系统中的应用研究[D];大连交通大学;2010年
8 王冬娇;改进的语句相似度算法在问答系统中的应用研究[D];大连交通大学;2010年
9 潘文彬;基于情感词词典的中文句子情感倾向分析[D];北京邮电大学;2011年
10 旷远;观点提出者(opinion holder)提取研究[D];北京邮电大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 李子云;;汉语单句复句的区分问题[J];安徽教育学院学报(社会科学版);1985年02期
2 宋驰;刘青焱;张颜;蒋博;徐振愚;夏永静;刘湘军;;一种文本数据挖掘与可视化的新方法[J];北京生物医学工程;2008年02期
3 谢蓓;;对复句分类研究的回顾与思考[J];重庆科技学院学报;2006年06期
4 周新媛;杜洁;何强;;基于共现的词聚类的研究[J];长沙大学学报;2007年02期
5 昝红英;朱学锋;;面向自然语言处理的汉语虚词研究与广义虚词知识库构建[J];当代语言学;2009年02期
6 高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期
7 庄世芳;;一种基于概念聚类的中文文本类簇主题提取方法[J];电脑知识与技术;2008年10期
8 熊小梅;刘永浪;;基于LSA的二次降维法在中文法律案情文本分类中的应用[J];电子测量技术;2007年10期
9 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
10 林兴国;单、复句划界小议[J];福清师专学报;1982年02期
中国重要会议论文全文数据库 前2条
1 李晋霞;刘云;;面向计算机的二重复句层次划分研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 俞士汶;朱学锋;刘云;;面向自然语言理解的汉语虚词研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前10条
1 肖明;基于SVM的智能邮件过滤系统研究与实现[D];电子科技大学;2005年
2 陈晴;基于条件随机场的自动分词技术的研究[D];东北大学;2005年
3 牛肖潇;支持向量机及用于文本分类的研究[D];武汉理工大学;2006年
4 王琳;基于本体的汉语复句语义分析[D];华中师范大学;2006年
5 罗旋;基于复句领域本体的语义标注方法研究[D];华中师范大学;2006年
6 杨宇娜;基于统计的中文词义消歧技术研究[D];哈尔滨工业大学;2006年
7 于浚涛;基于最大熵的汉语介词短语自动识别[D];大连理工大学;2006年
8 姜锋;基于条件随机场的中文分词研究[D];大连理工大学;2006年
9 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
10 彭其伟;基于统计方法的中文文本情感倾向分类研究[D];山西大学;2007年
【二级引证文献】
中国硕士学位论文全文数据库 前5条
1 容艺梅;初中生汉语母语书面表达中复句关系标记偏误考察及教学对策[D];华中师范大学;2011年
2 周溢辉;基于规则与统计的语气词用法自动识别研究[D];郑州大学;2011年
3 周丽娟;现代汉语连词用法的自动识别及应用研究[D];郑州大学;2012年
4 夏静;常用词的兼类自动识别研究[D];郑州大学;2012年
5 吴志隆;信息处理用“一X”词的自动识别与消歧研究[D];上海师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
2 鲁松,白硕,黄雄,张健;基于向量空间模型的有导词义消歧[J];计算机研究与发展;2001年06期
3 杨尔弘,张国清,张永奎;基于义原同现频率的汉语词义排歧方法[J];计算机研究与发展;2001年07期
4 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
5 俞士汶;中文输入中语法分析技术的应用[J];中文信息学报;1988年03期
6 郑杰,茅于杭,董清富;基于语境的语义排歧方法[J];中文信息学报;2000年05期
7 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
8 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范[J];中文信息学报;2002年05期
9 尤昉,李涓子,王作英;基于语义依存关系的汉语语料库的构建[J];中文信息学报;2003年01期
10 昝红英,苏玉梅,孙斌,俞士汶;名人网页的相关度评价[J];中文信息学报;2003年05期
中国重要会议论文全文数据库 前1条
1 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国重要报纸全文数据库 前1条
1 本报记者 温红彦;[N];人民日报;2002年
【相似文献】
中国期刊全文数据库 前10条
1 孙继明;李舟军;文健;;基于《知网》的汉语词语词义消歧方法[J];计算机与信息技术;2007年03期
2 车超;金博;滕弘飞;屈福政;;基于义原关系的多策略汉语词义消歧方法[J];大连理工大学学报;2010年04期
3 李永亮;黄曙光;鲍蕾;;一种基于PageRank算法和知网的词义消歧方法[J];计算机应用与软件;2011年05期
4 闫蓉;;基于语义相关度计算的汉语词义消歧方法研究[J];内蒙古大学学报(自然科学版);2007年06期
5 王广正;王喜凤;;基于知网语义相关度计算的词义消歧方法[J];安徽工业大学学报(自然科学版);2008年01期
6 葛斌;封孝生;汤大权;;基于模板的无导词义消歧方法[J];计算机工程与科学;2009年12期
7 闫蓉;张蕾;;一种新的汉语词义消歧方法[J];计算机技术与发展;2006年03期
8 周新媛;凌云;杜洁;;对《知网》的补充以及类词典的建立[J];微计算机信息;2007年33期
9 张明宝;马静;;一种基于知网的中文词义消歧算法[J];计算机技术与发展;2009年02期
10 刘建舟;刘晓华;;主观题自动批改技术的研究[J];湖北工业大学学报;2006年04期
中国重要会议论文全文数据库 前10条
1 余晓峰;刘鹏远;赵铁军;;一种基于《知网》的汉语词语词义消歧方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 王智超;季铎;蔡东风;张桂平;;文本聚类中基于知网的特征抽取方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 白宇;蔡东风;赵环宇;季铎;;基于语义计算的中文相似问句抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 王红玲;吕强;徐瑞;;一种基于知网的中文语义相关度计算模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
9 邓宾;余正涛;韩露;车文刚;郭剑毅;;基于信息增益改进贝叶斯词义消歧模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前10条
1 记者 陈磊;中国知网率先推出优先数字出版[N];科技日报;2010年
2 见习记者 廖小珊;中国知网推出优先数字出版 读者可多种数字渠道获取[N];中国新闻出版报;2010年
3 本报记者 杨杨;投资、创业两不误:李童的“新孩子”恒知网[N];21世纪经济报道;2011年
4 记者 王秀萍;“中国知网”集约化印刷华北基地在并建成[N];山西经济日报;2010年
5 程晓龙;中国知网联姻施普林格[N];中国新闻出版报;2008年
6 陈;思科用无线感知网络[N];中国计算机报;2003年
7 李大庆;中国知网与施普林格全面合作[N];科技日报;2008年
8 路华;中华行知网(www.sotrip.com)文化与旅游的契合[N];中国旅游报;2000年
9 高向东;千家数字图书馆对接“中国知网”数字出版平台[N];山西日报;2007年
10 计亚男;中国知网数据库携手施普林格[N];光明日报;2008年
中国博士学位论文全文数据库 前10条
1 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
2 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
3 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
4 王菁华;文本中知识的获取[D];北京邮电大学;2008年
5 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
6 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
7 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
8 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
9 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
10 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
2 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
3 詹靓雯;基于知网的中文词义消歧研究[D];中国计量学院;2012年
4 徐赟;基于知网和贝叶斯模型的词义消岐技术的研究[D];南京理工大学;2010年
5 王萌;基于概念向量空间模型的中文自动文摘研究[D];华中师范大学;2005年
6 许超;汉英双语网页资源中相同事件文本对的提取[D];南京师范大学;2005年
7 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
8 张静静;基于知网文本相似度的文摘自动评测方法研究[D];中国石油大学;2011年
9 尹本雄;中文搜索引擎中的文档特征提取研究[D];广西师范大学;2004年
10 柴晓丽;自动文摘技术的研究与应用[D];长春理工大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026