收藏本站
《北京邮电大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义相似度的汉语未登录动词语义框架识别

罗思明  
【摘要】: 在自然语言处理领域中,语义角色标注是获取语义信息的一种重要手段。汉语语义角色标注一般可采用有监督方法、无监督方法以及半监督方法。由于缺乏大规模的手工标注语料,因此我们采用半监督方法建立语义角色标注系统。对于半监督方法,目前存在的一个严重的问题是数据稀疏问题。我们的语义角色标注系统采用的半监督方法主要依赖于一个动词语义框架词典和一个名词分类词典,它们均存在着数据稀疏问题。其中,动词语义框架词典对于语义角色标注起着重要作用,本论文的研究内容为解决语义角色标注系统的数据稀疏问题,其中,主要解决关于动词语义框架词典的数据稀疏问题,即未登录动词的语义框架识别问题。 动词语义框架识别在半监督语义角色标注方法中是一个关键的步骤,本文提出了一种基于语义相似度的未登录动词语义框架识别方法。本方法首先计算未登录动词与已登录动词的语义相似度,确定未登录动词的候选语义框架,然后通过将候选语义框架与未登录动词所在句子的论元框架进行匹配,得到未登录动词的语义框架。在本论文中,我们尝试采用两种相似度计算方法来进行实验,以得出最有效的相似度计算方法,来提高未登录动词语义框架识别的效果。这两种方法分别是基于《同义词词林》和《知网》的语义相似度计算方法。通过实验表明,语义角色标注在增加了未登录动词语义框架识别后,基于《同义词词林》的方法使得原有语义角色标注系统的对未登录动词对应句子的标注正确率由72%提高到76%。基于《知网》的方法使得标注正确率由72%提高到81%。其中的部分方法也可使用到名词词典的稀疏问题解决。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
2 夏天;;汉语词语语义相似度计算研究[J];计算机工程;2007年06期
3 左云存;宗成庆;;基于语义分类树的汉语口语理解方法[J];中文信息学报;2006年02期
中国博士学位论文全文数据库 前1条
1 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
4 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
5 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
6 王斌;;基于聚类的决策树在玉米种质筛选中的应用[J];安徽农业科学;2011年33期
7 王跃飞;学术期刊编辑的信息能力及其功能[J];安徽工业大学学报(社会科学版);2005年02期
8 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
9 覃爱明,胡昌振,谭惠民;网络攻击检测中的机器学习方法综述[J];安全与环境学报;2001年01期
10 左吉峰;乔均俭;;ID3算法的合理性证明及实验分析[J];保定学院学报;2008年04期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
3 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
4 加米拉·吾守尔;瓦依提·阿布力孜;吐尔根·依布拉音;;《现代维吾尔语语法信息词典》数据库建设的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 田亮;黄辉;周沁;;面向短语的词语对齐方法[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
7 郭燕慧;王枞;钟义信;;语言认知与主题内容识别[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
8 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
9 徐海;;英、汉分类词典编纂刍议[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
10 李小君;潘丽君;;信息获取过程及转化质量研究[A];第十届中国科协年会论文集(一)[C];2008年
中国博士学位论文全文数据库 前10条
1 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
2 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
3 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
4 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
5 眭新光;文本信息隐藏及分析技术研究[D];解放军信息工程大学;2007年
6 连莉;本体中非分类关系的理论体系研究[D];山东大学;2010年
7 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
8 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
9 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年
10 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
2 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
3 程国斌;基于指示词语义扩展的词义识别方法的研究[D];哈尔滨工程大学;2010年
4 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
5 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
6 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年
7 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
8 秦园;基于SPOT5的土地信息提取技术研究[D];大连理工大学;2010年
9 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
10 张瑶;英汉机器翻译中的英语动词汉译研究[D];大连理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前7条
1 夏天,樊孝忠,刘林,骆正华;基于ALICE的汉语自然语言接口[J];北京理工大学学报;2004年10期
2 刘亚军,徐易;一种基于加权语义相似度模型的自动问答系统[J];东南大学学报(自然科学版);2004年05期
3 钟义信;知行学引论——信息 知识 智能的统一理论[J];中国工程科学;2004年06期
4 解国栋,宗成庆,徐波;面向中间语义表示格式的汉语口语解析方法[J];中文信息学报;2003年01期
5 李有梅;基于词义的关键词抽取方法研究[J];情报理论与实践;2000年02期
6 王斌,刘群,张祥;汉英双语库自动分段对齐研究[J];软件学报;2000年11期
7 朱毅华,侯汉清,沙印亭;计算机识别汉语同义词的两种算法比较和测评[J];中国图书馆学报;2002年04期
中国重要会议论文全文数据库 前1条
1 陈俊燕;王作英;;口语对话系统中一种稳健的语言理解算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
【相似文献】
中国期刊全文数据库 前10条
1 聂卉;龙朝晖;;结合语义相似度与相关度的概念扩展[J];情报学报;2007年05期
2 王惠敏;聂规划;付魁;;领域本体中基于多维特征的语义相似度算法研究[J];情报杂志;2008年10期
3 申改英;李建华;;基于语义的Web服务自动组合算法[J];计算机工程;2009年16期
4 黄宏斌;刘志忠;张维明;邓苏;马丽丽;;基于层次本体模型(HOM)的语义相似度计算方法[J];系统工程与电子技术;2009年07期
5 吴飞珍;马文丽;王旺迪;陈启龙;郑文岭;;一种新的基因注释语义相似度计算方法[J];生物信息学;2010年01期
6 骆正华,樊孝忠,夏天;基于结构化问句实例的自动问答系统[J];微电子学与计算机;2005年07期
7 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
8 徐德智;C.Onyango;王怀民;;上位本体中语义相似度的计算及其实现[J];计算技术与自动化;2007年02期
9 张晓孪;王西锋;;FCA中的概念语义相似度计算[J];现代图书情报技术;2007年03期
10 路松峰;冯玲;刘芳;胡和平;;SSW:一种语义相关的P2P网络资源检索机制[J];小型微型计算机系统;2008年08期
中国重要会议论文全文数据库 前10条
1 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
3 刘晓平;沈冠町;;协同讨论观点影响度分析方法及其应用[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
4 车万翔;刘挺;李生;;语义角色标注的方法与挑战[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 冯娟娟;李晗静;李生;;基于句法分析的中文语义角色标注实现[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 车万翔;刘挺;李生;;自动浅层语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 汪红林;丁金涛;王红玲;周国栋;;基于依存关系的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 刘立;余正涛;王蒙;毛存礼;郭剑毅;;结合词相关特征与流行学习的中文问句分类[A];第六届全国信息检索学术会议论文集[C];2010年
9 车万翔;刘挺;李生;;浅层语义分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 刘寒磊;关毅;徐永东;;多文档文摘中基于语义相似度的最大边缘相关技术研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
2 车万翔;基于核方法的语义角色标注研究[D];哈尔滨工业大学;2008年
3 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年
4 周子力;基于WordNet的本体构建及其在安全领域应用关键技术研究[D];华东师范大学;2009年
5 潘建国;基于语义的用户建模技术与应用研究[D];上海大学;2009年
6 胡晓;支持机械产品概念设计的功能知识聚类方法研究[D];上海交通大学;2011年
7 李宏伟;基于Ontology的地理信息服务研究[D];解放军信息工程大学;2007年
8 魏军英;基于WEB服务的中小企业制造资源共享关键技术研究[D];山东科技大学;2011年
9 杨峰;本体映射关键技术研究[D];吉林大学;2011年
10 刘春辰;基于本体的企业搜索优化技术研究[D];吉林大学;2012年
中国硕士学位论文全文数据库 前10条
1 罗思明;基于语义相似度的汉语未登录动词语义框架识别[D];北京邮电大学;2008年
2 张祎挺;语义角色标注及其在句子相似度计算上的应用[D];北京邮电大学;2008年
3 郑丽萍;本体映射的研究[D];山东科技大学;2005年
4 张红宇;数据集成中本体映射的研究[D];中南大学;2005年
5 常晓环;基于概念图的语义检索方法研究[D];吉林大学;2009年
6 任波;基于语义的Web服务发现研究[D];浙江工业大学;2005年
7 秦鹏;基于WordNet的本体匹配关键技术研究与实现[D];华东师范大学;2010年
8 郭嘉琦;领域本体的构建及其在信息检索中的应用研究[D];北京邮电大学;2007年
9 陈爱明;本体复合映射发现技术研究[D];中南大学;2008年
10 赵大明;基于本体的专业搜索引擎的研究与设计[D];西北大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026