收藏本站
《山西大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语框架语义角色自动标注研究

张国华  
【摘要】: 随着计算机的出现和发展及其在自然语言处理领域的应用,大幅提高了语言信息的处理速度和质量,由于深层语义理解在目前条件和技术下难以实现,自然语言研究学者开始将注意力集中在简单、实用的任务上,于是“浅层语义分析(Shallow Semantic Parsing)”逐渐被研究人员所重视。语义角色标注则是浅层语义分析的一种可行方案。 二十世纪末C.J.Fillmore提出了框架语义学,它试图形式化描述词在其每个义项下的语义和句法相互作用的配价模式。在此基础上,构建了英语框架网络(FrameNet)。之后许多国家的学者相继研究了本国语言的框架语义,建立了相应的词汇知识库。并研究了计算机辅助自动标注系统。 本文使用由山西大学研制的汉语框架网络知识库作为语料资源通过统计机器学习方法研究了语义角色的自动标注问题。 本文基于条件随机场(CRF,condition random fields)模型,研究框架语义角色的自动标注模型。该模型以词作为标注的基本单元,通过BIO策略,把语义角色标注问题转化为序列符号的分类问题,用CRF模型对句子中目标词的语义角色同时进行边界识别和分类。我们通过选择词、词性、位置、基本短语块、功能块等特征,对不同特征模板的实验结果进行比较,得到了一组最优的特征模板。在完成语义角色标注的基础上,对框架语义的三层标记中的的短语类型和句法功能再进行建模、以及训练和测试。最终实现,框架语义的三层标记的自动标注。本文中最重要的工作就是对给定的框架,给定的目标词,如何选取一组好的特征,使得选取的特征模板有较好的泛化能力。 本文使用准确率P,召回率R和F_(β=1)作为评价标准。对不同的框架分别以F_(β=1)为主要指标得到该框架的最佳特征模板,但其方法具有一般性,适用于其他框架的自动标注。
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 周强;;汉语基本块描述体系[J];中文信息学报;2007年03期
【共引文献】
中国期刊全文数据库 前10条
1 罗森林;刘盈盈;冯扬;韩磊;陈功;王倩;;BFS-CTC汉语句义结构标注语料库构建方法[J];北京理工大学学报;2012年03期
2 于江德;樊孝忠;庞文博;余正涛;;基于条件随机场的语义角色标注(英文)[J];Journal of Southeast University(English Edition);2007年03期
3 孟庆鑫;;XML文件搜索引擎结合语义关联空间的系统设计与实现[J];电子技术;2011年03期
4 陈耀东;王挺;陈火旺;;浅层语义分析研究[J];计算机研究与发展;2008年S1期
5 李国臣;王瑞波;李济洪;;基于条件随机场模型的汉语功能块自动标注[J];计算机研究与发展;2010年02期
6 尹晓丽;;通用语义角色自动标注研究[J];长春工业大学学报(自然科学版);2012年02期
7 丁金涛;周国栋;王红玲;朱巧明;;语义角色标注中有效的识别论元算法研究[J];计算机工程与应用;2008年18期
8 陈丽江;陈小荷;;统计和规则结合识别动词的跨分句论元[J];计算机工程与应用;2009年16期
9 于江德;樊孝忠;庞文博;;事件信息抽取中语义角色标注研究[J];计算机科学;2008年03期
10 丁金涛;王红玲;周国栋;朱巧明;钱培德;;语义角色标注中特征优化组合研究[J];计算机应用与软件;2009年05期
中国重要会议论文全文数据库 前10条
1 邱晗;周强;;自动获取大规模的汉语紧密组合词汇关联对[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
2 邱晗;周强;;自动获取大规模的汉语紧密组合词汇关联对[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
3 车万翔;刘挺;李生;;浅层语义分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 刘怀军;车万翔;刘挺;;中文语义角色标注的特征工程[A];第三届学生计算语言学研讨会论文集[C];2006年
5 车万翔;刘挺;李生;;自动浅层语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 周国栋;李军辉;钱龙华;朱巧明;;基于结构化句法信息的自然语言处理技术研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 车万翔;刘挺;李生;;语义角色标注的方法与挑战[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 李国臣;王瑞波;李济洪;;基于基本块的汉语功能块自动标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 刘娜;王小捷;;两类中文特殊句式的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前7条
1 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
2 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
3 车万翔;基于核方法的语义角色标注研究[D];哈尔滨工业大学;2008年
4 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年
5 孔芳;指代消解关键问题研究[D];苏州大学;2009年
6 刘荣;面向教育领域的固定短语提取方法研究[D];北京语言大学;2009年
7 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
中国硕士学位论文全文数据库 前10条
1 卢德平;大型水轮发电机推力轴承油槽内流场分析和结构优化[D];哈尔滨工业大学;2010年
2 王呈艳;基于规则抽取的汉语语块识别[D];河北大学;2011年
3 王文学;基于联合方法的中文语义角色标注研究[D];上海交通大学;2012年
4 郑培祥;语义角色标注的集成策略的研究[D];北京化工大学;2011年
5 刘跃红;问句依存句法及语义分析研究[D];昆明理工大学;2011年
6 刘海霞;汉语功能块的自动识别研究[D];大连理工大学;2011年
7 高亚慧;汉语框架自动识别中的歧义消解[D];山西大学;2011年
8 吴方磊;基于树核方法的中文语义角色标注研究[D];苏州大学;2011年
9 孙景广;基于网络的自动问答系统的答案抽取方法研究[D];沈阳航空工业学院;2007年
10 吕德新;中文自动问答系统中问题理解技术的研究[D];沈阳航空工业学院;2006年
【二级参考文献】
中国期刊全文数据库 前3条
1 张昱琪,周强;汉语基本短语的自动识别[J];中文信息学报;2002年06期
2 周强;汉语句法树库标注体系[J];中文信息学报;2004年04期
3 董振东;语义关系的表达和知识系统的建造[J];语言文字应用;1998年03期
【相似文献】
中国期刊全文数据库 前10条
1 于江德;樊孝忠;庞文博;;事件信息抽取中语义角色标注研究[J];计算机科学;2008年03期
2 沈勤中;周国栋;朱巧明;孔芳;丁金涛;;基于字位置概率特征的条件随机场中文分词方法[J];苏州大学学报(自然科学版);2008年03期
3 李建平;王慧强;卢爱平;郝洪亮;冯光升;;基于条件随机场的网络安全态势量化感知方法[J];传感器与微系统;2010年10期
4 王靖;徐向阳;符蓉;;一种优化的用于中文分词的CRF机器学习模型[J];微计算机信息;2010年12期
5 葛金虎;;基于条件随机场的中文命名实体识别的研究[J];科技信息;2010年16期
6 谷川;田喜平;;基于条件随机场的汉语词性标注方法研究[J];安阳师范学院学报;2010年05期
7 葛文英;吕靖;;基于条件随机场的中文人名识别[J];安阳师范学院学报;2010年05期
8 朱丹浩;王东波;谢靖;;基于条件随机场的介宾结构自动识别[J];现代图书情报技术;2010年Z1期
9 邓箴;;基于二维关联边条件随机场的Web信息抽取[J];价值工程;2010年34期
10 赵玉芹;刘琳;;条件随机场在手势识别中的应用研究[J];科技传播;2011年18期
中国重要会议论文全文数据库 前10条
1 董静;孙乐;吕元华;冯元勇;;基于线性链条件随机场模型的语义角色标注[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 李丽;冯志伟;;框架网络的理解和构建[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 代翠;周俏丽;蔡东风;;统计和规则相结合的汉语最长名词短语自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 车万翔;刘挺;李生;;语义角色标注的方法与挑战[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 冯娟娟;李晗静;李生;;基于句法分析的中文语义角色标注实现[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 车万翔;刘挺;李生;;浅层语义分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 车万翔;刘挺;李生;;自动浅层语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 刘娜;王小捷;;两类中文特殊句式的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 汪红林;丁金涛;王红玲;周国栋;;基于依存关系的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 记者 严钰;分众传媒暗藏风险[N];民营经济报;2006年
2 本报记者 饶洪斌 通讯员 刘工;打造魅力城市[N];咸宁日报;2006年
3 张伟 本报记者 李晓辉;神奇的变迁[N];锦州日报;2008年
4 李亚馨;好耶去年收入5亿元左右分众2.25亿美元购入[N];第一财经日报;2007年
5 张飞 孙克勤 刘东升;东明新农村建设给农民带来实惠多多[N];菏泽日报;2006年
6 本报记者  陆琼琼;分众传媒首季盈利940万美元[N];上海证券报;2006年
7 本报特约记者  张韬;分众传媒三季度盈利增长近3倍[N];上海证券报;2006年
8 江建国 占帮祥;婺源构筑交通新网络[N];江西日报;2003年
9 记者 郭立翔 通讯员 崔志强;年底前,伊滨区基本织就主次干道网[N];洛阳日报;2011年
10 戚岳雷;浅析施工项目现场管理[N];建筑时报;2004年
中国博士学位论文全文数据库 前10条
1 车万翔;基于核方法的语义角色标注研究[D];哈尔滨工业大学;2008年
2 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年
3 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
4 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
5 禇一平;基于条件随机场模型的视频目标分割算法研究[D];浙江大学;2007年
6 许红涛;Web图像语义分析与自动标注研究[D];复旦大学;2009年
7 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
8 张奇;细颗粒度情感倾向分析若干关键问题研究[D];复旦大学;2008年
9 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
10 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
中国硕士学位论文全文数据库 前10条
1 张国华;汉语框架语义角色自动标注研究[D];山西大学;2008年
2 李晓丹;基于框架网络的英汉事件框架动词对比分析[D];东北师范大学;2011年
3 董文清;基于框架网络本体的语义检索模型[D];山西大学;2010年
4 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
5 柴桦;基于视频的人体运动识别方法研究[D];中南大学;2008年
6 郑勇;框架网络本体下的智能推理引擎探讨[D];山西大学;2011年
7 赵纪元;面向文景转换的中文语义角色标注研究[D];哈尔滨工业大学;2007年
8 汪红林;基于依存分析的语义角色标注研究[D];苏州大学;2009年
9 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
10 张祎挺;语义角色标注及其在句子相似度计算上的应用[D];北京邮电大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026