收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语框架语义角色自动标注研究

张国华  
【摘要】: 随着计算机的出现和发展及其在自然语言处理领域的应用,大幅提高了语言信息的处理速度和质量,由于深层语义理解在目前条件和技术下难以实现,自然语言研究学者开始将注意力集中在简单、实用的任务上,于是“浅层语义分析(Shallow Semantic Parsing)”逐渐被研究人员所重视。语义角色标注则是浅层语义分析的一种可行方案。 二十世纪末C.J.Fillmore提出了框架语义学,它试图形式化描述词在其每个义项下的语义和句法相互作用的配价模式。在此基础上,构建了英语框架网络(FrameNet)。之后许多国家的学者相继研究了本国语言的框架语义,建立了相应的词汇知识库。并研究了计算机辅助自动标注系统。 本文使用由山西大学研制的汉语框架网络知识库作为语料资源通过统计机器学习方法研究了语义角色的自动标注问题。 本文基于条件随机场(CRF,condition random fields)模型,研究框架语义角色的自动标注模型。该模型以词作为标注的基本单元,通过BIO策略,把语义角色标注问题转化为序列符号的分类问题,用CRF模型对句子中目标词的语义角色同时进行边界识别和分类。我们通过选择词、词性、位置、基本短语块、功能块等特征,对不同特征模板的实验结果进行比较,得到了一组最优的特征模板。在完成语义角色标注的基础上,对框架语义的三层标记中的的短语类型和句法功能再进行建模、以及训练和测试。最终实现,框架语义的三层标记的自动标注。本文中最重要的工作就是对给定的框架,给定的目标词,如何选取一组好的特征,使得选取的特征模板有较好的泛化能力。 本文使用准确率P,召回率R和F_(β=1)作为评价标准。对不同的框架分别以F_(β=1)为主要指标得到该框架的最佳特征模板,但其方法具有一般性,适用于其他框架的自动标注。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 于江德;樊孝忠;庞文博;;事件信息抽取中语义角色标注研究[J];计算机科学;2008年03期
2 沈勤中;周国栋;朱巧明;孔芳;丁金涛;;基于字位置概率特征的条件随机场中文分词方法[J];苏州大学学报(自然科学版);2008年03期
3 李建平;王慧强;卢爱平;郝洪亮;冯光升;;基于条件随机场的网络安全态势量化感知方法[J];传感器与微系统;2010年10期
4 王靖;徐向阳;符蓉;;一种优化的用于中文分词的CRF机器学习模型[J];微计算机信息;2010年12期
5 葛金虎;;基于条件随机场的中文命名实体识别的研究[J];科技信息;2010年16期
6 谷川;田喜平;;基于条件随机场的汉语词性标注方法研究[J];安阳师范学院学报;2010年05期
7 葛文英;吕靖;;基于条件随机场的中文人名识别[J];安阳师范学院学报;2010年05期
8 朱丹浩;王东波;谢靖;;基于条件随机场的介宾结构自动识别[J];现代图书情报技术;2010年Z1期
9 邓箴;;基于二维关联边条件随机场的Web信息抽取[J];价值工程;2010年34期
10 赵玉芹;刘琳;;条件随机场在手势识别中的应用研究[J];科技传播;2011年18期
11 刘海鹏;王小捷;;基于条件随机场和知识库的手机短信命名实体识别[J];广西师范大学学报(自然科学版);2009年01期
12 钱小飞;;最长名词短语识别研究[J];现代语文(语言研究版);2009年07期
13 张朝胜;郭剑毅;线岩团;余正涛;雷春雅;王海雄;;基于条件随机场的英文产品命名实体识别[J];计算机工程与科学;2010年06期
14 迟呈英;于长远;战学刚;;基于条件随机场的中文分词方法[J];情报杂志;2008年05期
15 章成志;苏新宁;;基于条件随机场的自动标引模型研究[J];中国图书馆学报;2008年05期
16 王凡秀;王自强;;汉语自动分词技术研究[J];计算机与数字工程;2008年11期
17 许晓丽;卢志茂;张格森;;基于条件随机场的中文命名实体识别研究[J];中国新技术新产品;2009年02期
18 阴晋岭;王惠临;;词性标注的方法研究——结合条件随机场和基于转换学习的方法进行词性标注[J];现代图书情报技术;2009年03期
19 贾美英;杨炳儒;郑德权;杨靖;;采用CRF技术的军事情报术语自动抽取研究[J];计算机工程与应用;2009年32期
20 王明军;周俊;屠珺;刘成良;;基于条件随机场的大范围地形感知框架[J];机器人;2010年03期
中国重要会议论文全文数据库 前10条
1 董静;孙乐;吕元华;冯元勇;;基于线性链条件随机场模型的语义角色标注[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 李丽;冯志伟;;框架网络的理解和构建[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 代翠;周俏丽;蔡东风;;统计和规则相结合的汉语最长名词短语自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 车万翔;刘挺;李生;;语义角色标注的方法与挑战[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 冯娟娟;李晗静;李生;;基于句法分析的中文语义角色标注实现[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 车万翔;刘挺;李生;;浅层语义分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 车万翔;刘挺;李生;;自动浅层语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 刘娜;王小捷;;两类中文特殊句式的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 汪红林;丁金涛;王红玲;周国栋;;基于依存关系的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 车万翔;基于核方法的语义角色标注研究[D];哈尔滨工业大学;2008年
2 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年
3 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
4 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
5 禇一平;基于条件随机场模型的视频目标分割算法研究[D];浙江大学;2007年
6 许红涛;Web图像语义分析与自动标注研究[D];复旦大学;2009年
7 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
8 张奇;细颗粒度情感倾向分析若干关键问题研究[D];复旦大学;2008年
9 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
10 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
中国硕士学位论文全文数据库 前10条
1 张国华;汉语框架语义角色自动标注研究[D];山西大学;2008年
2 李晓丹;基于框架网络的英汉事件框架动词对比分析[D];东北师范大学;2011年
3 董文清;基于框架网络本体的语义检索模型[D];山西大学;2010年
4 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
5 柴桦;基于视频的人体运动识别方法研究[D];中南大学;2008年
6 郑勇;框架网络本体下的智能推理引擎探讨[D];山西大学;2011年
7 赵纪元;面向文景转换的中文语义角色标注研究[D];哈尔滨工业大学;2007年
8 汪红林;基于依存分析的语义角色标注研究[D];苏州大学;2009年
9 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
10 张祎挺;语义角色标注及其在句子相似度计算上的应用[D];北京邮电大学;2008年
中国重要报纸全文数据库 前10条
1 记者 严钰;分众传媒暗藏风险[N];民营经济报;2006年
2 本报记者 饶洪斌 通讯员 刘工;打造魅力城市[N];咸宁日报;2006年
3 张伟 本报记者 李晓辉;神奇的变迁[N];锦州日报;2008年
4 李亚馨;好耶去年收入5亿元左右分众2.25亿美元购入[N];第一财经日报;2007年
5 张飞 孙克勤 刘东升;东明新农村建设给农民带来实惠多多[N];菏泽日报;2006年
6 本报记者  陆琼琼;分众传媒首季盈利940万美元[N];上海证券报;2006年
7 本报特约记者  张韬;分众传媒三季度盈利增长近3倍[N];上海证券报;2006年
8 江建国 占帮祥;婺源构筑交通新网络[N];江西日报;2003年
9 记者 郭立翔 通讯员 崔志强;年底前,伊滨区基本织就主次干道网[N];洛阳日报;2011年
10 戚岳雷;浅析施工项目现场管理[N];建筑时报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978