收藏本站
《哈尔滨工业大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于核方法的语义角色标注研究

车万翔  
【摘要】: 全自动的语义分析一直是自然语言理解的主要任务之一。通过深层语义分析,可以将自然语言转化为形式语言,从而使计算机能够与人类无障碍的沟通。为达此目的,人们已经进行了多年的努力,然而由于这一问题过于复杂,目前取得的效果并不理想。浅层语义分析是对深层语义分析的一种简化,它只标注与句子中谓词有关的成分的语义角色,如施事、受事、时间和地点等。其能够对问答系统、信息抽取和机器翻译等应用产生推动作用。语义角色标注是浅层语义分析的一种实现方式,具有定义清晰,便于评价的优点,近年来受到越来越多学者的关注。 目前主流的语义角色标注研究集中于使用各种统计机器学习技术,利用多种语言学特征,进行语义角色的识别和分类。近年的研究表明,影响语义角色标注系统性能的首要因素并非机器学习模型,而是使用的特征。因此,若想提高系统的性能,细致的特征工程工作是必不可少的。然而,随着越来越多特征的加入,特征之间的相互影响越来越严重,使得系统性能增长的趋势逐渐趋缓,并达到一个上限。为此必须寻找新的方法以解决这一问题。 基于核的方法通过对已有特征进行组合或者分解,将低维特征空间映射到高维特征空间,从而将在低维空间不容易区分的问题在高维空间加以解决,是一种可行的解决方案。 本文正是利用核方法这一优点,将其应用于语义角色标注这一问题中。除了使用已有的核方法外,还提出了多种新的核方法。 首先,我们构造了一个语义角色标注基线系统,该系统使用特征向量表示待分类对象,并在特征向量之上,使用基于多项式核的方法,自动的对特征进行组合。实验结果表明,当使用二次多项式核对特征进行两两组合时,该系统是目前已知的最好的基于单句法分析器的语义角色标注系统之一。 接着,我们针对基线系统中,特征向量很难恰当的表示结构化的特征这一问题,使用了卷积树核自动将较大的结构特征进行分解,并能够在多项式时间内进行核函数的计算。然而,通常的卷积树核混淆了语义角色标注中不同的特征,因此,我们提出了混合卷积树核融合多种树核,来对不同种类的特征分别进行建模,最终获得优于标准卷积树核的性能。然后将混合卷积树核与二次多项式核进行融合,得到的复合核取得了比单独使用两种核都好的结果。 但是,标准卷积树核要求两棵子树之间必须是精确匹配的,而不考虑结构相似,语义角色相同的情况。因此,我们提出了新的句法驱动卷积树核,在核函数的设计过程中,融入了语言学知识,容许结构和节点的近似匹配,最终取得了较标准卷积树更好的性能。最后同样与多项式核进行融合,并取得了更好的性能。 最后,我们使用基于核的方法,实现了一个目前最好的中文语义角色标注系统。主要贡献在于提出了更适用于中文的新特征,同时首次将核方法应用于中文语义角色标注中,得到了与英文相同的性能趋势,从而也证明了我们提出的核方法的有效性。
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP391.1

手机知网App
【引证文献】
中国期刊全文数据库 前4条
1 朱译翔;;中文名词性谓词的语义角色标注的研究[J];福建电脑;2010年09期
2 吴方磊;李军辉;朱巧明;李培峰;;基于树核函数的中文语义角色分类研究[J];中文信息学报;2011年03期
3 吴方磊;李军辉;朱巧明;李培峰;;中文语义角色标注的树核空间研究[J];计算机应用与软件;2012年03期
4 路青;崔新春;胡艳波;;基于文献计量的国内语义角色标注研究现状分析[J];情报杂志;2012年04期
中国博士学位论文全文数据库 前2条
1 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
2 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前8条
1 白雪;基于结构学习的语义角色标注[D];北京邮电大学;2010年
2 陈鑫;基于主动学习的汉语依存树库构建[D];哈尔滨工业大学;2011年
3 郑培祥;语义角色标注的集成策略的研究[D];北京化工大学;2011年
4 鞠久朋;评价对象抽取研究[D];苏州大学;2011年
5 吴方磊;基于树核方法的中文语义角色标注研究[D];苏州大学;2011年
6 朱译翔;中文名词性谓词的语义角色标注研究[D];苏州大学;2011年
7 徐靖;基于特征的中文名词性谓词语义角色标注研究[D];苏州大学;2011年
8 路青;基于特征选择的中文语义角色标注研究[D];曲阜师范大学;2012年
【参考文献】
中国期刊全文数据库 前4条
1 丁金涛;周国栋;王红玲;朱巧明;;语义角色标注中有效的识别论元算法研究[J];计算机工程与应用;2008年18期
2 于江德;樊孝忠;庞文博;;事件信息抽取中语义角色标注研究[J];计算机科学;2008年03期
3 陈耀东;王挺;陈火旺;;半监督学习和主动学习相结合的浅层语义分析[J];中文信息学报;2008年02期
4 袁毓林;;论元角色的层级关系和语义特征[J];世界汉语教学;2002年03期
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
4 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
5 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
6 覃爱明,胡昌振,谭惠民;网络攻击检测中的机器学习方法综述[J];安全与环境学报;2001年01期
7 左吉峰;乔均俭;;ID3算法的合理性证明及实验分析[J];保定学院学报;2008年04期
8 王晓红,高洪深;数据挖掘技术在大型超市中的应用研究[J];北方工业大学学报;2003年03期
9 黄泽宇,卢润彩;急切式和懒惰式学习策略相结合的决策树分类模型[J];北京交通大学学报;2005年05期
10 汪廷华;田盛丰;黄厚宽;廖年冬;;样本属性重要度的支持向量机方法[J];北京交通大学学报;2007年05期
中国重要会议论文全文数据库 前10条
1 李胜朋;王洪礼;冯剑丰;;基于不连续回归树的最大李雅谱诺夫指数计算方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
2 ;A Road Detection Algorithm Based on EF-boosting[A];第七届国际测试技术研讨会论文集[C];2007年
3 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
4 Youn-Kyung Jang;Byeong-Seob You;Ho-Seok Kim;Kyoung-Bae Kim;Hae-Young Bae;;A spatial entropy reflecting distribution of spatial objects[A];Proceedings of 5th Asian Symposium on Geographic Information System from Computer Science & Engineering View[C];2007年
5 邹志强;何中市;冷崇钦;;一种最大化分类间隔的感知器训练算法[A];2008年计算机应用技术交流会论文集[C];2008年
6 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
7 叶中行;陆青;余敏杰;;计算智能在银行信贷信用分类中的应用[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
8 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
9 吴增红;陈毓芬;;融合概率与时序特征的ACVis情境模型匹配方法模型[A];信息工程大学测绘学院第五届博士生学术论坛论文集[C];2010年
10 张佳宝;周斌;吴泉源;;基于Hadoop的并行化命名实体识别技术研究与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
3 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
4 汪澎;驾驶人警觉状态检测技术研究[D];江苏大学;2010年
5 刘建明;古代壁画图像保护与智能修复技术研究[D];浙江大学;2010年
6 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
7 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年
8 杨国鹏;基于机器学习方法的高光谱影像分类研究[D];解放军信息工程大学;2010年
9 殷慧;基于局部特征表达的高分辨率SAR图像城区场景分类方法研究[D];武汉大学;2010年
10 徐迪红;复杂背景下的交通标志检测和分类算法研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
3 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
4 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
5 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
6 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
7 秦园;基于SPOT5的土地信息提取技术研究[D];大连理工大学;2010年
8 李红;数据挖掘中特征选择与聚类算法研究[D];大连理工大学;2010年
9 朱新荣;径向基函数神经网络集成算法的研究及应用[D];大连理工大学;2010年
10 严康;基于支持向量机的特征选择算法研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
2 刘挺;马金山;;汉语自动句法分析的理论与方法[J];当代语言学;2009年02期
3 于江德;樊孝忠;庞文博;余正涛;;基于条件随机场的语义角色标注(英文)[J];Journal of Southeast University(English Edition);2007年03期
4 吕德新;张桂平;蔡东风;朱江涛;;基于SVM的疑问句问点语义角色标注[J];沈阳航空工业学院学报;2006年01期
5 孙建涛 ,郭崇慧 ,陆玉昌 ,石纯一;多项式核支持向量机文本分类器泛化性能分析[J];计算机研究与发展;2004年08期
6 丁金涛;周国栋;王红玲;朱巧明;;语义角色标注中有效的识别论元算法研究[J];计算机工程与应用;2008年18期
7 陈锐;张蕾;胡艳华;;基于语义的信息检索模型[J];计算机工程与应用;2009年26期
8 鞠久朋;王红玲;周国栋;;依存关系语义角色标注研究[J];计算机工程与应用;2010年14期
9 孟遥;李生;赵铁军;杨沐昀;;基于统计的句法分析技术综述[J];计算机科学;2003年09期
10 覃刚力;黄科;杨家本;;基于主动学习的文档分类[J];计算机科学;2003年10期
中国博士学位论文全文数据库 前4条
1 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
2 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年
3 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
4 李济洪;汉语框架语义角色的自动标注技术研究[D];山西大学;2010年
中国硕士学位论文全文数据库 前10条
1 王丽杰;汉语语义依存分析研究[D];哈尔滨工业大学;2010年
2 谭伟;面向网络的中文问答系统相关技术的研究与系统初步实现[D];清华大学;2005年
3 廖先桃;中文命名实体识别方法研究[D];哈尔滨工业大学;2006年
4 陈霄;基于支持向量机的中文组织机构名识别[D];上海交通大学;2007年
5 陈丽江;汉语真实文本的语义角色标注[D];南京师范大学;2007年
6 张晓孪;中文问答系统中问题理解与信息检索的研究与实现[D];西北大学;2007年
7 丁金涛;基于特征向量的语义角色标注研究[D];苏州大学;2008年
8 蔡洁;中文子句语义角色标注系统实现研究[D];北京邮电大学;2008年
9 安强强;基于语义角色标注的中文问答系统研究[D];西北大学;2009年
10 高玲玲;基于依存语法的汉语句法分析研究[D];中国海洋大学;2009年
【二级引证文献】
中国博士学位论文全文数据库 前1条
1 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前2条
1 吴方磊;基于树核方法的中文语义角色标注研究[D];苏州大学;2011年
2 朱译翔;中文名词性谓词的语义角色标注研究[D];苏州大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 杨成凯;;Fillmore的格语法理论(上)[J];国外语言学;1986年01期
2 顾阳;论元结构理论介绍[J];国外语言学;1994年01期
3 程工;评《题元原型角色与论元选择》[J];国外语言学;1995年03期
4 韩万衡;德国配价论主要学派在基本问题上的观点和分歧[J];国外语言学;1997年03期
5 鲁川,林杏光;现代汉语语法的格关系[J];汉语学习;1989年05期
6 张健沛,徐华;支持向量机(SVM)主动学习方法研究与应用[J];计算机应用;2004年01期
7 刘挺;车万翔;李生;;基于最大熵分类器的语义角色标注[J];软件学报;2007年03期
8 袁毓林;;论元角色的层级关系和语义特征[J];世界汉语教学;2002年03期
9 李洁;德语配价理论的发展及成就[J];外语教学与研究;1987年01期
10 陈平;;试论汉语中三种句子成分与语义成分的配位原则[J];中国语文;1994年03期
【相似文献】
中国期刊全文数据库 前10条
1 王红玲;袁晓虹;王步康;周国栋;;依存关系上的中文名词性谓词识别研究[J];计算机工程与应用;2011年20期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 车万翔;刘挺;李生;;语义角色标注的方法与挑战[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 冯娟娟;李晗静;李生;;基于句法分析的中文语义角色标注实现[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 车万翔;刘挺;李生;;自动浅层语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 汪红林;丁金涛;王红玲;周国栋;;基于依存关系的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 车万翔;刘挺;李生;;浅层语义分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 刘娜;王小捷;;两类中文特殊句式的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
7 郝志新;王轩;李露;范士喜;;基于句法依存关系的语义角色标注[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 袁晓虹;王步康;王红玲;周国栋;;基于依存关系的中文谓词标注研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 王步康;王红玲;袁晓虹;周国栋;;基于依存句法分析的中文语义角色标注[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 毕玉德;陈洁;吕春燕;;朝鲜语句子语义角色标注研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前2条
1 车万翔;基于核方法的语义角色标注研究[D];哈尔滨工业大学;2008年
2 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年
中国硕士学位论文全文数据库 前10条
1 赵纪元;面向文景转换的中文语义角色标注研究[D];哈尔滨工业大学;2007年
2 汪红林;基于依存分析的语义角色标注研究[D];苏州大学;2009年
3 张祎挺;语义角色标注及其在句子相似度计算上的应用[D];北京邮电大学;2008年
4 蔡洁;中文子句语义角色标注系统实现研究[D];北京邮电大学;2008年
5 罗思明;基于语义相似度的汉语未登录动词语义框架识别[D];北京邮电大学;2008年
6 张国华;汉语框架语义角色自动标注研究[D];山西大学;2008年
7 安强强;基于语义角色标注的中文问答系统研究[D];西北大学;2009年
8 郭文;基于格框架的机器翻译[D];厦门大学;2009年
9 谭伟;面向网络的中文问答系统相关技术的研究与系统初步实现[D];清华大学;2005年
10 陈丽江;汉语真实文本的语义角色标注[D];南京师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026