收藏本站
《上海交通大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语动词名物化复合结构的语义解释

赵京雷  
【摘要】: 网络信息和信息检索在人们日常生活中已成为不可或缺的组成部分,语言文字占据信息形式上的绝大多数,实际上关注的是语言形式所承载的内容信息,本质上都涉及自然语言的语义概念。自然语言成分结构间的语义关系计算问题是自然语言理解的关键,其本质在于计算语言结构与语言语义之间的对应关系。如何寻找新的思路及其理论和方法,使得语言的结构和语义尽量能同构对应,尤其是适应动态地计算语言复合结构的概念意义,具有重要的理论研究意义和广阔的应用前景。尽管语言表达有句、短语等多种形式,但从概念分析角度看都可归结到词汇概念间的组合叠置。这与当前国内外语言学聚焦于词汇理论相一致。 复合结构是一种由若干个名词性词汇直接组合而成,在整体上相当于一个新的名词性词汇的语言结构形式。和短语、句等语言结构不同,复合结构的构成缺乏功能标记,这对其语义计算形成很大障碍,实际上成为语义计算的一个瓶颈问题。本文主要解决汉语中动词名物化进入复合结构时的语义解释问题。研究的起点是从实例分析出发,剖析以往语法研究中的不足,标引复合结构子成分之间的概念关系,归纳复合结构中概念耦合的内在特点以及多语种表达式在复合结构这一层次上存在自然对齐的潜在可能性。首先,作为数据准备工作,研究了动词名物化复合结构的识别;然后,分别构建了两种基本动词名物化复合结构(NV型和VN型)的语义解释模型;最后,还探讨了属性知识在复合结构语义解释中的应用。 具体来讲,本文的创新性工作有以下几点: 一、提出了一种基于主题词表和万维网的复合结构识别方法。为了有效地解决汉语中名词和动词组合时的结构歧义问题,构造了两个新的分类特征集合:词汇复合能力和指称模板特征。特征的获取使用了两个独立的资源:主题词表和万维网,其好处在于不依赖于复合结构出现的具体上下文,可以用于对文档中的低频复合结构进行识别,而这是以往的识别模型所无法解决的问题。机器学习实验表明,两个新特征集极大的改善了动词名物化复合结构识别的性能。 二、归纳了汉语NV型复合结构中涉及的语义关系,构建了一个基于词汇语法模板的复合结构语义解释模型。模型定义了新的词汇模板形式:功能词例化模板,并将其作为分类特征,对复合结构词汇间的语义关系进行标注。模型的主要优点是其对资源的依赖性很低,以往的方法主要利用词汇本体和句法语料,而该模型则使用纯文本语料来获取复合结构的分类特征,从而使得模型的适用性和可移植性大大增强。实验表明,基于功能词例化模板的模型取得了很好的性能。 三、提出了汉语VN型复合结构的语义关系标注集,并设计了一个机器翻译驱动的复合结构语义解释模型。基于复合结构的多语种自然同构假设,模型首先将汉语复合结构自动翻译为对齐的英文复合结构,然后将英文复合结构作为附加信息,用于对汉语的复合结构进行解释。模型的主要优点是可以利用跨语种的资源,对多语种的对齐复合结构同时进行语义解释,从而可以在某种程度解决某些语种中的资源缺乏问题。实验证实,双语语义解释模型的性能要好于单语模型。 四、构建了一个属性知识库的获取框架。词汇概念可以被描述为属性和属性值的集合,属性知识对于复合结构语义解释非常重要。属性获取分为两个阶段,一个阶段是属性词的获取,一个阶段是属性宿主的求取。在属性词的获取中,设计了一个机读词典和万维网的协同自举算法。算法充分利用了汉语的义符构词特点,并结合了机读词典和万维网作为属性知识的来源,对属性词进行获取。而针对属性宿主的求取,则将其视为一个选择约束求解问题,通过评估属性与可能的概念类之间的选择关联度来确定属性的宿主。该方法的特点在于其可以动态、高效地获取以属性词为中心的词汇知识。 五、利用所获取的属性知识,提出了一种基于属性词的词汇相似度计算模型。与以往基于词汇层级知识体系的相似度计算方法不同,该模型充分利用了词汇概念所可能具有的属性词信息来对词汇概念进行表征。属性词可以对概念的各个不同方面进行刻画,如果两个词汇概念共享的关键属性信息越多,则两个词汇概念越为相似,从而,用属性词向量表示词汇概念可以更加精细的刻画词汇概念之间的区分程度。在标准数据集评测以及复合结构语义解释的应用上,该模型取得了比其他词汇相似度模型更好的性能。
【学位授予单位】:上海交通大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 方华,陆汝占,刘绍明;一个实现多种切分标注算法的系统[J];计算机工程;2004年24期
2 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
3 屈刚,陆汝占,王振华;双语句法分析及歧义消解[J];上海交通大学学报;2002年09期
【共引文献】
中国期刊全文数据库 前10条
1 蔡坤琪;;基于相关鉴别分析和随机森林的人脸识别方法[J];安徽电子信息职业技术学院学报;2012年01期
2 耿增民;刘万春;朱玉文;;受限领域的自动文摘方法研究[J];北京理工大学学报;2006年08期
3 李飞;高小榕;高上凯;;基于随机森林算法的高维脑电特征优选[J];北京生物医学工程;2007年04期
4 陈建新;西广成;王伟;赵慧辉;陈静;;数据挖掘分类算法在冠心病临床应用的比较[J];北京生物医学工程;2008年03期
5 熊文;王枞;;改进粒子群与支持向量机混合的特征变换[J];北京邮电大学学报;2009年06期
6 蔡金锭;鄢仁武;;基于小波分析与随机森林算法的电力电子电路故障诊断[J];电力科学与技术学报;2011年02期
7 胥海威;何宽;;改进随机决策树群算法在监督分类中的应用[J];地理与地理信息科学;2010年06期
8 张郴;张捷;;中国入境旅游需求预测的神经网络集成模型研究[J];地理科学;2011年10期
9 马昕;郭静;孙啸;;蛋白质中RNA-结合残基预测的随机森林模型[J];东南大学学报(自然科学版);2012年01期
10 李六杏;区凤霞;;基于最优属性约简的中文邮件过滤系统[J];电脑知识与技术(学术交流);2007年05期
中国重要会议论文全文数据库 前10条
1 贾少春;胡秀珍;;A Method of Predicting theβ-hairpin Motifs in Proteins[A];第四届全国生物信息学与系统生物学学术大会论文集[C];2010年
2 李胜朋;王洪礼;冯剑丰;;基于不连续回归树的最大李雅谱诺夫指数计算方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
3 沈焕生;朱磊;;基于信息内容的关键词抽取研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
4 朱春江;陆宇旻;李陶深;杜衡斌;唐晟;;分布式网络监控系统中网页安全挖掘的研究[A];广西计算机学会2008年年会论文集[C];2008年
5 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
6 张红梅;;基于粗糙集特征约简的SVM集成入侵检测模型[A];2009中国控制与决策会议论文集(3)[C];2009年
7 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
8 曹东升;许青松;梁逸曾;;Computer-Aided Prediction of Toxicity with Substructure Pattern and Random Forest[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
9 李梦龙;;Systematically analyze and select key features to microRNA precursors identification based on random forests[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
10 秦文丽;李益洲;李娟;余乐正;郭延芝;李梦龙;;基于蛋白质序列信息的信号肽上有害非同义单核苷酸多态性的预测[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
3 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
4 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
5 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年
6 王树云;基于Bayes方法和图限制下正规化方法的变量选择问题及其在基因组数据中的应用[D];山东大学;2010年
7 刘运通;产品设计过程知识配送服务关键技术研究[D];浙江大学;2011年
8 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年
9 田健;计算机辅助分子设计提高蛋白质热稳定性的研究[D];中国农业科学院;2011年
10 戴俊程;基于全基因组关联研究的中国女性乳腺癌风险预测模型研究[D];南京医科大学;2011年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
3 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
4 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
5 李红;数据挖掘中特征选择与聚类算法研究[D];大连理工大学;2010年
6 李海燕;互信息特征选择的研究及在代谢组学中的应用[D];大连理工大学;2010年
7 朱新荣;径向基函数神经网络集成算法的研究及应用[D];大连理工大学;2010年
8 严康;基于支持向量机的特征选择算法研究[D];大连理工大学;2010年
9 唐晓敏;基于霍夫变换及条件概率模型的多目标检测[D];大连理工大学;2010年
10 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年
【二级参考文献】
中国期刊全文数据库 前7条
1 徐菁,张辉,陆汝占;汉语语料的切分标注加工系统[J];计算机工程;2003年09期
2 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期
3 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
4 屈刚,陆汝占;一个改进的汉语词性标注系统[J];上海交通大学学报;2003年06期
5 刘颖;用隐马尔柯夫模型对汉语进行切分和标注排歧[J];计算机工程与设计;2001年04期
6 路志英,林孔元,郭祺,段广玉;中文切分词典的最大匹配索引法[J];天津大学学报;1999年05期
7 万建成,杨春花;书面汉语的全切分分词算法模型[J];小型微型计算机系统;2003年07期
【相似文献】
中国期刊全文数据库 前10条
1 徐秋霞,周锁京,赵玉印;TiSi_2/n~+poly-Si复合结构热处理对磷再分布及RIE的影响[J];半导体学报;1991年12期
2 王璐璐;佘希林;袁芳;;静电纺丝制备复合纳米纤维研究进展[J];微纳电子技术;2008年07期
3 李英林;汪永超;刘勇;余显芳;金轩;;基于PLM的部队车辆管理信息系统研发[J];机械设计与制造;2010年08期
4 曾文光;丁桂甫;王艳;付世;蔡玉丽;;新型复合结构电热微驱动器的研制[J];传感器与微系统;2008年05期
5 廖黎莹;丁国清;王志武;;冲击载荷作用下金属防护外壳的防爆仿真分析[J];计算机仿真;2009年01期
6 李新杰;刘杰;董鹏真;邢丽芬;;分数阶Chen混沌系统的复合结构分析[J];武汉科技学院学报;2009年02期
7 张清河;邓小炼;;BCGs-FFT结合BP神经网络反演金属介质复合柱体目标参数[J];电子学报;2010年05期
8 何光华;伍瑞新;陈平;;金属线对结构中左手材料特性的实验验证[J];微波学报;2010年03期
9 徐景方;也谈with(without)复合结构——兼与方振同志商榷[J];系统工程与电子技术;1988年03期
10 方振;浅谈with(without)复合结构[J];系统工程与电子技术;1987年04期
中国重要会议论文全文数据库 前10条
1 李燕;王成伟;徐洮;刘维民;;铜/多孔阳极氧化铝纳米有序阵列复合体系的光吸收特性[A];第五届中国功能材料及其应用学术会议论文集Ⅱ[C];2004年
2 江辉智;罗键;曹浪财;;钢铁工业MES中的质量智能判定管理系统的设计与应用[A];Well-off Society Strategies and Systems Engineering--Proceedings of the 13th Annual Conference of System Engineering Society of China[C];2004年
3 任天斌;宋莹;曹春红;王安;冯玥;;复合结构血管化组织工程支架[A];2009年全国高分子学术论文报告会论文摘要集(下册)[C];2009年
4 陈启飞;黄亚新;王建平;姚树镇;;玻璃钢/钢材复合结构带式舟桥方舟的工艺[A];第十五届玻璃钢/复合材料学术年会论文集[C];2003年
5 杜玉兰;王代华;刘殿书;汪义龙;;含泡沫混凝土层复合结构抗爆性能试验研究[A];首届全国水工抗震防灾学术会议论文集[C];2006年
6 赵健;曾宪明;李世民;;土钉一超前锚杆复合结构机理分析及应用[A];地基基础工程与锚固注浆技术:2009年地基基础工程与锚固注浆技术研讨会论文集[C];2009年
7 高全臣;刘殿书;王代华;吴海燕;;泡沫混凝土复合防护结构的抗爆性能试验研究[A];第六届全国工程结构安全防护学术会议论文集[C];2007年
8 刘贲;;守望传统图形设计的心灵乐章[A];“岁寒三友——诗意的设计”——两岸三地中国传统图形与现代视觉设计学术研讨会论文集[C];2004年
9 周晓敏;张国亮;;“冻土+管棚”复合结构的承载性能研究及其应用分析[A];城市地下空间开发与地下工程施工技术高层论坛论文集[C];2004年
10 陈静;尚鉴;吴凯;;ZnAl_2O_4纳米管@AAO复合结构的虹色效应[A];中国化学会第28届学术年会第4分会场摘要集[C];2012年
中国重要报纸全文数据库 前10条
1 ;一种双金属层复合结构散热器[N];中国有色金属报;2003年
2 山东省寿光市二职专 张艳萍;With的复合结构[N];学知报;2011年
3 赵鹏;复合结构全路况特种汽车在沈阳问世[N];今日信息报;2004年
4 王炳坤;沈阳复合结构全路况特种汽车面世[N];中国高新技术产业导报;2004年
5 鄢陵县一高 袁志稳;小议“with复合结构”[N];学知报;2011年
6 ;复合结构的浸入式水口[N];中国冶金报;2003年
7 ;复合结构微复制模具[N];中国有色金属报;2003年
8 陈小锋;高盟新型双组分水性复合粘合剂[N];中国包装报;2008年
9 赛诺;PVDC涂布膜的应用——涂布膜的复合结构与食品包装[N];中国包装报;2005年
10 记者 毛黎;美制成金纳米粒子和蛋白质复合结构[N];科技日报;2007年
中国博士学位论文全文数据库 前10条
1 耿志刚;石墨烯复合结构的吸附和电催化性能研究[D];中国科学技术大学;2013年
2 赵京雷;汉语动词名物化复合结构的语义解释[D];上海交通大学;2008年
3 郭传胜;潜式沉箱—群桩—平台型复合结构水动力特性研究[D];大连理工大学;2012年
4 王嘉维;YMnO_3及其复合结构的磁电特性研究[D];清华大学;2013年
5 许苗军;几种材料表面微纳米复合结构的构筑与应用[D];吉林大学;2011年
6 王治宇;一维碳纳米材料及其复合结构的制备与表征[D];大连理工大学;2007年
7 王肖戎;三维波纹钢板混凝土拱型复合结构理论分析与计算[D];西北工业大学;2003年
8 金美花;超疏水性纳米界面材料的制备及研究[D];吉林大学;2004年
9 祝巍;二氧化钛纳米管及其复合结构的电沉积制备研究[D];中国科学技术大学;2009年
10 李晶;多元耦合仿生疏水金属表面制备原理与方法研究[D];吉林大学;2012年
中国硕士学位论文全文数据库 前10条
1 张韬文;名词—名词型复合结构的语义解释[D];上海交通大学;2010年
2 胡立晨;柔性针刺非织造材料及其与木质材料复合结构吸声性能研究[D];东华大学;2010年
3 刘朔甲;三组元周期复合结构的振动带隙分布规律研究[D];北京交通大学;2012年
4 邢乃春;官厅水库上游微污染水体生态湿地处理技术研究[D];北京工业大学;2006年
5 栾红艳;电流化学镀复合结构丝的磁性研究[D];华东师范大学;2013年
6 孙国锋;保留棘突韧带复合结构治疗中央型腰椎管狭窄症[D];山东中医药大学;2003年
7 李楠庭;基于C_(60)衍生物的有机/无机复合材料的制备与表征[D];安徽师范大学;2007年
8 李文林;软土地层咬合桩挡土结构设计与施工技术研究[D];同济大学;2006年
9 周学领;咬合桩复合结构设计理论及方法研究[D];同济大学;2007年
10 武玲玲;碳点/贵金属复合结构的制备及其可见光催化性能[D];中北大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026