收藏本站
《南京理工大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于领域本体的汉语共指消解及相关技术研究

史树敏  
【摘要】: 共指是自然语言篇章和对话中普遍存在的现象。共指使篇章主题更加突出,表述更加连贯与简洁;但它也给自然语言处理带来了不确定性。共指消解是消除这种指代形式带来的不确定性的过程。随着基于篇章真实文本处理需求的大量涌现,共指消解显示出了前所未有的重要性,成为自然语言处理领域的研究热点。 本文旨在围绕汉语共指消解及相关命名实体识别任务,考察领域本体对其提供具体支持的方式与作用,并结合机器学习方法进行验证。本文研究侧重于方法论探索与实证分析相结合的路线,提出了一套基于领域本体结合机器学习模型的方法,主要工作如下: 1.提出了一种构建领域本体的TPSU方法,该方法将本体构建分成两个阶段,六个处理层次。在具体生成本体过程中,提出了TMR三模型化准则,有效解决了单一树型上下位结构向多元网状关系结构的过渡问题,通过创建实例,丰富和完善了领域本体的知识结构。上述方法与原则具体直观,可以运用于其他同类本体构建,操作性强。 2.构建了一个包含12类核心概念、78种属性特征、13种概念、属性关系、4,392条实例的移动电话领域本体MPO。目前尚无此类本体文库。MPO中大多数核心概念可以直接复用,具有推广和实用价值,有效发挥了本体知识可共享的特性。 3.将命名实体分成常规实体和领域实体(DNE)两类。在领域命名实体识别(DNER)中,重点考察了领域本体对汉语命名实体识别的支持方式,提出了一种基于领域本体形式化实例获取词性规则模板的方法,结合统计机器学习模型有效实现了领域命名实体的识别,F值达到92.36%。对比实验也表明上述模板能够有效提高识别准确率且性能稳定,在领域实体边界和特殊形式实体识别中作用明显。 4.探讨了领域本体对汉语共指消解的作用,提出了一种基于领域本体获取语义类特征的方法,通过特征的自动标注,获取作为候选先行语的名词短语的语义类特征,结合机器学习方法进行领域命名实体基础上的共指消解处理,F值达到86.49%。实验表明领域语义类特征有效提高了共指消解准确性指标,使F值最终提高了7.36%。 5.针对目前汉语零形回指研究主要集中在语言学和心理学角度的现状,立足于本文现有成果,提出了一种包含三个具有实际操作性算法的汉语零形共指消解模型。在定义的共指片断内部,通过将零形代词先行语识别出来,填补到缺省位置,完成零形共指消解。
【学位授予单位】:南京理工大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前10条
1 陈刚,金芝,陆汝钤;虚拟企业及其协作模型[J];电子学报;2002年S1期
2 陆汝钤,石纯一,张松懋,毛希平,徐晋晖,杨萍,范路;面向Agent的常识知识库[J];中国科学E辑:技术科学;2000年05期
3 尹邦彦;英语零照应的类型与主要特征[J];解放军外国语学院学报;1999年02期
4 武成岗,焦文品,田启家,史忠植;基于本体论和多主体的信息检索服务器[J];计算机研究与发展;2001年06期
5 钱伟,郭以昆,周雅倩,吴立德;基于最大熵模型的英文名词短语指代消解[J];计算机研究与发展;2003年09期
6 于满泉;骆卫华;许洪波;白硕;;话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;2006年03期
7 高济;基于表示本体论的智能系统开发[J];计算机研究与发展;1996年11期
8 廖乐健,曹元大,李新颖;基于Ontology的信息抽取[J];计算机工程与应用;2002年23期
9 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
10 徐振宁;张维明;陈文伟;;基于Ontology的智能信息检索[J];计算机科学;2001年06期
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
4 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
5 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
6 王斌;;基于聚类的决策树在玉米种质筛选中的应用[J];安徽农业科学;2011年33期
7 何甫权;;英语指代与翻译[J];安徽文学(下半月);2008年08期
8 吴继刚;;从术语看古代语文词典编纂的规范化[J];安徽文学(下半月);2008年11期
9 彭可;;“Do you mind smoking?”的语用变异分析[J];安徽文学(下半月);2009年09期
10 陈荣泽;;近十年汉语方言研究的新发展[J];安康学院学报;2011年02期
【同被引文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 王智强;李蕾;王枞;;基于决策树的汉语代词共指消解[J];北京邮电大学学报;2006年04期
3 张蕾;;语义Web本体语言及OWL研究[J];成都信息工程学院学报;2007年02期
4 刘霞;阳小华;;基于本体的个性化信息检索研究[J];电脑知识与技术;2009年25期
5 乔立岩;彭喜元;马云彤;;基于遗传算法和支持向量机的特征子集选择方法[J];电子测量与仪器学报;2006年01期
6 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
7 张翼宇;;决策树简化算法的一种深化研究[J];福建电脑;2008年05期
8 张志强,李天柱,张波,陈少飞,郝亚南;基于文档结构的信息抽取规则的描述语言比较研究[J];河北大学学报(自然科学版);2004年02期
9 于合龙;陈桂芬;董旭初;;基于贝叶斯网的专家系统平台的开发与应用[J];黑龙江大学自然科学学报;2008年04期
10 张黎;汉语名词数范畴的表现方式[J];汉语学习;2003年05期
【二级引证文献】
中国期刊全文数据库 前1条
1 刘治纲;叶水生;;基于多本体的搜索引擎框架设计[J];南昌航空大学学报(自然科学版);2011年02期
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
3 潘海华;篇章表述理论概说[J];国外语言学;1996年03期
4 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
5 苗兴伟;语篇向心理论述评[J];当代语言学;2003年02期
6 袁毓林;句子的焦点结构及其对语义解释的影响[J];当代语言学;2003年04期
7 陈少飞,郝亚南,李天柱,徐林昊,杨文柱;Web信息抽取技术研究进展[J];河北大学学报(自然科学版);2003年01期
8 高济,林东豪;基于Agent技术的虚拟组织集成框架IFVO[J];计算机研究与发展;1999年12期
9 钱伟,郭以昆,周雅倩,吴立德;基于最大熵模型的英文名词短语指代消解[J];计算机研究与发展;2003年09期
10 高济;基于表示本体论的智能系统开发[J];计算机研究与发展;1996年11期
【相似文献】
中国期刊全文数据库 前10条
1 李景,苏晓鹭,钱平;构建领域本体的方法[J];计算机与农业;2003年07期
2 肖敏;;领域本体的构建方法研究[J];情报杂志;2006年02期
3 马文峰;杜小勇;;知识网格研究[J];图书情报工作;2007年10期
4 许勇;王智学;李宗勇;;领域本体的一致性检查[J];计算机工程;2009年01期
5 宋佳;王盼卿;齐剑锋;李晓辉;;装备领域本体的构建方法研究[J];微计算机信息;2009年15期
6 张付志;李伟静;朱彩云;;基于领域本体的跨系统个性化服务用户模型[J];计算机工程;2009年13期
7 王涵;张功杰;;领域本体建模研究与实现[J];煤炭科技;2009年02期
8 陈坚;何洁月;;RDF可信度扩展在领域本体构建中的应用[J];计算机技术与发展;2006年01期
9 李衍淼;霍常青;;本体论在企业信息检索中的应用[J];福建电脑;2006年08期
10 徐忠华;程方玉;王强;周传宏;;基于领域本体的PDM系统工程更改管理模型[J];机电工程;2006年12期
中国重要会议论文全文数据库 前10条
1 冯瑾;;初始领域本体获取研究——以国际共运领域为例[A];中国图书馆学会专业图书馆分会2009年学术年会论文集[C];2009年
2 张晓莹;张桂平;王裴岩;;领域本体构建中关系辅助判断技术研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 叶琼;李绍稳;张友华;刘恺;;农业领域本体知识的云化方法研究[A];中国农业工程学会2011年学术年会论文集[C];2011年
4 李贵;张兆鑫;李征宇;韩子洋;;WEB环境下基于领域本体的语义匹配技术研究[A];科学发展与社会责任(A卷)——第五届沈阳科学学术年会文集[C];2008年
5 张士靖;胡兆芹;;医学领域本体的构建实践[A];中华医学会第十二次全国医学信息学术会议论文汇编[C];2006年
6 刘新华;刘文剑;;基于领域本体的技术准备信息集成技术研究[A];全国先进制造技术高层论坛暨第七届制造业自动化与信息化技术研讨会论文集[C];2008年
7 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 李甜甜;;基于本体论的供应链知识管理[A];经济发展与管理创新--全国经济管理院校工业技术学研究会第十届学术年会论文集[C];2010年
9 王茹;邢毓华;;古建筑领域本体构建研究[A];首届工程设计高性能计算(HPC)技术应用论坛论文集[C];2007年
10 程晓;郑德权;杨宇航;邵国军;;面向半结构化文本的领域本体关系抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国重要报纸全文数据库 前1条
1 杞人;我基于中文的农业本体论研究与应用国际领先[N];科技日报;2011年
中国博士学位论文全文数据库 前10条
1 赵娜;基于知识地图的多领域本体语义互联研究[D];吉林大学;2011年
2 欧阳柳波;领域本体覆盖度评价关键技术研究[D];中南大学;2012年
3 董俊;基于KDD的领域本体构建若干关键问题研究[D];南京邮电大学;2011年
4 谷建军;基于叙词表的中医古籍文献领域本体建模方法研究[D];中国中医科学院;2006年
5 于娟;基于文本的领域本体学习方法及其应用研究[D];大连理工大学;2010年
6 徐振宁;基于本体的Web数据语义信息的表示与处理方法研究[D];中国人民解放军国防科学技术大学;2002年
7 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
8 李丽双;领域本体学习中术语及关系抽取方法的研究[D];大连理工大学;2013年
9 李景;领域本体的构建方法与应用研究[D];中国农业科学院;2009年
10 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 牟冬梅;本体在医学数字信息资源知识组织中的应用研究[D];吉林大学;2005年
2 史军强;WEB信息集成技术研究[D];电子科技大学;2005年
3 叶剑;基于领域本体的E-Learning系统研究[D];华中师范大学;2011年
4 付佳佳;基于叙词表的领域本体建模研究[D];华东师范大学;2006年
5 许琳;基于本体的个性化信息服务用户模型构建研究[D];吉林大学;2008年
6 冯艳华;基于语义的构件描述和检索方法的研究[D];西北大学;2005年
7 邹景华;语义万维网在智能信息检索中的应用研究[D];重庆大学;2005年
8 张江;本体在领域知识管理中的应用研究[D];重庆大学;2005年
9 赵娟;本体在Web服务发现中的应用[D];西北大学;2006年
10 杨小佳;基于本体的公共交通领域智能信息检索研究[D];大连海事大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026