收藏本站
《大连理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于文本的领域本体学习方法及其应用研究

于娟  
【摘要】: 领域本体是某一领域(或某一应用)的共享概念模型的形式化的明确说明。目前,领域本体已经被广泛应用于知识管理、语义服务、电子商务、人工智能等多个领域。但是,构建领域本体是一项困难的任务,人工构建费时费力。为此,相关应用领域开始热研能够支持本体(半)自动构建的本体学习方法,即,从数据源中(半)自动地提取本体对象以支持本体构建,提高构建效率并优化结果的机器学习方法。 在(半)自动构建领域本体的过程中,主要存在三个问题:提取文档词语、构建领域概念集合和构建本体关系集合。相应地,本文研究了三个本体学习方法,用于从中文文本语料中半自动地提取本体对象,简化中文领域本体的构建过程: 1)提出一种新的词语提取方法——原子词步长法。该方法结合原子词词性分析与串频统计来判断汉字串是否成词并建立词语集合,有效地解决了从文档中自动提取所包含的中文词语集合的问题。 2)提出一种新的领域概念学习方法——领域隶属同义词分析法。该方法由两个子方法组合而成:领域隶属度分析方法和同义词合并方法,前者用于提取领域专有术语集合,后者用于消除术语集合中的同义现象。在给定合适的文本语料库的情况下,该方法能够解决领域概念集合的构建问题。 3)提出一种新的本体关系学习方法—概念特征词法。该方法基于概念的特征词模型来计算两个概念之间的相关程度,学习非类属关系。合成既有的类属关系学习方法后,该方法能够有效支持本体关系集合的构建。 上述三个中文领域本体的学习方法均在中文语料上做过多次试验、性能分析和算法改良,学习结果令人满意。并且,这些方法被综合使用到一个国家自然基金委项目(即信息管理和知识管理领域的术语标准化)中,得到了实际应用和验证。 本文提出的基于文本的领域本体学习方法具有较高的性能和较强的实用性。在给定合适的文本语料的情况下,采用这些方法可以以人机结合的方式构建面向应用的中文领域本体。实现了构建过程中一定程度的自动化,简化了本体构建任务,从而起到促进本体的产业化发展的作用。经过适当的调整和整合之后,这些本体学习方法还可应用于语义检索、文本摘要等其他诸多领域。
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:G420

【引证文献】
中国期刊全文数据库 前1条
1 刘萍;胡月红;;领域本体学习方法和技术研究综述[J];现代图书情报技术;2012年01期
【参考文献】
中国期刊全文数据库 前10条
1 赵军;胡栓柱;樊兴华;;一种新的词语相似度计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
2 黄烟波,张红宇,李建华,谭立球,李志;本体映射方法研究[J];计算机工程与应用;2005年18期
3 付德宇;代成琴;;一个面向文本分类的中文特征词自动抽取方法[J];计算机工程与应用;2006年15期
4 于娟;党延忠;;本体集成研究综述[J];计算机科学;2008年07期
5 杜波,田怀凤,王立,陆汝占;基于多策略的专业领域术语抽取器的设计[J];计算机工程;2005年14期
6 郑家恒,卢娇丽;关键词抽取方法的研究[J];计算机工程;2005年18期
7 胡和平;曾庆锐;路松峰;;中文词聚类研究[J];计算机工程与科学;2006年01期
8 陈浪舟,黄泰翼;一种新颖的词聚类算法和可变长统计语言模型[J];计算机学报;1999年09期
9 魏哲雄;冯志勇;;基于字典技术的本体整合系统[J];计算机应用;2007年02期
10 温春;石昭祥;张亮;;中文领域本体概念层次获取方法对比研究[J];计算机应用研究;2009年08期
中国博士学位论文全文数据库 前8条
1 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
2 杨梅;现代汉语合成词构词研究[D];南京师范大学;2006年
3 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
4 程勇;基于本体的不确定性知识管理研究[D];中国科学院研究生院(计算技术研究所);2005年
5 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
6 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年
7 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
8 李景;领域本体的构建方法与应用研究[D];中国农业科学院;2009年
中国硕士学位论文全文数据库 前1条
1 于娟;基于本体语言OWL的知识表示及推理算法研究[D];青岛大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 王煜;毛雪岷;;基于网络本体语言OWL数字化自然灾害应急救助预案要素的实现[J];安徽农业科学;2010年26期
2 黄洪;刘增良;余达太;周绍华;;一种具有免疫特征的智能数据分类分级模型[J];兵工学报;2010年12期
3 黄洪;刘增良;余达太;;一种智能化的数据分类、分级及保护模型[J];北京工业大学学报;2011年06期
4 胡泽文;;基于WordNet和SUMO本体集成的自动语义检索及可视化模型[J];国家图书馆学刊;2012年02期
5 耿增民;刘万春;朱玉文;;受限领域的自动文摘方法研究[J];北京理工大学学报;2006年08期
6 沈筱彦;陈俊亮;孟祥武;张玉洁;张磊;;可并行中文同主题词聚类新算法[J];北京邮电大学学报;2009年04期
7 曹霞,孙成权;数字图书馆与知识创新[J];图书与情报;2004年06期
8 汤少梁;;客户关系管理与知识管理的集成研究[J];商业研究;2006年03期
9 赵军;胡栓柱;樊兴华;;一种新的词语相似度计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
10 薛志远;张清华;;复合粒计算模型研究进展[J];重庆邮电大学学报(自然科学版);2010年05期
中国重要会议论文全文数据库 前10条
1 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
2 刘善涛;李敏;;基于信息库的新词词汇共性分析与教学策略研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 徐立恒;刘洋;来斯惟;刘康;田野;王渝丽;赵军;;基于多特征表示的本体概念挂载[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 张晓莹;张桂平;王裴岩;;领域本体构建中关系辅助判断技术研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 毕鲁雁;焦宗夏;范圣韬;赵四军;;基于本体的机载机电系统故障诊断研究[A];第五届全国流体传动与控制学术会议暨2008年中国航空学会液压与气动学术会议论文集[C];2008年
7 李宏伟;蔡畅;李勤超;;基于地理本体的空间数据集成研究[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
8 沈焕生;朱磊;;基于信息内容的关键词抽取研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
9 史东娜;王枞;李卫;;车牌识别领域的中文术语自动抽取[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
10 朱春江;陆宇旻;李陶深;杜衡斌;唐晟;;分布式网络监控系统中网页安全挖掘的研究[A];广西计算机学会2008年年会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
2 陈发祥;知识管理绩效与组织文化相关性研究[D];合肥工业大学;2010年
3 江庭谊;知识管理、企业文化与组织效能关系研究[D];南开大学;2010年
4 韩赟;高技术虚拟企业(HTVE)知识管理模式研究[D];哈尔滨理工大学;2009年
5 王小龙;建设工程数字化管理体系研究[D];北京交通大学;2010年
6 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
7 陈一稀;基于关系数据库的遗留系统向语义Web移植的研究[D];浙江大学;2010年
8 李晋江;海量数据点三维重构中一类关键问题研究[D];山东大学;2010年
9 杨剑锋;适合并行的无干预文档聚类算法研究[D];武汉大学;2010年
10 刘运通;产品设计过程知识配送服务关键技术研究[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 厉颖;基于本体的服装领域知识表示的建模研究[D];山东科技大学;2010年
2 赵永华;多学科本体构建与集成技术研究[D];山东科技大学;2010年
3 黄志钦;珠三角产业集群发展及其对广西的借鉴[D];广西师范学院;2010年
4 何健;集成过程的知识协同模型、方法与技术研究[D];浙江理工大学;2010年
5 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
6 李伟光;基于BP神经网络的数据库模式匹配方法研究[D];哈尔滨工程大学;2010年
7 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
8 丁莹莹;基于知识管理的跨国公司技术创新模式研究[D];哈尔滨工程大学;2010年
9 于洋;一种改进的COBWEB算法研究[D];哈尔滨工程大学;2010年
10 念闯玲;基于组织知识结构的知识缺口识别方法研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前6条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 郑家恒,卢娇丽;关键词抽取方法的研究[J];计算机工程;2005年18期
3 魏瑞斌;;社会网络分析在关键词网络分析中的实证研究[J];情报杂志;2009年09期
4 奉国和;郑伟;;文本分类特征降维研究综述[J];图书情报工作;2011年09期
5 翟笃风;刘柏嵩;;政务领域本体术语的自动抽取[J];现代图书情报技术;2010年04期
6 张敏;耿焕同;王煦法;;一种利用BC方法的关键词自动提取算法研究[J];小型微型计算机系统;2007年01期
中国博士学位论文全文数据库 前2条
1 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
2 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
中国硕士学位论文全文数据库 前6条
1 翟林;领域本体的半自动构建方法研究与实现[D];东南大学;2005年
2 贾黎莉;Ontology构建中概念间关系的研究[D];中国农业科学院;2007年
3 张云中;基于形式概念分析的领域本体构建方法研究[D];吉林大学;2009年
4 任柏青;基于关系数据库的领域本体构建方法的研究与实践[D];北京邮电大学;2009年
5 王世清;本体构建中建立概念间关系方法研究[D];中国农业科学院;2010年
6 杨芬;本体学习中概念和关系抽取方法研究[D];重庆大学;2010年
【二级引证文献】
中国期刊全文数据库 前1条
1 黎九平;;基于SOM文本聚类的领域本体学习研究[J];情报探索;2012年11期
【二级参考文献】
中国期刊全文数据库 前10条
1 陶皖,李平,廖述梅;当前基于本体的语义标注工具的分析[J];安徽工程科技学院学报(自然科学版);2005年02期
2 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
3 黎锦熙;汉语构词法和词表研究(上)[J];北京师范大学学报(社会科学);1959年05期
4 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
5 朱靖波,姚天顺;文本内容主题的识别方法[J];东北大学学报;2002年05期
6 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
7 姜英杰;;元认知:理论质疑与界说[J];东北师大学报(哲学社会科学版);2008年02期
8 顾阳;论元结构理论介绍[J];国外语言学;1994年01期
9 黄月圆;复合词研究[J];国外语言学;1995年02期
10 顾阳;生成语法及词库中动词的一些特性[J];国外语言学;1996年03期
中国重要会议论文全文数据库 前5条
1 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 郑家恒;杜永萍;宋礼鹏;;农业病虫害词汇获取方法初探[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 陈文亮;朱靖波;姚天顺;张宇新;;基于Bootstrapping的领域词汇自动获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 朱靖波;陈文亮;姚天顺;;面向TDT的主题相似性计算模型[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 蒋宏飞;曹海龙;杨沐昀;;基于大规模语料的中文词聚类研究与实现[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前9条
1 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
2 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
3 胡鹤;本体方法及其时空推理应用研究[D];吉林大学;2004年
4 张凯;基于本体的Web信息集成若干关键技术研究[D];复旦大学;2004年
5 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
6 付相君;基于本体和Semantic Web技术的产品知识集成基础研究[D];浙江大学;2005年
7 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年
8 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
9 薛春香;农史知识组织系统构建与应用研究[D];南京农业大学;2006年
中国硕士学位论文全文数据库 前7条
1 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
2 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
3 王明燕;基于WEB页面的关键词与关键概念提取技术[D];北京工业大学;2003年
4 郝天永;基于本体的宗教知识获取[D];兰州理工大学;2005年
5 陆勇;面向信息检索的汉语同义词自动识别[D];南京农业大学;2005年
6 陈琮;基于Jena的本体检索模型设计与实现[D];武汉大学;2005年
7 杨柳;基于文本的中文本体知识获取的研究[D];中国科学院研究生院(计算技术研究所);2006年
【相似文献】
中国期刊全文数据库 前10条
1 刘林娟;;面对浮躁,我们该何去何从——中专语文教学思考[J];内蒙古电大学刊;2006年03期
2 张建良;;朗读让语文教学返璞归真——语文本体学习初探[J];法制与社会;2009年26期
3 矫凤霞;;培养良好的学习方法,促进学生主动学习[J];新课程学习(下);2011年09期
4 吴诗典;;练点“背功”好[J];师范教育;1985年06期
5 蔡维钧;谈谈学习的规律和方法[J];连云港职业技术学院学报;1990年02期
6 薛彦;自学者之间自测好处多[J];成人教育;1990年11期
7 林惠生;;关于语文学法指导的思考与尝试[J];语文教学通讯;1990年09期
8 李瑾瑜;学习方法指导问题概论[J];教育科学;1992年04期
9 丁骥良;小学语文学法指导的基本途径[J];教育科学研究;1992年04期
10 赵志恒;学会思维,掌握具有创新性的学习方法[J];课程.教材.教法;1994年01期
中国重要会议论文全文数据库 前10条
1 张晓莹;张桂平;王裴岩;;领域本体构建中关系辅助判断技术研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 徐惠;高志强;陆青健;朱万颖;;ORIGO:一种基于数字化图书馆资源的本体学习方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
3 冯瑾;;初始领域本体获取研究——以国际共运领域为例[A];中国图书馆学会专业图书馆分会2009年学术年会论文集[C];2009年
4 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
5 李晓栋;胡清华;;汽轮机故障诊断文本支持系统的研究与建立[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
6 赵宬斐;黄丽萍;;浙江外来新居民的生活空间发展检视——以店口为例[A];“秩序与进步:浙江社会发展60年研究”理论研讨会暨2009浙江省社会学年会论文集[C];2009年
7 易绵竹;南振兴;李绍哲;薛恩奎;;文本生成与理解的语言学模拟——伊戈尔·梅里丘克《意思(?)文本》模型评介[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 徐玉红;;留一片天空 让学生飞翔——谈新课标下英语自主学习能力的培养[A];中国教育学会中小学心理健康教育课题中期研究报告论文集[C];2004年
9 胡洁;;浅谈习作教学中的“对话性格”[A];江苏省教育学会2005年小学语文优秀论文集[C];2005年
10 朱国光;;如何培养学生良好的学习生活习惯[A];全国教育科研“十五”成果论文集(第四卷)[C];2005年
中国重要报纸全文数据库 前10条
1 刘晓波 崔天伦;任职培训是学习方法刍议[N];人民武警;2006年
2 于云东 任惠彬 华军 任中兴 陈平军 刘志刚 胡其宗 陈讲峰;学以致用 用以促学 学用相长[N];人民武警;2003年
3 四川省广元市元坝区昭化中学 李国荣 黄小平;初中语文教学中培养学生自主学习能力的初探[N];广元日报;2007年
4 朱爱林 张其云;紧密联系实际 创新学习方法[N];中国工商报;2010年
5 天予;教学方法需创新[N];中国妇女报;2002年
6 钟山;日读3500字是怎样落实的?[N];解放军报;2000年
7 弓习科;丛台区理论学习方法多求实效[N];邯郸日报;2007年
8 张延宁;浅谈初中数学的学习方法[N];济宁日报;2008年
9 广西中医学院 刘燕平广西右江民族医学院 黄岑汉;浅谈中医诊断学及其学习方法[N];中国中医药报;2007年
10 金彧;《数据库原理》学习方法谈[N];中国电脑教育报;2002年
中国博士学位论文全文数据库 前10条
1 于娟;基于文本的领域本体学习方法及其应用研究[D];大连理工大学;2010年
2 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
3 赵娜;基于知识地图的多领域本体语义互联研究[D];吉林大学;2011年
4 高俊杰;基于语义Web的企业知识集成关键技术研究[D];大连理工大学;2009年
5 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
6 董俊;基于KDD的领域本体构建若干关键问题研究[D];南京邮电大学;2011年
7 谷建军;基于叙词表的中医古籍文献领域本体建模方法研究[D];中国中医科学院;2006年
8 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
9 邱桃荣;面向本体学习的粒计算方法研究[D];北京交通大学;2009年
10 徐振宁;基于本体的Web数据语义信息的表示与处理方法研究[D];中国人民解放军国防科学技术大学;2002年
中国硕士学位论文全文数据库 前10条
1 黄婵;领域本体的构建及其在Web信息抽取中的应用研究[D];江西理工大学;2010年
2 岳笑峥;基于领域本体的意见挖掘系统[D];北京邮电大学;2008年
3 牟冬梅;本体在医学数字信息资源知识组织中的应用研究[D];吉林大学;2005年
4 韦小丽;领域本体构建及其在专利信息服务中的研究与应用[D];苏州大学;2009年
5 史军强;WEB信息集成技术研究[D];电子科技大学;2005年
6 叶剑;基于领域本体的E-Learning系统研究[D];华中师范大学;2011年
7 付佳佳;基于叙词表的领域本体建模研究[D];华东师范大学;2006年
8 许琳;基于本体的个性化信息服务用户模型构建研究[D];吉林大学;2008年
9 冯艳华;基于语义的构件描述和检索方法的研究[D];西北大学;2005年
10 邹景华;语义万维网在智能信息检索中的应用研究[D];重庆大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026