收藏本站
《国防科学技术大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义的网络知识获取相关技术研究

郭勇  
【摘要】: 伴随着Internet的飞速发展,Web上出现了海量、异构、半结构化、动态的信息资源,并且在这些Web信息中有80%以上的信息是以Web文本的形式存在的。如何从这些浩如烟海的Web信息资源中寻找并获取有价值的信息和知识模式,已经成为信息处理领域一个亟待解决的问题。基于语义的网络知识获取有助于解决上述问题,它可以提高用户网上信息搜索的效率,可以将搜索结果分门别类,帮助用户快速定位目标知识,并且从中抽取有价值的知识。 本文在分析网络知识获取相关技术的研究现状和存在问题的基础上,研究了概念语义生成技术、文本分类方法、典型用户会话模板生成方法以及基于概念的近似查询技术,主要取得以下研究成果: (1)借助NMF算法的分解结果具有实现上的简便性以及分解形式和分解结果可解释性的优点,提出一种基于NMF的概念语义生成方法。类比图像分解的思想,将一个向量文本对应一幅图像,一个特征项数值对应一个象素点灰度值,应用NMF提取文本向量的概念语义,从而为大规模文本处理提供了一种新途径。实验结果以及相关工作比较分析表明NMF生成的概念语义能准确反映样本的局部特征,有助于解决自然语言表示中固有的歧义问题。 (2)将NMF生成的概念语义向量用于Web文本分类。由于NMF生成的局部概念语义向量能和样本的特征直接对应,体现了各个分类中文本各自的特点,因此比体现所有文本共同特征的全局概念语义向量具有更强的区分能力。实验对比分析了局部概念语义空间和全局概念语义空间的构建对文本分类结果的影响,实验结果表明在NMF生成的局部概念语义空间中进行分类更精确。 (3)根据NMF算法分解大规模文本矩阵的特点,提出了一种基于NMF的典型用户会话模板发现方法。应用NMF算法分解项.文本矩阵来获取项之间的相关性,在此基础上,引入语义向量和权重向量的概念,并通过定义语义向量的类别紧密度来提取用户模板。从确保概念语义向量正交,减少概念语义向量冗余的角度出发,选择NMF的变体LNMF进行降维,设计了一种基于LNMF的典型用户会话模板提取算法。由于LNMF得到的概念语义向量是尽可能正交的,实验分析表明,LNMF方法的聚类效果好,适合于发现典型用户会话模板。 (4)针对基于概念最小上界和最大下界求本体概念近似查询的不足,定义了概念的最佳近似。利用复杂概念间的蕴涵关系,引入多元界和最简多元界的概念。通过相关性质和定理证明了借助多元界可以求得概念的最佳近似,从而将求概念最佳近似的问题转化为求概念的最简多元界问题。在此基础上,提出基于概念最简多元界的本体概念近似查询方法,可以有效消除查询重写冗余,提高近似查询的质量和查询重写效率。 (5)给出了一个求概念最简多元最小上界的算法。详细讨论利用迭代递增的过程和概念层次减少搜索空间、优化算法效率的措施,给出算法正确性和完备性的证明,分析了算法的有效性。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP391.41

【引证文献】
中国期刊全文数据库 前1条
1 刘妮;;基于语义Web的知识检索技术研究[J];科技信息;2012年34期
中国博士学位论文全文数据库 前3条
1 王萍;网络环境下的领域知识挖掘[D];华东师范大学;2010年
2 常德海;GIS知识工程关键理论与方法研究[D];河南理工大学;2012年
3 马俊;专题地图总体设计智能化理论与方法研究[D];解放军信息工程大学;2013年
中国硕士学位论文全文数据库 前1条
1 罗蕴姣;住宅建筑能源消耗计量体系研究[D];东北林业大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 李蓉 ,叶世伟 ,史忠植;SVM-KNN分类器——一种提高SVM分类精度的新方法[J];电子学报;2002年05期
2 关英春;秦蓓;;汉字自动统计系统CWSS[J];计算机研究与发展;1985年12期
3 王锡江;王启祥;陈家骏;;基于邻接知识的汉语自动分词系统[J];计算机研究与发展;1992年11期
4 范焱,陈恩红,王清毅,蔡庆生,刘洁;超文本协调分类器的性能研究[J];计算机研究与发展;2000年09期
5 李晓黎,刘继敏,史忠植;概念推理网及其在文本分类中的应用[J];计算机研究与发展;2000年09期
6 徐凤亚,罗振声;文本自动分类中特征权重算法的改进研究[J];计算机工程与应用;2005年01期
7 黄烟波,张红宇,李建华,谭立球,李志;本体映射方法研究[J];计算机工程与应用;2005年18期
8 李源;郑毅;何清;史忠植;;基于概念空间的文本语义索引[J];计算机科学;2002年01期
9 李波,李新军;一种基于粗糙集和支持向量机的混合分类算法[J];计算机应用;2004年03期
10 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
中国博士学位论文全文数据库 前1条
1 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
中国硕士学位论文全文数据库 前4条
1 杨昂;文本分类算法研究[D];湖南大学;2002年
2 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
3 张滨;中文文档分类技术研究[D];武汉大学;2004年
4 崔彩霞;基于支持向量机的文本分类方法研究[D];山西大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 顾文炯;用因子分析法对农业上市公司进行财务评价[J];安徽大学学报;2005年03期
2 赵东娟;齐伟;杨芬;;主成分聚类分析在县域生态经济分区中的应用——以东营市河口区为例[J];安徽农业科学;2007年06期
3 李景国;;重庆三峡库区生态经济区农业和农村经济状况评价[J];安徽农业科学;2007年26期
4 李景国;杨星一;;重庆渝西经济走廊地区农业发展水平的聚类分析[J];安徽农业科学;2007年35期
5 赵银德;张鑫;;关于辽宁省县域经济发展的研究[J];安徽农业科学;2008年11期
6 徐磊;张志;师永强;曹华玲;高松峰;;武汉市耕地资源的时空变化及驱动力分析[J];安徽农业科学;2008年16期
7 陈基漓;牛秦洲;;WEB挖掘在农业信息网站个性化服务中的应用[J];安徽农业科学;2008年35期
8 管琳;李春兰;张博;;基于主成分分析法的我国农村居民消费结构的综合评价[J];安徽农业科学;2011年14期
9 沈蓓雷;张维砚;胡雪芹;童琰;徐春燕;由文辉;;城市小型景观水体富营养化程度评价研究[J];安徽农业科学;2011年23期
10 杨道建;刘素霞;张赞赞;;全国31个地区农村经济发展水平综合评价[J];安徽农业科学;2011年26期
中国重要会议论文全文数据库 前10条
1 陈红兵;;基于XML的电子政务信息集成框架[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 鲁峰华;马俊炯;刘强;;北京市居民消费与经济增长关系研究[A];科学发展:社会管理与社会和谐——2011学术前沿论丛(下)[C];2011年
3 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
4 郑古蕊;杨鸣;;沈阳城市生态环境可持续发展能力分析[A];创新沈阳文集(D)[C];2009年
5 郭炜强;燕飞;黄儒乐;韩宁;;基于视频图像的森林火灾烟雾识别方法[A];第九届全国信息获取与处理学术会议论文集Ⅱ[C];2011年
6 陈联裙;张群;张锦水;潘耀忠;;实割实测数据支持下的县级尺度冬小麦产量遥感估测[A];全国农业遥感技术研讨会论文集[C];2009年
7 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
8 李宏伟;蔡畅;李勤超;;基于地理本体的空间数据集成研究[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
9 王婷;;浙江省城乡统筹和经济发展关系的实证研究[A];成渝地区城乡统筹与区域合作研讨会论文集[C];2007年
10 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
2 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
3 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
4 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
5 张顺恒;闽东南桉树人工林生态培育机制研究[D];福建农林大学;2010年
6 张慧斌;Deep Web查询接口及查询结果抽取研究[D];南开大学;2010年
7 杨晓东;城市商业银行跨区域经营问题研究[D];南开大学;2010年
8 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
9 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
10 丁轶群;基于概率生成模型的文本主题建模及其应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 张艳;柳州市城镇土地集约利用研究[D];华中农业大学;2010年
2 樊敬川;Deep Web数据库的选择研究[D];河北大学;2009年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
5 吕媛媛;基于本体的物流信息集成系统的研究[D];山东科技大学;2010年
6 岳海鸥;基于Ajax和Soap Service的应用框架及实现方法研究[D];山东科技大学;2010年
7 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
8 赵永华;多学科本体构建与集成技术研究[D];山东科技大学;2010年
9 韦福巍;广西入境旅游市场时空变化特征研究[D];广西师范学院;2010年
10 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 钟义信;;论“信息-知识-智能转换规律”[J];北京邮电大学学报;2007年01期
2 王长青;张一农;许万里;;运用最小二乘法确定后评估指标权重的方法[J];吉林大学学报(信息科学版);2010年05期
3 支家强;赵靖;辛亚娟;;国内外绿色建筑评价体系及其理论分析[J];城市环境与城市生态;2010年02期
4 李云岭,靳奉祥,季民;多模板电子地图研究[J];测绘工程;2002年02期
5 王家耀,周海燕,成毅;关于地理信息系统与决策支持系统的探讨[J];测绘科学;2003年01期
6 毛炜青;;交互式基础地理数据制图综合方法的研究[J];测绘科学;2009年04期
7 马俊;王光霞;张令逵;刘健;;多用途多尺度专题地图快速制图设计模式[J];测绘科学;2011年06期
8 马俊;王光霞;薛志伟;齐晓飞;张元源;;智能化专题地图快速设计制作研究[J];测绘科学;2012年03期
9 邓跃明,翟娅娟,刘治枝;基于MapInfo的专题地图制作[J];测绘通报;2001年07期
10 江南;夏丽华;代亚贞;;基于模板技术的电子地图显示风格转换的研究[J];测绘通报;2007年11期
中国博士学位论文全文数据库 前10条
1 周栩;本体工程中若干问题的研究[D];吉林大学;2011年
2 解滨;信息系统中的知识获取与不确定性度量的若干问题研究[D];河北师范大学;2011年
3 何明芮;个体层面的隐性知识认知及显性化研究[D];电子科技大学;2011年
4 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
5 陈向东;网络环境下的跨学科知识共享[D];华东师范大学;2005年
6 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
7 付相君;基于本体和Semantic Web技术的产品知识集成基础研究[D];浙江大学;2005年
8 顾芳;多学科领域本体设计方法的研究[D];中国科学院研究生院(计算技术研究所);2004年
9 李治;基于知识工程和数字仿真的产品远程定制方法研究与应用[D];上海交通大学;2007年
10 杨化林;基于知识的注塑模具设计若干技术研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 李豪;人工神经网络知识获取技术在夹具设计系统中的应用[D];西北工业大学;2003年
2 王国琴;基于语义检索的概念空间研究[D];南京理工大学;2004年
3 苏小红;基于人工神经网络的燃气短期负荷预测研究[D];重庆大学;2005年
4 胡珉;基于领域本体的知识获取和重用技术研究[D];北京化工大学;2006年
5 杨宇航;基于内容与链接分析的重要Blog信息源发现[D];哈尔滨工业大学;2006年
6 宋爽;共现分析在文本知识挖掘中的应用研究[D];南京理工大学;2006年
7 李爱旗;重庆市小城镇居住建筑热环境分析和建筑冷、热负荷预测研究[D];重庆大学;2006年
8 吴贤;挖掘社会化标注服务语义万维网[D];上海交通大学;2007年
9 贾黎莉;Ontology构建中概念间关系的研究[D];中国农业科学院;2007年
10 毋建军;基于Topic的Blog隐含社区发现[D];太原理工大学;2007年
【二级引证文献】
中国期刊全文数据库 前2条
1 李亚婷;马费成;;基于标签共现的社会网络分析研究[J];情报杂志;2012年07期
2 高新陵;王正兴;;“十一五”期间我国文献情报领域知识发现研究综述[J];图书情报工作;2011年24期
中国硕士学位论文全文数据库 前2条
1 艾明;面向海量数据的云存储系统实现与应用研究[D];南京理工大学;2012年
2 高舒;社会标注语义本体研究[D];郑州大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 林鸿飞,高天,姚天顺;中文文本的可视化表示[J];东北大学学报;2000年05期
2 邱广君,张俐,王宝库,朱靖波,邱波;汉语信息处理中的语义关系类型分析[J];东北大学学报;1998年01期
3 肖健华,吴今培,杨叔子;基于启发式知识的属性约简方法及其在评价体系中的应用[J];系统工程;2002年01期
4 湛燕,陈昊,袁方,王丽娟;文本挖掘研究进展[J];河北大学学报(自然科学版);2003年02期
5 李静梅,孙丽华,张巧荣,张春生;一种文本处理中的朴素贝叶斯分类器[J];哈尔滨工程大学学报;2003年01期
6 李晓黎,刘继敏,史忠植;概念推理网及其在文本分类中的应用[J];计算机研究与发展;2000年09期
7 周水庚,关佶红,胡运发,周傲英;一个无需词典支持和切词处理的中文文档分类系统[J];计算机研究与发展;2001年07期
8 林鸿飞;基于示例的文本标题分类机制[J];计算机研究与发展;2001年09期
9 李荣陆,胡运发;基于密度的kNN文本分类器训练样本裁剪方法[J];计算机研究与发展;2004年04期
10 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
【相似文献】
中国期刊全文数据库 前10条
1 李嘉佑,何清,史忠植;机器学习与网络信息处理[J];计算机工程与应用;2004年33期
2 孔鲁文;王桂萱;张慧敏;;改进的本体中概念相似度计算方法[J];计算机应用与软件;2010年02期
3 安宏津;马英瑞;;一种面向Web服务的语义匹配方法[J];电脑学习;2010年06期
4 陈世亮;李战怀;袁柳;;一种基于概念层次的图像检索方法[J];计算机科学;2008年04期
5 刘景方;邹平;张朋柱;齐峰;;一种改进的本体概念语义相似度算法研究[J];武汉理工大学学报;2010年20期
6 郭勇;;基于语义的Web文本分析技术[J];计算机工程;2007年11期
7 张柳松;;基于本体的智能检索系统的研究[J];微计算机信息;2007年33期
8 张映海;何中市;陈永锋;;搜索引擎结果中Web文档的排序研究[J];计算机与数字工程;2007年02期
9 张映海;;基于概念语义同义扩展的文本检索研究[J];计算机与数字工程;2008年04期
10 李景正;;论文献分类语言的语义力问题[J];情报科学;1987年04期
中国重要会议论文全文数据库 前8条
1 殷红伶;;“‘主语→宾语’提升”构式的概念结构分析[A];第四届全国认知语言学研讨会论文摘要汇编[C];2006年
2 彭宣维;;及物性结构式及概念语义隐喻[A];第四届全国认知语言学研讨会论文摘要汇编[C];2006年
3 王连诚;马强;;基于概念权重的本体相似度计算[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
4 余丽娜;曾东京;;框架语义学在双语网络词典编纂中的应用——从FrameNet看语义和语法标注[A];中国辞书学会双语词典专业委员会第七届年会论文集[C];2007年
5 张亮;尹存燕;陈家骏;;基于语义树的中文词语相似度计算与分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 赵荣娟;王丹;;一种从关系数据库提取本体的方法[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
7 刘伟志;梁宁建;高旭辰;;中国大学生第二语言知识的心理表征特征[A];第十届全国心理学学术大会论文摘要集[C];2005年
8 管芳;刘志洪;顾宁;宗宇伟;丁志刚;张绍华;张泉;;船舶工程图纸的语义分类与查询[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国博士学位论文全文数据库 前7条
1 郭勇;基于语义的网络知识获取相关技术研究[D];国防科学技术大学;2007年
2 王鑫印;无结构和半结构信息检索相关技术研究[D];复旦大学;2007年
3 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年
4 刘紫玉;多专业领域本体的构建及语义检索研究[D];北京交通大学;2010年
5 田朝霞;英语双及物小句研究—递送物的五个主要变体[D];南京师范大学;2007年
6 刘慧;信息检索中用户需求的概念分析研究[D];上海交通大学;2009年
7 陈婷婷;视觉运动追踪中的信息整合过程[D];首都师范大学;2013年
中国硕士学位论文全文数据库 前10条
1 王磊;基于概念语义空间的语义查询扩展技术研究[D];河南科技大学;2012年
2 蒋冀翔;基于非负矩阵分解的信息获取方法研究[D];东南大学;2006年
3 代书;基于概念语义分析的文本聚类研究[D];东北师范大学;2008年
4 崔宁;单音节颜色词研究[D];上海交通大学;2007年
5 张映海;基于概念的中文文本检索研究[D];重庆大学;2007年
6 唐成;答疑系统中基于概念的搜索引擎的设计与实现[D];国防科学技术大学;2007年
7 程珊珊;语义Web服务语义匹配算法的研究与实现[D];北京邮电大学;2009年
8 郑美花;语词组合的概念隐喻解释[D];曲阜师范大学;2009年
9 陈尧;基于概念相似度计算的本体映射算法的研究[D];<源映射实体名称>|<目标映射实体名称>;2009年
10 杨刚;基于本体的语义Web服务匹配技术研究[D];江西理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026