收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于上下文的统计关系学习研究

田永鸿  
【摘要】: 统计机器学习方法假设所有数据都是具有相同结构的实体,数据之间是独立且同分布的。然而在现实世界中存在着大量的半结构化关系数据,如超文本、Web网页(网站)、Web图像、数字图书、教育资源等,这些数据集合由不同类型的数据对象组成,数据对象本身具有复杂的内部结构,同时不同数据对象之间通过(超)链接、引用等联系起来构成关系数据集合。传统的统计学习方法忽略了数据对象间的关系结构,而这些语义信息却有助于使学习算法具有更好的性能。因此本论文研究的中心内容就是如何在统计机器学习中明确地利用数据实例间的关系信息来构建健壮的学习模型。 本论文采用的主要方法论是上下文建模与分析。在研究中,上下文被定义为使得目标对象具有唯一的和可理解的语义的关联对象和其他影响因素的集合;相应地,上下文依赖关系则是传达了明确语义相关的“关系”。论文在对上下文分析和建模、统计关系学习等两方面的研究现状进行全面综述的基础上,以不同的应用问题为背景,开展了基于上下文分析的统计关系学习方法的研究。创新和研究成果如下: 第一,提出了基于多粒度语义模型的Web站点挖掘方法。Web站点可以看作是一种具有复杂结构的超文本文档。论文用多粒度树来作为站点的描述模型,同时提出四种上下文模型来刻画树中结点间的主题相关关系。在此基础上,论文采用隐Markov树作为树结构的统计模型,研究了两阶段分类和多粒度分类等两个Web站点分类算法,以期通过利用结点间的上下文依赖关系来优化分类性能。同时,还利用两阶段文本去噪程序和基于熵的页面树动态剪枝策略来减少网页下载开销并进一步提高分类准确率。实验结果表明,多粒度语义模型能有效地刻画复杂对象内部的上下文依赖关系,而相应的分类算法能在较少的时间开销内达到较高的站点分类准确率。 第二,通过扩展依赖网络模型,提出了一种上下文依赖网络模型(CDN)来刻画链接结构中的上下文主题依赖关系。在各种现实的链接关系数据(如Web)中,噪声链接或不相关“关系”是普遍存在的。为刻画这种复杂的链接规律性,CDN模型用链接特征和互信息来定量刻画链接对象间的上下文依赖关系,并利用一个简单但有效的上下文优化方法来优化对象的关系近邻,从而有效地减少噪声链接信息对分类过程的影响。CDN模型具有对链接特征的选择能力,易于适应不同的内容模型,并比传统的DN具有更简单的参数估计。实验结果表明,CDN模型在噪声数据集上具有较好的健壮性,并能为链接对象的属性提供较好的预测。 第三,提出了链接语义核来刻画链接对象之间的语义关系。特别地,将链接图中的语义相关关系看作一种扩散过程,提出了一种“语义扩散核”,并在核空间利用特征分解来获得潜在链接语义核。在此基础上描述了两类基于链接语义核的算法,即核化上下文依赖网络(KCDN)来进行协作分类,以及基于链接语义核的相关页发现算法。论文在


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 潘纲;李石坚;陈云星;;ScudContext:信息-物理空间融合的大规模环境上下文服务[J];浙江大学学报(工学版);2011年06期
2 吴映波;王旭;林云;;面向服务的领域分析与建模框架[J];计算机工程与设计;2011年08期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 广凯;魏鲲;金浩;潘金贵;;一种基于本体的上下文模型[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
2 翟辉琴;王明孝;雷蓉;;一种适合网络传输的遥感影像压缩方法[A];中国测绘学会九届三次理事会暨2007年“信息化测绘论坛”学术年会论文集[C];2007年
3 叶喜勇;陶霖密;王国健;;基于动作理解的隐式交互[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
4 黄帆;汤庸;道炜;冀高峰;吴桂宾;王鹏;;上下文技术在群体感知中的研究与应用[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
5 杨学志;范良欢;郎文辉;;基于结构保持区域模型和MRF的SAR海冰图像分割[A];第八届全国信息获取与处理学术会议论文集[C];2010年
6 卜颖毅;李俊;陈沙寻;韩皓;陶先平;吕建;;上下文感知计算研究与进展[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
7 刘青;连祥鉴;;基于上下文的Web服务动态组合[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
8 汪彬;傅志中;;H.264/AVC的熵编码概述[A];2006中国西部青年通信学术会议论文集[C];2006年
9 亢孟军;王贝;杜清运;;上下文敏感的空间信息服务智能推送研究[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
10 马骏;曹建农;马超;陶先平;;基于集合的上下文建模和操作[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
中国博士学位论文全文数据库 前10条
1 林甲灶;构建个性化智能移动电子商务系统的关键技术与方法研究[D];兰州大学;2011年
2 李国强;基于用户偏好的个性化业务适变决策技术研究[D];北京邮电大学;2012年
3 田永鸿;基于上下文的统计关系学习研究[D];中国科学院研究生院(计算技术研究所);2005年
4 孙成敏;基于粗糙集的知识发现方法研究[D];吉林大学;2006年
5 伞兴;静态图像压缩方法研究[D];中国科学技术大学;2007年
6 孙舒杨;统计关系学习的若干问题研究[D];吉林大学;2006年
7 陈红新;基于提升小波的嵌入式图像与视频编码算法研究[D];天津大学;2006年
8 于鹏;统计关系模型学习方法的研究[D];吉林大学;2008年
9 周同;H.264及3D网格图形压缩算法研究[D];北京邮电大学;2011年
10 王继东;星载遥感图像实时压缩中的关键技术研究[D];国防科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 杨彬蔚;纺织印染图像分割算法的研究[D];浙江大学;2005年
2 李丹;基于行的低内存小波图像压缩研究[D];武汉大学;2004年
3 董世都;基于小波的图像压缩方法及其在视频压缩中的应用[D];重庆大学;2003年
4 刘国金;基于小波变换的视频压缩算法研究[D];重庆大学;2003年
5 严娜;基于上下文的语义Web服务发现框架及其应用[D];大连海事大学;2009年
6 徐益;基于似然关系模型的个性化推荐研究[D];吉林大学;2008年
7 杨黎;基于非高斯分布和上下文模型的小波去噪算法[D];四川大学;2005年
8 张旭东;行人检测技术研究[D];电子科技大学;2011年
9 徐华;基于可比较语料库的中英文词表构建研究[D];苏州大学;2012年
10 田永晔;基于普适计算的数字语音教学系统研究与设计[D];南京理工大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978