收藏本站
《华中师范大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

面向Web3.0的大众分类研究

熊回香  
【摘要】:随着社会化软件的发展,越来越多的Web2.0网站以应用的开放性、技术的渗透性和信息传播的交互性等特性及其读写并存的表达方式、社会化的联合方式和便捷化的体验方式等优势,影响和改变着人们的工作和学习方式;同时,Web2.0自身具有的开放性、去中心化、聚合性、高度交互性和创新性等特性,也使得越来越多的用户参与到网络信息的创造和发布中。然而,一方面,伴随着信息源和信息量的激增,衍生出了信息杂乱无章、信息纯净度和可信度降低、搜索引擎精准度下降等问题;另一方面,用户迫切希望通过便捷的互动交流和协同共享方式来及时准确地获取符合自身需求的信息和知识。面对这些问题,注重信息筛选与个性化信息聚合,以“个性、精准和智能”为核心理念的Web3.0模式应运而生;这一新型模式为问题的解决带来了新的希望。 Web3.0是以Web2.0为基础,因此,大众分类(Folksonomy), Web2.0环境下产生的新型信息分类法仍然是Web3.0环境下的主要信息分类方法之一。但是,大众分类在给网络用户提供方便、自由的标签标注和检索的同时,也存在着诸如标签的多样性、模糊性、扁平化结构和语义关系缺乏等缺陷;这些缺陷制约着Web3.0“个性、精准和智能”这一核心理念的真正实现,因此,从Web3.0对大众分类法的需求出发,对大众分类体系的优化展开相关研究,是非常有必要并且具有重要的意义。 基于此,本文综合运用社会学、语言学、数学统计、计算机科学等多学科的理论,使用实证分析、数学统计学、社会网络分析、数据挖掘等方法,充分利用中文语料资源对大众分类的优化展开研究。全文共分为8章,每章的具体内容如下: 第1章,对本论文的选题背景、研究现状和研究意义进行了全面的阐述,提出了研究目的和研究内容,并对研究方法和研究思路进行了介绍,总结了本研究的主要创新点。 第2章,主要是针对研究所涉及到的相关理论进行简要述评。首先,对大众分类的定义与内涵、大众分类的运行机制、大众分类的类型、大众分类的基本特征等进行阐述;接着对语义网的基本思想、体系结构、本体论等内容进行了归纳性的介绍:然后,对Web3.0的产生、Web3.0的内涵和特征、Web3.0的技术支撑以及现状等进行分析总结;最后剖析了大众分类、语义网及Web3.0三者之间的关系,为后续的研究提供了思路。 第3章,首先分析了标签的内涵及特点,接着通过典型中文Web2.0网站展开标签的实证研究,主要分析了标签的语言特征、标签的分布规律、标签与用户和资源的关系、标签的质量及规范性、标签的分类体系及标签的推荐等,从而明晰了大众分类体系的运行机制和不足,为后续研究思路的形成提供依据。 第4章,首先比较分析了大众分类与情报检索的受控语言之间的异同;接着阐述了标签库的构建方法,与此同时,把中文语义词典《同义词词林》引入到标签库的构建中,通过词语相似度比较来规范标签库中的语词;然后从标签的推荐、用户管理机制、以及垃圾标签处理几个方面探讨了用户标注的控制;最后分析了用户标签优选的机制。本章研究的目的是提高标签的质量,为挖掘标签间的语义奠定基础。 第5章,首先详细地剖析了Tag资源自动分类的过程,构建了Tag资源自动分类的算法模型,在Tag资源的自动分类模型中,借鉴了文本自动分类的思想,用标签的使用频率表示Tag资源的向量空间,并在Tag资源的向量表示中,引入《同义词词林》进行向量的语义表示,从而提高自动分类的精度;接着分析如何利用标签库构建标签的层级,并通过内容管理系统Drupal介绍了标签层级化的实现方法。本章的研究主要是结合传统分类法的思想,构建标签的层级,从而为用户提供标签和导航,进而提高标签的检索效率。 第6章,首先分析了标签的聚类及其相关算法;接着分别从标签的共现分析、标签的向量表示、关联规则挖掘三个方面探讨了标签或Tag资源的自动聚类,在聚类算法的选择上,综合考虑不同聚类算法的优点,并基于不同的数据模型选择了不同的聚类算法,同时在标签样本数据集进行了理论上的验证,证明了这几种算法的可行性。这部分的研究为标签与本体的结合奠定了基础。 第7章,首先探讨和分析了标签概念空间的构建,并分别运用不同的算法构建了标签的层次空间和网状空间,同时用实例证明了其可用性和有效性;接着详细地分析了标签与本体的映射机制和方法,并在进行概念的匹配过程中,引入了另一个中文语义词典《知网》进行概念间的相似度比较,增加了匹配度的可靠性;最后从标签的语义控制入手,提出了标签本体模型的概念,并对目前典型的标签本体模型进行详细地比较,同时以SIOC本体模型为例,介绍了标签的语义控制过程。本章的内容主要是围绕标签语义关系的提取展开相关研究,其研究成果有助于语义网(Web3.0)的最终实现。 第8章,对论文进行了总结,总结了论文的主要研究内容,得出的主要结论,主要创新之处,并剖析了研究中存在的不足,基于此展望了未来的研究重点和方向。
【学位授予单位】:华中师范大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:G354

【相似文献】
中国期刊全文数据库 前10条
1 晁卫华;;基于Web3.0的图书馆服务创新研究[J];浙江高校图书情报工作;2010年05期
2 张亚培;田雪;;基于Web3.0的远程教育资源建设与应用研究[J];课程教育研究;2015年20期
3 陶文冲;;基于Web3.0的搜索引擎把关行为研究[J];东南传播;2016年12期
4 吕旸;;浅议Web3.0时代新闻记者的基本技能[J];现代经济信息;2017年15期
5 田梅;;基于Web3.0的信息共享空间构建[J];现代情报;2016年04期
6 叶晨;;Web3.0时代下的自媒体传播——以柴静的《穹顶之下》为例[J];新闻世界;2015年04期
7 唐锋;;“Web3.0”时代下“微商”的成本分析[J];商;2015年39期
8 苗艳聪;;Web3.0时代服饰品牌形象的广告传播探析[J];河北科技大学学报(社会科学版);2014年02期
9 刘莉;;探析Web3.0环境下个人知识地图的构建[J];内蒙古科技与经济;2013年21期
10 倪鸿;崔艳清;;Web3.0环境下企业知识管理系统构建的对策分析[J];中国商贸;2013年04期
中国重要会议论文全文数据库 前4条
1 张彩虹;;娱乐政治——WEB3.0时代的电影表达[A];新世纪新十年:中国影视文化的形势、格局与趋势——中国高等院校影视学会第十三届年会暨第六届中国影视高层论坛论文集[C];2010年
2 徐雅丽;;浅谈Web3.0及其在图书馆中的应用[A];福建省图书馆学会2011年学术年会论文集[C];2011年
3 余璐;;基于Web3.0的地方志信息化平台建设刍议[A];2017年地方志与地方史理论研讨会论文汇编[C];2017年
4 王琴;穆晓艳;;Web3.0技术在教育中的应用初探[A];计算机与教育:理论、实践与创新——全国计算机辅助教育学会第十四届学术年会论文集[C];2010年
中国重要报纸全文数据库 前4条
1 实习生 温才妃;虚拟旅游 大学生创业Web3.0[N];中国青年报;2010年
2 华矩科技总经理 谭海华;打破大数据利用的篱笆[N];中国保险报;2017年
3 项丹 罗飞鹏;国网浙江电力建设客户行为信息标签库[N];国家电网报;2016年
4 李牧编译;语义网:Web3.0为何盖不过Web 2.0的风头[N];中国计算机报;2007年
中国博士学位论文全文数据库 前1条
1 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 孙小丽;web3.0时代整合营销传播的典型运作模式研究[D];南昌大学;2016年
2 杜鹃鸿;Web3.0环境下的品牌互动传播实现路径研究[D];华南理工大学;2014年
3 张伟芳;Web3.0环境下我国高校电子校务发展与应用研究[D];燕山大学;2015年
4 高华;Web3.0环境下图书馆个性化信息服务研究[D];湘潭大学;2012年
5 刘继忠;面向Web3.0的网络新媒体业务运营支撑系统[D];华南理工大学;2010年
6 王湛;非典型性部落化—Web3.0时代以社会化媒体为中心的网络传播模式[D];广西大学;2012年
7 黄琛;趋向web3.0:网络营销的变革及可能[D];浙江大学;2009年
8 朴石峰;基于web3.0网络爬虫自主学习技术研究[D];吉林大学;2015年
9 龙宇;支持数据一致性的Web3.0服务平台的设计[D];南京邮电大学;2016年
10 吴运强;基于Web3.0的水文信息个性化聚合服务平台研究与实现[D];电子科技大学;2015年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026