收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向数据集应用的LOD词表分类导航研究

马文雯  
【摘要】:词表为用户描述实体概念提供了一系列权威术语,解决了多义词以及同义词的歧义问题。词表为关联数据集提供了可共享的属性及属性值集合,为数据添加明确的语义关系,推动了结构化数据网络的形成与发展。因此词表是关联数据的基础,语义关系的核心。由于不同词表构建的方式以及面向的对象不同,所涉及的语种、涵盖的领域存在差异,使用这些词表描述网络资源以及进行检索也有所差异,用户采用何种词表来对关联数据集资源进行描述造成了诸多困扰。词表的主题不同、表达形式不同、侧重点不同,造成用户无法准确的使用词表对数据集进行细粒度描述,增加了用户检索的负担。因此针对目前词表与数据集的互操作性差,应用范围低等问题,通过应用场景对词表进行分类体系的构建,使词表的分类更加细致,从而方便用户快速精确的使用词表对数据集资源进行描述和互操作,提高用户的检索效率和词表的利用率,使词表的应用更具针对性。本文基于LOD关联数据云中词表在数据集的应用情况,深入探讨词表的分类体系理论与方法。主要围绕以下几个方面开展:(1)分类体系构建和聚类算法研究的相关理论。通过分析分类体系理论以及聚类算法类型,选择相应的算法对词表进行不同维度的分类。(2)词表聚类的特征选择。详细分析LOD关联数据云中数据集主题、词表主题定义以及词表类的主题特征,为后续词表分类结果的精准度奠定基础。(3)词表聚类的实证研究。将数据集的主题经过数据清洗等一系列统一化处理,转化为文档向量,利用keans++算法对文档向量进行聚类分析,共得到15个数据集主题,将得到数据集的聚类主题与词表的主题进行相似度计算,进而实现对词表的分类。同时将不同词表类进行相似度计算,根据类之间的语义关系,实现对词表类的层次划分,最终得到34个类,多数类有2-3个层级,层级关系不够紧密。(4)对词表的分类结果进行了分类导航原型图设计,原型图具备两种功能,可以检索和类目浏览选择,实现对词表不同维度的分类,方便了用户检索以及浏览。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 张永杰;刘才铭;张雁;唐喻;倪康惠;;一种基于公开网络数据集的异常分析系统[J];现代信息科技;2020年19期
2 刘洋;李海燕;贾李蓉;刘扬;甄思圆;孙华君;熊婕;;GB/T 38327-2019《健康信息学 中医药数据集分类》国家标准适用性评价研究[J];中国中医药图书情报杂志;2021年01期
3 黄国森;阮芳;;基于镶嵌数据集的多源影像标准分幅裁剪[J];测绘与空间地理信息;2021年03期
4 茅枫;张燕娜;刘乾宇;闫思桃;胡倩;罗妍;李金斌;付磊;;国外公开乳腺影像数据集的现状分析及其启示[J];中国医学科学院学报;2021年02期
5 王兆伟;彭钰琳;尼玛顿珠;梁泽森;;对人脸识别数据集偏见现象的研究[J];电子元器件与信息技术;2021年03期
6 陈志科;余克服;苏奋振;左秀玲;;南海诸岛珊瑚礁热压力及其预测数据集(1982-2100)的研发[J];全球变化数据学报(中英文);2021年01期
7 王中洲;陈亮;魏胜楠;;基于深度学习的长尾数据集分类精度提高的研究[J];沈阳理工大学学报;2021年05期
8 叶瑜;李俊;卢钰洁;方修琦;;六个全球历史土地覆盖数据集数据来源的对比分析[J];北京师范大学学报(自然科学版);2019年06期
9 张向清;杨锐;白涛;王金妮;;高速公路场景下基于深度学习的数据集建立[J];数字技术与应用;2020年02期
10 李红蕾;;构建图形图像数据集的方法概述[J];计算机产品与流通;2020年08期
11 黄佳妮;王君领;沈嘉裕;王伊杨;张约翰;王佳敏;胡吉明;陆伟;;多国议会数据集及平台建设研究[J];情报工程;2020年02期
12 杨波;赵扬;焦红;;国际主要科学数据集检索平台对比研究[J];情报工程;2020年01期
13 李英勇;赵英莉;;实验室化学品纯化方法数据集[J];中国科学数据(中英文网络版);2020年02期
14 徐挺军;赵英莉;李英勇;;化学药物数据集[J];中国科学数据(中英文网络版);2019年01期
15 马勇刚;刘素红;;中亚地区陆表物候逐年数据集(1982–2015)[J];全球变化数据学报(中英文);2020年01期
中国重要会议论文全文数据库 前20条
1 邓聪;傅少荣;高嘉锜;潘嘉辉;;基于不完备数据集近邻聚类的缺失用电信息填补算法[A];福建省电机工程学会2020年学术年会获奖论文集(下册)[C];2021年
2 叶蓓;田淑芳;成秋明;葛云钊;;基于GF-5 AHSI高光谱影像的岩性填图应用研究[A];首届全国矿产勘查大会论文集[C];2021年
3 卢功林;葛俏;王玉娟;谈世磊;曹红伟;卢志鹏;;基于深度学习的不停车自动超载检测方法[A];2020中国自动化大会(CAC2020)论文集[C];2020年
4 王羽;姜晓夏;陆辰;王振宇;王珩;吴振锋;;军事机器阅读理解数据集构建与评估[A];2019第七届中国指挥控制大会论文集[C];2019年
5 缪国宇;刘洪鹏;苏文学;刘荣生;赵相东;;基于数据仓库的企业指标分析系统[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
6 王子恒;齐勇刚;刘军;;路面交通标志检测调研:数据集及算法[A];2018中国汽车工程学会年会论文集[C];2018年
7 郭景峰;杜京;马倩;邹晓红;;一种基于数据集性质的快速等差模式聚类算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 孟烨;张鹏;宋大为;王雷;;信息检索系统性能对数据集特性的依赖性分析[A];第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集[C];2013年
9 田捷;;三维医学影像数据集处理的集成化平台[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
10 冷传良;;飞机化铣成样板划线数据集设计方法探索[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
11 范明;魏芳;;挖掘基本显露模式用于分类[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
12 张锦明;游雄;;基于LOD的选取模型在电子地图多尺度显示中的研究[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
13 刘通;张宇献;;基于加权平均数的模糊聚类有效性函数[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
14 林荔;林铖;;福建省小时风速数据集研制及应用[A];第35届中国气象学会年会 S20 深度信息化:应用支持与智能发展[C];2018年
15 于爱荣;刘晓明;曹雷;王俊;;NET Web Services数据集在Delphi中的处理与研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
16 冷传良;;基于CATIA V6的三维制造数据集的设计与管理[A];探索 创新 交流——第六届中国航空学会青年科技论坛文集(上册)[C];2014年
17 李健伟;曲长文;邵嘉琦;彭书娟;;基于深度学习的SAR图像舰船检测数据集及性能分析[A];第五届高分辨率对地观测学术年会论文集[C];2018年
18 苏力德;;基于PDM系统实现民机数据的管理[A];第十届沈阳科学学术年会论文集(经济管理与人文科学分册)[C];2013年
19 刘斐;樊华;金松昌;贾焰;;一种新型k匿名隐私保护算法[A];第27次全国计算机安全学术交流会论文集[C];2012年
20 张路;袁晓洁;刘芳;窦志成;;大规模数据集的分布式索引机制研究[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
中国博士学位论文全文数据库 前20条
1 皇群博;晴空条件FY-3C大气微波垂直探测资料变分同化研究[D];国防科技大学;2018年
2 马飞;复杂场景下的行人重识别关键技术研究[D];武汉大学;2019年
3 孙秀宝;基于CMA-LSAT v1.0数据集的近百年全球陆表气温变化研究[D];南京信息工程大学;2018年
4 陈迪;耕地数量与质量时空变化遥感监测研究[D];中国农业科学院;2019年
5 李星达;钢琴多音估计问题和音乐生成问题的深度学习方法[D];吉林大学;2019年
6 刘皓;基于深度学习的行人再识别问题研究[D];合肥工业大学;2017年
7 王建培;聚类有效性分析及其在电学层析成像中的应用[D];天津大学;2017年
8 杨勋;跨视域行人再识别若干问题研究[D];合肥工业大学;2017年
9 李超;高阶多数据集建模新方法与应用研究[D];哈尔滨工程大学;2017年
10 申彦;大规模数据集高效数据挖掘算法研究[D];江苏大学;2013年
11 严远亭;不完整数据集的多视角集成分类研究[D];安徽大学;2016年
12 谷琼;面向非均衡数据集的机器学习及在地学数据处理中的应用[D];中国地质大学;2009年
13 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
14 吴毅;数字人全身分割数据集的建立及人体胸腔与盆腔的数字化研究[D];第三军医大学;2012年
15 吴国清;科学计算时变数据集的数据挖掘算法研究[D];中国工程物理研究院;2009年
16 黄昭权;小数据集差分干涉雷达地表形变监测[D];浙江大学;2010年
17 赵丕杰;LOD在直扩系统微弱信号检测中的应用与研究[D];哈尔滨工程大学;2009年
18 吴昊;基于合成数据集的图像处理深度学习方法研究[D];兰州大学;2021年
19 史卫亚;大规模数据集下核方法的技术研究[D];复旦大学;2008年
20 Zakria;基于深度学习的快速车辆再识别研究[D];电子科技大学;2020年
中国硕士学位论文全文数据库 前20条
1 马文雯;面向数据集应用的LOD词表分类导航研究[D];山西大学;2021年
2 丁瑶;基于融合机制的航拍目标检测与识别[D];厦门大学;2019年
3 肖娜;基于密度和方向的聚类算法研究[D];湖南大学;2019年
4 乐雨泉;基于句法和语义的句子表示方法[D];湖南大学;2019年
5 徐慧;社交商务中客户画像的研究[D];西南财经大学;2019年
6 周张萍;面向课堂教学的字幕生成关键技术研究[D];厦门大学;2019年
7 邓利平;基于数据集相似性的分类算法自动选择研究[D];深圳大学;2019年
8 陈康;超限学习机拓展研究及其脑电分类应用[D];杭州电子科技大学;2019年
9 刘文斌;中式菜肴食材数据集的构建及其分类算法研究[D];武汉轻工大学;2019年
10 余冠华;基于多属性铁路事故数据集的聚类和关联规则分析方法研究[D];北京交通大学;2019年
11 陈磊阳;基于改进VGGNet的不透水面信息提取应用研究[D];河南大学;2019年
12 周听听;基于深度学习的医保异常检测研究[D];电子科技大学;2019年
13 陈远鹏;基于长时间可穿戴社交数据集的语音分割方法的研究[D];电子科技大学;2019年
14 范晨雪;基于交通类数据集的我国政府开放数据分析[D];山西大学;2019年
15 江思源;面向混合数据集的聚类方法研究[D];合肥工业大学;2019年
16 张泰然;面向实时的视频人体分割算法研究[D];北京交通大学;2019年
17 刘娜;基于LSTM细分类的人脸图像年龄估计研究[D];华北电力大学;2019年
18 闫东;大规模人脸数据集快速构建方法与人证比对算法研究[D];华北电力大学(北京);2019年
19 甘翔;基于深度学习和生成对抗网络的图标设计研究[D];华南理工大学;2019年
20 杨林;面向不完备数据的三支聚类方法研究[D];重庆邮电大学;2018年
中国重要报纸全文数据库 前20条
1 记者 张梦然;最大规模婴儿微生物组数据集建立[N];科技日报;2018年
2 记者 张梦然;癌症学研究公布最新数据集[N];科技日报;2018年
3 记者 季张颖;上海已累计开放2100项公共数据集[N];上海法治报;2019年
4 记者 王莉英;行政审批网上全流程办理率年底超80%[N];深圳特区报;2017年
5 记者 金昶 通讯员 陈斯音;我国发布首款全球海洋Argo网格数据集产品[N];中国海洋报;2017年
6 中国青年报·中青在线记者 谢宛霏;为AI领域“造血”[N];中国青年报;2017年
7 记者 罗旭;全球人工智能挑战赛开赛[N];光明日报;2017年
8 记者 刘钊 通讯员 徐文慧 杨溯;自主研发数据集显示今年上半年最热[N];中国气象报;2015年
9 冉瑞奎 刘晓林 戴艳萍;均一化历史气温数据集问世[N];中国气象报;2006年
10 通讯员廖雅琴记者冯竞;“国人数字化可视人体数据集”完成[N];科技日报;2003年
11 记者 张梦然;科学家以图片数据集揭秘“生命奥秘”[N];科技日报;2015年
12 王素琴刘晓林 通讯员 王新华;宇如聪强调用好16个新数据集产品[N];中国气象报;2008年
13 记者 刘钊;自研数据集显示今年将成最热一年[N];中国气象报;2015年
14 记者 刘浪 通讯员 廖雅琴;中国首套数字化“可视人”数据集在渝通过成果鉴定[N];重庆日报;2003年
15 本报记者 刘霞;AI助力抗“疫” 美发布新冠病毒数据集[N];科技日报;2020年
16 地学系;地学系阳坤课题组发布中国区域高分辨率气象驱动数据集[N];新清华;2020年
17 记者 陈玮;科学调查听民意 统计数据集建议[N];兰州日报;2014年
18 余海蓉梁超;四川研制高质量省级气象数据集[N];中国气象报;2007年
19 昌家杰 邹莹 本报记者 于莘明;探究“数字人”的虚与实[N];科技日报;2005年
20 记者 王宝军 通讯员 王新华;2009年气候变化重点数据集建设完成[N];中国气象报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978