收藏本站
《天津大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

大规模生物医学语义关联数据集的查询关键技术研究

生兆花  
【摘要】:近年来,大规模语义数据Linked Data数据量呈现爆炸式的增长,其中生物医学数据集占据了相当大的比例。由于这些数据集分散且仅提供了有限的查询功能,没有充分出挖掘数据集中的有效信息,给用户提供一套综合的应用方案。因此,将RDF语义和生物学意义结合起来,研究其语义查询问题有着重要的理论意义和工程应用价值。 在详细分析DBpedia、SIDER、Diseasome、DailyMed和LinkedCT等11个数据集的基础上,研究开发了一个具有生物学意义的多数据集语义查询平台。为了保证RDF语义数据的一致性,设计基于MapReduce的不一致检验算法,对跨领域核心枢纽数据集DBpedia进行验证,得出不一致检验结果并给出解决方案;设计数据集关系挖掘算法,绘制出数据集关系图;通过对数据集之间关系的分析,提出了三种语义查询问题:查询疾病信息、根据疾病查询药物和查询药物副作用;以Cassandra作为底层储存库,在分布式条件下采用MapReduce方法完成数据的装载;采用路径查询理论给出了三种查询功能的算法设计和实现,实例查询结果展示了平台的有效性和优越性。 基于大规模生物医学语义关联数据集研究开发的语义查询平台,充分利用了语义Web相关技术,并与生物学意义相结合,为用户提供了一个实用且有效的查询平台,同时对于智能问题回答系统的构建也有一定的指导意义。
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.1;TP311.13

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 王鑫;冯志勇;杜朴风;饶国政;姜洋;李旭;生兆花;姜龙翔;;Jingwei:一种分布式大规模RDF数据服务器[J];计算机研究与发展;2011年S3期
【共引文献】
中国期刊全文数据库 前10条
1 厉剑;樊红;杜武;;空间信息RESTful网络服务语义注册方法研究[J];测绘地理信息;2013年06期
2 郎波;张博宇;;面向大数据的非结构化数据管理平台关键技术[J];信息技术与标准化;2013年10期
3 邵景峰;崔尊民;王进富;白晓波;;大数据下纺织制造执行系统的构建[J];纺织器材;2013年06期
4 张亚楠;谭跃生;;基于MapReduce的并行遮盖文本聚类算法[J];内蒙古科技大学学报;2013年03期
5 周国亮;朱永利;王桂兰;;CC-MRSJ:Hadoop平台下缓存敏感的星型联接算法[J];电信科学;2013年10期
6 王鹏;黄焱;刘峰;安俊秀;;大数据技术中计算与数据的协作机制[J];成都信息工程学院学报;2014年01期
7 杜政颉;王鹏;黄焱;郎福通;;一种基于Storm编程模型的迭代Topology方案[J];成都信息工程学院学报;2014年01期
8 范飞;黄文明;邓珍荣;;Oozie工作流在Mahout分布式数据挖掘中的应用[J];桂林电子科技大学学报;2014年01期
9 张晓辉;邸瑞华;李维铭;;基于Renyi熵的链接数据属性权重计算[J];北京工业大学学报;2014年01期
10 丁玉成;诸葛晴凤;沙行勉;;云计算环境下排序算法的性能分析[J];重庆大学学报;2014年04期
中国重要会议论文全文数据库 前9条
1 张德钦;饶克锋;顾进广;;基于语义的工业联合体数据集成机制[A];全国冶金自动化信息网2014年会论文集[C];2014年
2 乔媛媛;刘芳;凌艳;尹劲松;;云计算环境下MapReduce的资源建模与性能预测[A];2013年全国通信软件学术会议论文集[C];2013年
3 徐子伟;张陈斌;陈宗海;;大数据技术概述[A];系统仿真技术及其应用学术论文集(第15卷)[C];2014年
4 Xiaoguang Han;Jigang Sun;Wu Qu;Xuanxia Yao;;Distributed Malware Detection based on Binary File Features in Cloud Computing Environment[A];第26届中国控制与决策会议论文集[C];2014年
5 陈佐旗;余柏蒗;吴健平;;基于GPU通用计算的遥感数据处理——以计算地表太阳辐射值为例[A];第十八届中国环境遥感应用技术论坛论文集[C];2014年
6 白永超;付伟;辛阳;;基于Hadoop和Nutch的分布式搜索引擎研究与仿真[A];第十九届全国青年通信学术年会论文集[C];2014年
7 李超越;徐国胜;;Hadoop公平调度算法的改进[A];第十九届全国青年通信学术年会论文集[C];2014年
8 张恺玉;陈磊;;一种基于Hadoop架构的指挥系统大数据挖掘方法[A];第三届中国指挥控制大会论文集(上册)[C];2015年
9 朱健军;张彤;吴哲夫;;基于权值的Hadoop调度算法改进与实现[A];浙江省电子学会2014学术年会论文集[C];2014年
中国博士学位论文全文数据库 前10条
1 刘秀磊;基于词法分析和语义分析的本体集成研究[D];北京邮电大学;2012年
2 李健;云计算环境下最小化运营开销的调度技术研究[D];北京邮电大学;2013年
3 梁汝鹏;基于语义标注的地理信息服务关键技术研究[D];解放军信息工程大学;2013年
4 鲜国建;农业科技多维语义关联数据构建研究[D];中国农业科学院;2013年
5 王金宝;云计算系统中索引与查询处理技术研究[D];哈尔滨工业大学;2013年
6 韩晶;大数据服务若干关键技术研究[D];北京邮电大学;2013年
7 程祥;高效可靠的虚拟网络映射技术研究[D];北京邮电大学;2013年
8 李韧;基于Hadoop的大规模语义Web本体数据查询与推理关键技术研究[D];重庆大学;2013年
9 张乃静;基于林业科学数据的语义检索研究[D];中国林业科学研究院;2013年
10 唐富年;面向语义正确性的集成数据访问方法研究[D];国防科学技术大学;2012年
中国硕士学位论文全文数据库 前10条
1 侯超;基于自然语言处理的策略生成系统的设计与实现[D];西安电子科技大学;2013年
2 王林;基于SM/AMI的电力消费行为模式的分析[D];华北电力大学;2013年
3 梁婷婷;基于语义的数码相片标注与检索系统的开发[D];电子科技大学;2013年
4 张鼓华;食品出口作业支撑模型执行引擎的设计与实现[D];电子科技大学;2013年
5 李博;基于语义关系的高血压临床指南知识库构建[D];电子科技大学;2013年
6 陈贞;HDFS环境下的访问控制技术研究[D];重庆大学;2013年
7 张丹;HDFS中文件存储优化的相关技术研究[D];南京师范大学;2013年
8 刘朝霞;关联数据网络中的本体映射研究[D];浙江大学;2013年
9 潘吴斌;基于云计算的并行K-means气象数据挖掘研究与应用[D];南京信息工程大学;2013年
10 赵洪昌;云计算下的关联分析和模糊聚类研究[D];南京信息工程大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 谷琼;袁磊;宁彬;吴钊;华丽;李文新;;一种基于混合重取样策略的非均衡数据集分类算法[J];计算机工程与科学;2012年10期
2 唐永红;刘绪栋;;一种基于混合属性数据集的异常检测方法[J];科学技术与工程;2013年07期
3 佟平;分区数据集的结构、设计与实现[J];计算机工程与设计;1989年05期
4 胡明庆;;数据集读写问题的同步与互斥[J];江汉大学学报;1991年03期
5 李文魁,田蔚风,陈永冰;基于文件的数据集设计方法及其应用[J];微型电脑应用;2005年04期
6 韩慧;王路;温明;王文渊;;不均衡数据集学习中基于初分类的过抽样算法[J];计算机应用;2006年08期
7 王毅涛;;重要天气过程个例资料数据集网络管理系统[J];科技资讯;2006年21期
8 高嘉伟;梁吉业;;非平衡数据集分类问题研究进展[J];计算机科学;2008年04期
9 谷琼;王贤明;李文新;;基于非均衡数据集的新型混合重取样算法[J];武汉理工大学学报;2010年20期
10 ;《中国常用人口数据集》出版[J];人口研究;1994年04期
中国重要会议论文全文数据库 前10条
1 田捷;;三维医学影像数据集处理的集成化平台[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
2 范明;魏芳;;挖掘基本显露模式用于分类[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 冷传良;;飞机化铣成样板划线数据集设计方法探索[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
4 孟烨;张鹏;宋大为;王雷;;信息检索系统性能对数据集特性的依赖性分析[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
5 段磊;唐常杰;左劼;陈宇;钟义啸;元昌安;;基于基因表达式编程的抗噪声数据的函数挖掘方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 阎玮;柏文阳;张剡;;基于FP-Tree重构事务数据集的关联规则隐藏[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
7 苏力德;;基于PDM系统实现民机数据的管理[A];第十届沈阳科学学术年会论文集(经济管理与人文科学分册)[C];2013年
8 吴京生;封秀燕;;浙江自记降水数据集的制作过程[A];第四届长三角科技论坛论文集(下册)[C];2007年
9 刘斐;樊华;金松昌;贾焰;;一种新型k匿名隐私保护算法[A];第27次全国计算机安全学术交流会论文集[C];2012年
10 曹露燕;蒋晓云;孟凡荣;;基于数值型和分类型混合属性数据集的聚类算法研究[A];2006“数学技术应用科学”[C];2006年
中国重要报纸全文数据库 前10条
1 王素琴刘晓林 通讯员 王新华;宇如聪强调用好16个新数据集产品[N];中国气象报;2008年
2 记者 刘浪 通讯员 廖雅琴;中国首套数字化“可视人”数据集在渝通过成果鉴定[N];重庆日报;2003年
3 通讯员廖雅琴记者冯竞;“国人数字化可视人体数据集”完成[N];科技日报;2003年
4 金水高 刘丽华 陶庄;基本数据集标准新进展[N];计算机世界;2006年
5 上海 陈纯;初识T-SQL,恋情的开始[N];电脑报;2004年
6 昌家杰 邹莹 本报记者 于莘明;探究“数字人”的虚与实[N];科技日报;2005年
7 山水;艾斯本与NIST集合数据集[N];中国石化报;2007年
8 张绍祥 李国辉;研究领域:以人为本[N];计算机世界;2003年
9 张荔子 秦笃烈;“数字人”走向应用[N];健康报;2006年
10 游雪晴;我国均一化气温数据集建成[N];科技日报;2006年
中国博士学位论文全文数据库 前10条
1 史卫亚;大规模数据集下核方法的技术研究[D];复旦大学;2008年
2 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
3 吴国清;科学计算时变数据集的数据挖掘算法研究[D];中国工程物理研究院;2009年
4 孙汉昌;蛋白质组质谱数据处理关键问题与技术研究[D];国防科学技术大学;2011年
5 余雳;虚拟可视鼠样品制备技术研究[D];华中科技大学;2006年
6 黄浩;基于近邻关系的稀有类挖掘[D];浙江大学;2012年
7 曹忠波;基于表达数据的肿瘤标志物的计算识别与分析[D];吉林大学;2015年
8 吴毅;数字人全身分割数据集的建立及人体胸腔与盆腔的数字化研究[D];第三军医大学;2012年
9 杜乃乔;过程感知信息系统的负载生成技术[D];清华大学;2012年
10 张纪阳;蛋白质组学中串联质谱数据搜库结果质量控制方法研究[D];国防科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 余岳林;基于相对位置视点的数据集精简算法研究[D];浙江大学;2013年
2 王春玉;非平衡数据集分类方法研究及其在电信行业中的应用[D];浙江大学;2011年
3 张利娜;不均衡数据集的研究及其在蛋白质相互作用位点预测中的应用[D];安徽大学;2011年
4 邴兆虹;区间估计的不完整数据集混杂聚类算法研究[D];辽宁大学;2013年
5 李涛;基于数据集动态更新的隐私保护算法[D];哈尔滨工程大学;2013年
6 欧阳源遊;基于混合采样的非平衡数据集分类研究[D];重庆大学;2014年
7 张华;时空数据集的连接处理与优化方法研究[D];河海大学;2006年
8 张健;剪枝和网格采样相结合的非平衡数据集分类方法[D];安徽大学;2012年
9 万怀宇;大规模交往数据集的凝聚子群分析研究[D];北京交通大学;2007年
10 李祖德;基于K匿名数据集的隐私推理攻击检测和防范研究[D];清华大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026