收藏本站
《复旦大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

生物学数据集成若干关键问题研究

曹顺良  
【摘要】:随着基因组测序工作的蓬勃发展以及高通量技术如基因芯片技术、质谱(MS)技术、组合化学和生物化学技术的迅速发展和普及应用,生物数据呈指数级增长。 面对如此迅速增长的生物数据,如何有效管理、准确解读、充分使用这些信息,而不被这浩如烟海的数据所淹没,并从中找到明确的研究方向,已成为生物学发展亟须解决的问题。 然而,由于生物数据的分布性以及异构性等特点,使得从多个数据源获取所需要的信息变得非常困难。集成众多异构的生物信息资源,提供方便、高效地获取高质量的生物学数据的手段,支撑生物信息的分析和挖掘功能,是进行现代生物学研究的前提和关键。因此,生物数据集成系统的研究和开发具有重要的理论价值和实际意义。 本文总结了生物学数据集成研究的现状,对采用数据仓库方法进行的数据集成中的数据抽取和转化、语义相似性的度量、基于Gene Ontology的语义查询等问题进行了研究和探讨,最后给出了一个生物学数据集成系统——BioDW。主要研究成果如下: (1)提出了一种新的半结构化数据模式的表示和数据抽取的方法 在生物数据源中绝大多数数据都是半结构化的,这些数据的主要特点是数据格式多样化、数据元素之间存在着嵌套和局部无序的关系、数据存在缺失和结构的不断变化,这为生物信息的提取提出了严重的挑战。根据生物学数据的特点,提出了一种全新的半结构化数据模式表示方法。该方法将OEM数据模型和正则表达式有机地结合起来,不但能够非常灵活方便地表示各种数据结构,
【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP274.2

【引证文献】
中国期刊全文数据库 前1条
1 张育润;江洲;;探讨生物信息标准化研究[J];生物信息学;2011年01期
中国硕士学位论文全文数据库 前2条
1 葛元弘;个人基因组信息管理及可视化技术研究[D];哈尔滨工业大学;2011年
2 马静;生物信息异构数据库集成研究[D];南京农业大学;2010年
【参考文献】
中国期刊全文数据库 前2条
1 孟小峰;Web数据管理研究综述[J];计算机研究与发展;2001年04期
2 姜宁,王忠,迟忠先;空间对象模型用于Web下数据源集成的研究[J];计算机工程与应用;2001年05期
【共引文献】
中国期刊全文数据库 前10条
1 天晓;;浅谈web信息搜索[J];赤峰学院学报(自然科学版);2007年03期
2 黄俊涛;;基于Web成绩管理系统的设计与实现[J];成功(教育);2010年04期
3 关冰核;基于XML的WEB数据挖掘技术系统框架的设计[J];电脑知识与技术;2004年23期
4 黄伟;刘娟;;一种基于DOM树的HTML转换为XML的方法[J];电脑知识与技术;2006年20期
5 赵程鹏;;商品专卖型企业门户网站建设的模式研究[J];电脑知识与技术(学术交流);2007年03期
6 吴远良;;基于XML的Web挖掘技术在电子商务中的应用研究[J];电脑知识与技术;2009年33期
7 钱宏;;数据挖掘预处理技术的研究[J];电脑知识与技术;2010年17期
8 钱宏;彭敦陆;;基于可信Web服务的信息查询技术的研究[J];电脑知识与技术;2012年02期
9 王旭;张文超;丁刚;;基于网格的快速有效Web信息检索体系结构的设计[J];仪器仪表用户;2007年04期
10 周贺来;;Web挖掘在电子政务中的应用研究[J];电子政务;2008年07期
中国重要会议论文全文数据库 前4条
1 刘君强;彭智勇;杨先娣;李旭晖;;一个基于对象代理模型的生物信息集成系统[A];2005年全国理论计算机科学学术年会论文集[C];2005年
2 王晓玲;栾金峰;董逸生;;自动获取XML数据模式的研究与实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 闫学东;李毅;丁峰;蔡月茹;;一种可装配元数据编辑器数据模型的设计与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 张英朝;张维明;肖卫东;黄金才;;信息网格中基于本体的信息共享全局视图构建方法研究[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 黎方正;关系数据库的关键词检索技术研究[D];中南大学;2010年
2 聂铁铮;Deep Web中Web数据库集成关键技术的研究[D];东北大学;2009年
3 简(王争)峰;基于XML的异构产品信息网上交换、检索技术研究与应用[D];浙江大学;2002年
4 聂培尧;基于XML的半结构数据管理及数据集成问题研究[D];西北工业大学;2002年
5 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
6 鱼滨;基于XML的集成中间件技术研究[D];西北大学;2003年
7 徐振宁;基于本体的Web数据语义信息的表示与处理方法研究[D];中国人民解放军国防科学技术大学;2002年
8 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
9 向桂林;XML引擎研究[D];中国科学院研究生院(文献情报中心);2004年
10 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
中国硕士学位论文全文数据库 前10条
1 王强;基于演示编程的遥感图像元数据提取方法研究[D];山东科技大学;2010年
2 程拱胜;区域经济干部培训学校培训质量管理信息系统分析与设计[D];电子科技大学;2010年
3 杜博;高校实验室管理系统的设计与实现[D];西安电子科技大学;2010年
4 孟飞燕;保温隔热材料热扩散率和热导率测试技术的研究[D];南京理工大学;2010年
5 唐春玲;四川职业技术学院学生干部管理系统的研究与开发[D];电子科技大学;2011年
6 刘继征;学院任务管理系统的设计与实现[D];电子科技大学;2011年
7 周炘;面向电子商务网站的深度搜索与信息抽取研究[D];江西师范大学;2011年
8 张欣悦;基于Web2.0的个性化服务系统在电子商务中的应用研究[D];中南林业科技大学;2011年
9 徐志成;公开信息搜集方法研究与实现[D];电子科技大学;2011年
10 李建华;基于网络的教务办公管理系统设计与实现[D];东北大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 尚彤,张丹,卢铭;生物信息学概述[J];北京大学学报(医学版);2001年01期
3 魏维奇,张正国;XML、元数据与生物数据知识发现[J];国外医学.生物医学工程分册;2004年06期
4 武雪梅;肖华胜;;人类基因组结构变异检测研究进展[J];中国科学(C辑:生命科学);2009年03期
5 王宁,徐宏炳,王能斌;数据树── 一种用于异构数据源集成的公共数据模型[J];计算机研究与发展;1998年07期
6 梁鹰,罗伟其;异构数据库的数据转换在大型信息系统中的实现[J];计算机工程与应用;2000年09期
7 李秀,廖璘,刘文煌;基于Web的数据仓库系统的研究[J];计算机工程;2001年11期
8 杨森;夏燕;曹顺良;邓绪斌;朱扬勇;;语义异构生物数据源中的数据集成与更新[J];计算机工程;2008年08期
9 李军怀,周明全,耿国华,张景西;XML在异构数据集成中的应用研究[J];计算机应用;2002年09期
10 吴昊,邢桂芬;基于本体的信息集成技术研究[J];计算机应用;2005年02期
中国博士学位论文全文数据库 前1条
1 李荣;生物信息数据挖掘若干关键问题研究与应用[D];复旦大学;2004年
中国硕士学位论文全文数据库 前2条
1 田友强;基于J2EE和XML的海洋数据集成系统原型设计与实现[D];中国海洋大学;2005年
2 王健萍;基于Web Services的异构数据库共享技术研究[D];上海交通大学;2008年
【二级引证文献】
中国硕士学位论文全文数据库 前3条
1 孙伟平;面向转化医学的生物信息学数据融合与搜索算法研究及应用[D];中南大学;2012年
2 张云;作物品种分子设计信息集成和可视化研究[D];南京农业大学;2012年
3 张艺群;昆虫基因数据库平台的构建及其关键技术的研究[D];南京农业大学;2012年
【二级参考文献】
中国期刊全文数据库 前1条
1 杨树强,陈火旺,王峰;矢量和栅格一体化的数据模型[J];软件学报;1998年02期
【相似文献】
中国期刊全文数据库 前10条
1 刘超;刘妍;;基于Deep Web数据查询接口的抽取与集成[J];硅谷;2008年23期
2 范萍;;基于本体的粒度计算模型[J];科技广场;2008年03期
3 朱俊武;王建东;李斌;;基于语义相似性的web服务选择(英文)[J];东南大学学报(英文版);2006年03期
4 夏燕,张忠平,曹顺良,朱扬勇,李亦学;Gene Ontology在生物数据整合中的应用[J];计算机工程;2005年02期
5 刘彦斌;周春光;张重毅;周栩;翟延冬;邹淑雪;;基于本体的语义生物信息数据库资源链接[J];吉林大学学报(工学版);2010年06期
6 曹顺良,张忠平,李荣,朱扬勇,李亦学;BioDW——一个生物信息学数据集成系统[J];微计算机应用;2005年01期
7 谢红薇;李瑞霞;余雪丽;于晓霞;;基于概念图匹配的语义相似性算法研究[J];微计算机信息;2007年21期
8 张永;王瑞;;生物信息学中的序列比对算法[J];电脑知识与技术;2008年01期
9 谢民主;刘新求;;数据库技术在生物信息学中的应用[J];吉首大学学报(自然科学版);2008年02期
10 李广明;;基于本体的知识资源模糊聚类分析[J];计算机应用研究;2011年02期
中国重要会议论文全文数据库 前10条
1 孙琳琳;蒋继志;;生物信息学及其在作物抗性基因研究中的应用[A];中国植物病理学会2006年学术年会论文集[C];2006年
2 马宁;张正国;;基于信息变化量衡量主成份分析在基因芯片聚类中的作用[A];第十届中国科协年会论文集(三)[C];2008年
3 李媛;崔尚金;李建伟;于康震;;分子生态学与生物信息学[A];中国畜牧兽医学会禽病学分会第十一次学术研讨会论文集[C];2002年
4 陆文聪;钮冰;;基于数据挖掘的生物信息学研究进展[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
5 陈婷婷;郭婷婷;李林;安冬;;基于生物信息学的功能蛋白基因序列分类研究[A];2011年全国通信安全学术会议论文集[C];2011年
6 卢学春;杨波;朱宏丽;姚善谦;;采用生物信息学方法优化依硫磷酸联合方案治疗MDS的应用研究[A];中国科协海峡两岸学术研讨会——2008血液肿瘤论坛会议会编[C];2008年
7 阮林;何颖;邹泽红;傅意玲;陈惠芳;陶爱林;;外源蛋白过敏原性生物信息学评价[A];中华医学会2010年全国变态反应学术会议暨中欧变态反应高峰论坛参会指南/论文汇编[C];2010年
8 冯文龙;赵清杰;;基于遗传算法的DNA多序列比对问题[A];2007年中国智能自动化会议论文集[C];2007年
9 康晓东;;生物信息学及其研究对象[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
10 王智宇;童强松;曾甫清;刘媛;顾朝辉;郑丽端;蔡嘉斌;蒋国松;;小鼠睾丸特异性基因TSEG-4的克隆及表达分析[A];第十五届全国泌尿外科学术会议论文集[C];2008年
中国重要报纸全文数据库 前10条
1 本报记者 李恩青;生物信息学:促动BT与IT双赢[N];中国高新技术产业导报;2001年
2 刘义;生物信息学产业浮出水面[N];中国高新技术产业导报;2000年
3 英潮;生物信息学演绎“变脸”[N];中药报;2002年
4 中科院院士 强伯勤;生物信息学蕴有巨大效益[N];光明日报;2002年
5 白毅;加强生物信息学建设推动人类基因组研究[N];中国医药报;2002年
6 记者 钱秀丽;今年全力以赴做好五项重点工作[N];中国海洋报;2010年
7 周颖;李梢:生物信息学为证候研究提供新视角[N];中国中医药报;2006年
8 记者 朱夕子;商业规划师何雨生日本设计师小川浩史加盟集成[N];中国纺织报;2009年
9 安向琦 赵鲜娜;从“孤岛”走向集成[N];中国航空报;2010年
10 中国科学院院士 张春霆 郝柏林;生物信息学孕育大产业[N];经济日报;2000年
中国博士学位论文全文数据库 前10条
1 曹顺良;生物学数据集成若干关键问题研究[D];复旦大学;2005年
2 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
3 张敏;生物信息学中多序列比对等算法的研究[D];大连理工大学;2005年
4 安杨;基于本体的网络地理服务中的关键问题研究[D];武汉大学;2005年
5 严亚兰;基于语义Web的知识处理研究[D];武汉大学;2005年
6 曾智勇;猪呼肠孤病毒SC-A株的分离鉴定及全基因组cDNA文库的构建和分子遗传特征分析[D];四川农业大学;2006年
7 肖庆;硬粒小麦硒蛋白的生物信息学研究[D];华中科技大学;2008年
8 张革新;α-淀粉酶性能与结构关系的生物信息学研究[D];江南大学;2005年
9 李艳芸;HLA-DRB1基因编码区SNPs的分析及其与宫颈癌的相关性研究[D];天津医科大学;2006年
10 童庆;面向基因预测的信息处理方法研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 朱贤芳;生物序列的比对算法比较研究[D];南京理工大学;2005年
2 马川英;汉语仿拟的认知研究[D];河南大学;2007年
3 郭俊恩;蚁群遗传算法在序列比对中的应用[D];江南大学;2008年
4 李论;基于氨基酸使用偏好及基因功能信息预测疾病相关基因[D];华中科技大学;2008年
5 方义;基于A-Star和DiAlign算法的多序列比对[D];西安电子科技大学;2007年
6 何万双;双序列比对算法研究[D];国防科学技术大学;2006年
7 张慧贞;英汉仿拟广告语的认知研究[D];厦门大学;2009年
8 张绍军;甜菜M14无融合生殖特异EST鉴定及全长获得[D];黑龙江大学;2005年
9 张媛;中日比喻表达的对照研究[D];山东师范大学;2006年
10 刘帅;基于自适应免疫遗传算法的多序列比对方法研究[D];东北师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026