收藏本站
《中南大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于文本挖掘技术的蛋白质相互作用预测方法研究

黄娟  
【摘要】: 后基因组时代,随着高通量生物技术的发展,生物医学的实验手段和研究方法均发生了巨大变革,生物医学文献的数量呈“指数型”增长,应用文本挖掘技术从海量的医学文献中提取蛋白质的相关信息,建立蛋白质相互作用关系的网络图,已成为生物信息学和蛋白质组学领域的研究热点。 本文首先介绍了文本挖掘技术及其应用,接着介绍了文本挖掘技术在生物医学领域的应用现状。对支持向量机(SVM)算法的基本原理做了阐述,在此基础上我们研究了一种基于支持向量机的蛋白质相互作用预测算法,该算法首先应用支持向量机算法提取文献中蛋白质名称信息,并引入了上下文线索提高提取算法的性能,实验证明,上下文线索的引入使提取结果的三项评价指标都有明显提高。接着我们选取交互词特征、词项特征、实体距离特征和链接语法特征作为特征向量,应用支持向量机算法对蛋白质相互作用进行预测,在损失较少关系抽取召回率性能的情况下,较大地提高了准确率,从而最终提高了综合分类率。 在提出的算法的基础上,本文采用分布式计算系统来解决生物信息学计算中大规模数据处理。将系统分解为若干个子任务。将子任务分配给网络中其他客户端计算机完成,从而在一定程度上提高了生物信息学中海量计算的效率。
【学位授予单位】:中南大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:Q51-3

【参考文献】
中国期刊全文数据库 前10条
1 黄啸;;生物信息学在蛋白质组学上的应用[J];安徽农业科学;2006年23期
2 薛为民;陆玉昌;;文本挖掘技术研究[J];北京联合大学学报(自然科学版);2005年04期
3 李建伏;郭茂祖;;系统发生树构建技术综述[J];电子学报;2006年11期
4 周雪忠,吴朝晖,刘保延;生物医学文献知识发现研究探讨及展望[J];复杂系统与复杂性科学;2004年03期
5 秦惠基,胡家荣;生物信息学的兴起及展望[J];广东药学院学报;1999年01期
6 王剑利,杨章民;利用生物信息学技术研究蛋白功能的几种方法[J];国外医学(分子生物学分册);2001年04期
7 赵旭东;蛋白质组学研究[J];国外医学(分子生物学分册);2002年02期
8 张震;刘兴平;;机器学习技术在生物信息挖掘中的方案探讨[J];广西民族学院学报(自然科学版);2006年01期
9 王丽坤;王宏;陆玉昌;;文本挖掘及其关键技术与方法[J];计算机科学;2002年12期
10 祝建中;基于RMI的分布式计算的实现[J];计算机工程;2003年10期
中国重要会议论文全文数据库 前1条
1 吴宝栋;杨志豪;林鸿飞;;生物医学文献中的蛋白质相互作用关系抽取系统[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
【共引文献】
中国期刊全文数据库 前10条
1 华文立;胡学刚;;平衡决策树分类精度与规则简易性研究[J];安徽电子信息职业技术学院学报;2006年04期
2 王东霞;张楠;路晓丽;;基于育种算法的SVM参数优化[J];安徽大学学报(自然科学版);2009年04期
3 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
4 黄啸;;生物信息学在蛋白质组学上的应用[J];安徽农业科学;2006年23期
5 刘小林;;蛋白质组学及其研究进展[J];安徽农业科学;2007年31期
6 程伟;张燕平;赵姝;;支持向量机在粮食产量预测中的应用[J];安徽农业科学;2009年08期
7 武素华;;基于最小二乘支持向量机的土壤含水量检测的研究与分析[J];安徽农业科学;2009年09期
8 任秀艳;高永闯;李美茹;李娟;;HrpN_(Ea)蛋白的结构与功能分析[J];安徽农业科学;2010年05期
9 陈念;沈佐民;;基于化学成分检测和SVM分类的茶叶品质鉴定[J];安徽农业科学;2010年15期
10 黄远顺;;矫直机的自动故障预报技术[J];安徽冶金;2012年01期
中国重要会议论文全文数据库 前10条
1 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
2 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
3 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
5 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
6 吴静珠;刘翠玲;孙晓容;;支持向量机在近红外光谱检测技术中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
7 尹钟;张建华;;基于支持向量机方法的过程操作员功能状态分类[A];中国自动化学会控制理论专业委员会A卷[C];2011年
8 杨坤;纪志成;;基于峰值识别的改进SVM用电需求预测[A];中国自动化学会控制理论专业委员会B卷[C];2011年
9 晋朝勃;胡刚强;史广智;李玉阳;;一种采用支持向量机的水中目标识别方法[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
10 郭玮;李智勇;朱晟;孙慧;;支持向量机在变压器油溶解气体检测中的应用[A];第一届电力安全论坛优秀论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
2 孙晓华;基于聚类的文本机会发现关键问题研究[D];哈尔滨工程大学;2010年
3 朱广平;混响干扰中的信号检测技术研究[D];哈尔滨工程大学;2009年
4 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
5 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
6 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
7 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
8 李先锋;基于特征优化和多特征融合的杂草识别方法研究[D];江苏大学;2010年
9 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
10 王晓松;复杂背景下树木图像提取研究[D];北京林业大学;2010年
中国硕士学位论文全文数据库 前10条
1 展慧;基于多源信息融合技术的板栗分级检测方法研究[D];华中农业大学;2010年
2 陈镇;长、短光周期敏感雄性不育水稻幼穗育性相关蛋白差异分析[D];华中农业大学;2010年
3 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
4 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
5 白冰;基于数据处理中心的企业竞争情报系统研究[D];山东科技大学;2010年
6 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
7 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年
8 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
9 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
10 杨勇;基于SOA的浙江永康某小家电企业应用系统集成平台开发与应用[D];浙江理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 李侃,高春晓,刘玉树;基于SVM的空间数据库的层次聚类分析[J];北京理工大学学报;2002年04期
2 柳回春,马树元,吴平东,杨峰,曾兴生,毕路拯;UK心理测试自动分析系统的手写体数字识别[J];北京理工大学学报;2002年05期
3 李靖炎;削偶合今祖法的提出[J];动物学研究;1992年04期
4 高学,金连文,尹俊勋,黄建成;一种基于支持向量机的手写汉字识别方法[J];电子学报;2002年05期
5 史磊,王永成;英文文献自动摘要系统的研制与开发[J];高技术通讯;1999年11期
6 马颖华,王永成,苏贵洋,韩客松,赵海;自动标引中基于概念层次树的主题词轮排选择的算法实现[J];高技术通讯;2003年06期
7 金宏伟;黄回滨;陈振胜;;蛋白质组学研究相关技术新进展[J];国外医学.临床生物化学与检验学分册;2005年12期
8 王大东;蛋白质组与蛋白质组学[J];国外医学(分子生物学分册);2000年03期
9 凌旭峰,杨杰,叶晨洲;基于支撑向量机的人脸识别技术[J];红外与激光工程;2001年05期
10 刘江华,陈佳品,程君实;用于人机交互的静态手势识别系统[J];红外与激光工程;2002年06期
【相似文献】
中国期刊全文数据库 前10条
1 裴智勇;任松叶;蔡禄;;基于二级结构预测蛋白质复合体亚基相互作用[J];内蒙古科技大学学报;2010年01期
2 秦殿刚;高松;冯铁男;马成荣;王翼飞;;通过序列编码预测蛋白质相互作用[J];应用科学学报;2009年06期
3 王菲露;宋杰;王池社;杜秀全;;基于支持向量机的蛋白质相互作用位点预测[J];计算机技术与发展;2008年10期
4 罗丽;张绍武;陈伟;潘泉;;基于分段氨基酸组成成分的蛋白质相互作用预测[J];生物物理学报;2009年04期
5 朱敏;张永清;李梦龙;周大威;黄俊;;基于集成学习方法的蛋白质相互作用预测[J];四川大学学报(工程科学版);2011年03期
6 倪青山;王正志;王广云;强波;;基于局部支持向量机的蛋白质相互作用的预测方法[J];生物医学工程研究;2008年02期
7 张松;夏学峰;沈金城;孙之荣;;基于序列保守性和蛋白质相互作用的真核蛋白质亚细胞定位预测[J];生物化学与生物物理进展;2008年05期
8 张智;张正国;;蛋白质相互作用的文本挖掘研究进展[J];中国生物医学工程学报;2008年05期
9 刘高勇;汪会玲;;基于支持向量机的网站服务质量实时监控方法[J];武汉大学学报(理学版);2009年02期
10 陆林英;魏雅卓;崔颖;孙平平;马雅楠;马志强;;基于支持向量机的蛋白质相互作用识别[J];生物信息学;2009年04期
中国重要会议论文全文数据库 前10条
1 刘培磊;李满生;王挺;;蛋白质相互作用有向关系抽取的特征选择[A];第五届全国信息检索学术会议论文集[C];2009年
2 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
3 蒋铁军;张怀强;李积源;;多变量系统预测的支持向量机方法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
4 黄淑云;孙兴玉;梁汝萍;邱建丁;;基于小波支持向量机预测蛋白质亚细胞定位研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
5 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
6 涂冬成;薛龙;刘木华;赵进辉;沈杰;吁芳;;基于支持向量机的鹅肉肉色客观评定研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
7 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
8 师旭超;巴松涛;;基于支持向量机方法的深基坑变形预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
9 张军;;支持向量机方法在地下水位干扰排除中的初步应用[A];2007年地震流体学术研讨会论文摘要集[C];2007年
10 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年
中国重要报纸全文数据库 前10条
1 甄蓓;我科学家成功绘制人类肝脏蛋白质相互作用网络连锁图[N];科技日报;2011年
2 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
3 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
4 胡德荣;蛋白质相互作用网络预测新方法被发现[N];健康报;2007年
5 余志平 编译;PCAs给我们带来了什么?[N];中国医药报;2007年
6 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
7 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
8 本报记者 张晶;怎样挖掘专家的活的经验和智慧[N];科技日报;2011年
9 毛黎;美开发细胞内蛋白质相互作用标识技术[N];科技日报;2007年
10 白毅;我国计算生物学研究取得重要进展[N];中国医药报;2007年
中国博士学位论文全文数据库 前10条
1 张万巧;细胞周期调控蛋白质相互作用网络及接头分子TANK募集细胞周期激酶PLK1抑制NF-κB信号通路的机制研究[D];中国人民解放军军事医学科学院;2010年
2 何文英;若干中草药活性组分与几种球状蛋白质相互作用的研究[D];兰州大学;2006年
3 唐江宏;有机小分子与人血清白蛋白的相互作用研究[D];兰州大学;2006年
4 刘月明;人新基因EOLA1生物学特性及相互作用蛋白研究[D];第三军医大学;2004年
5 夏俊峰;蛋白质相互作用及其结合面热点残基的预测方法研究[D];中国科学技术大学;2010年
6 倪青山;蛋白质相互作用与功能预测方法研究[D];国防科学技术大学;2009年
7 徐晓丽;拟南芥线粒体中交替型NAD(P)H脱氢酶活性复合体的蛋白质相互作用研究[D];兰州大学;2010年
8 符庆瑛;大肠杆菌双杂交筛选AMPKα2相互作用蛋白[D];第三军医大学;2007年
9 唐刘君;大规模人类肝脏蛋白质相互作用网络研究[D];中国人民解放军军事医学科学院;2009年
10 陈永对;颗粒蛋白前体与血管生成素相互作用及其功能研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 黄娟;基于文本挖掘技术的蛋白质相互作用预测方法研究[D];中南大学;2009年
2 徐华;基于支持向量机的Web文本挖掘研究[D];哈尔滨工程大学;2004年
3 崔鹏;一种基于支持向量机的直推式WEB挖掘[D];大连海事大学;2006年
4 应伟;基于支持向量机的文本分类方法研究[D];天津大学;2006年
5 王栋;基于SVM的分类方法在内容管理中的应用[D];西北大学;2006年
6 刘静;基于Web文本挖掘的SVM网页文本分类研究[D];东北财经大学;2006年
7 杜圣东;基于多类支持向量机的文本分类研究[D];重庆大学;2007年
8 刘艳伟;支持向量机方法在感潮河段洪峰水位预报中的应用[D];浙江大学;2010年
9 杨镭;支持向量机算法设计及在高分辨雷达目标识别中的应用[D];国防科学技术大学;2010年
10 童振;基于支持向量机的电解液成分预测[D];东北大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026