收藏本站
收藏 | 论文排版

识别蛋白质相互作用网络中的复合物

那第尔  
【摘要】:为了阐明细胞的内部工作机制,重建细胞内完整的蛋白质交互作用网络成为了分子生物学的一大挑战。由于最近发展起来的高通量技术,许多蛋白质之间的相互作用已被发现,并且用来存储它们的相关信息的许多数据库已被建立。随着生物实验技术的发展,提出了各种蛋白质功能模块预测算法。 蛋白质之间的相互作用是传递从细胞外到细胞内信号的主要途径,反之亦然。信号的传导是细胞内一个基本的过程,因为它可以使细胞对外界的刺激反应,并调节不同的亚细胞机制。通常来说,蛋白质相互作用的时间很短,但是蛋白质有时也会较长时间作用,形成一个所谓的蛋白质复合物。在过去几年里,开发了许多大规模的相互作用数据,并在相关文献中有所提及。 基于图的蛋白质功能模块预测算法是最广泛使用的。人们观察到,图中的稠密区域更可能是蛋白质复合体。然而,并没有可靠的证据表明这些方法的结果具有显著的生物意义。由于蛋白质相互作用网络存在噪声,可能会引入一定程度的假阳性和伪阴性。另外,绝大多数方法往往忽略了蛋白质的多功能性。本论文的主要目的是提出一个新的蛋白质模块检测方法,它解决基于图的蛋白质检测算法存在的缺陷和提高预测结果的生物意义。在我们的研究中,我们设计了一种迁移策略,使蛋白质能在簇之间迁移,最后能得到生物学上相似的蛋白质分组。 采用模糊c均值聚类算法(FCM)是因为它非常符合迁移原理,另外,它能理想的描述生物网络固有的不确定性。FCM是基于模糊集合理论。模糊集合理论于1955年首次提出,并获得了很大的成功,因为它通过允许一个元素在一定程度上属于一个集合,能够使我们描述不确定性。因此,FCM考虑了类指派的不确定性的,是一种将一个集合的数据划分到数目预先定义好的类中去的方法。FCM算法迭代地更新中心的值和伙伴关系。通常,FCM会收敛到一个局部最小值,但是高的数据维数使它能够收敛到一个马鞍点。其他因素,比如说初始矩阵的值和模糊参数的值也可以影响算法的收敛性。 因此,谱聚类算法被用来更精确地测量网络中的距离,并处理高维度的数据。普聚类最初提出了是为了解决min-cut问题,通过首先计算图的特征向量和图相似矩阵的特征值,然后以第二特征向量来决定如何分配元素的问题。在我们的实验中,FCM算法应用于前k个特征向量,这些向量能够帮助我们减少数据空间,然后在另一个空间聚类。 为了将模糊c均值聚类和谱聚类方法运用于蛋白质网络的环境中,我们对这些技术进行研究来了解它们的优势以及局限性,并定义了些考虑了蛋白质的生物和拓扑特性的指标。因此,我们的FCM的初始关系矩阵的生成不像在标准情况那样的随机生成,而是从一个使用我们定义的考虑了蛋白质拓扑连接和它们所处环境的生物相似性的度量的初始关系矩阵出发。这种以初始关系矩阵开始的方法在处理生物数据时比随机关系矩阵更具有实用性。 为了调研不同生物数据对距离计算的影响,我们定义了三种生物距离。第一种是仅仅基于GO相似性,即通过蛋白质所拥有的GO term,以及GO DAG图的结构来计算两个蛋白质的相似性。第二种距离完全基于域相互作用信息,从而相似性的计算是通过考虑两个蛋白质包含的域和它们相互作用邻居包含的域。第三种度量是结合了这两种信息,将两种相似性的平均值作为总的相似性值。 本文以酵母蛋白质相互网络为例,试图提高三种广泛使用的基于图的代表算法,分别为MCL、MCODE和DPClus算法,生成大、中、小尺寸的复合物。实验结果表明,三种距离的使用能够得到良好的具有生物意义的结果,但是我们推断出结果的质量依赖于预测的复合物的尺寸,因为对于任何一种距离度量,大尺寸的复合物通常产生很差的结果。但是对于三种算法最好的折中是使用结合了GO和域相互作用的第三种距离。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 田泽荣;三维DFT的TPF算法[J];计算机工程与科学;1990年04期
2 ;車床搪孔軸綫坐标計算法[J];北京师范大学学报(自然科学版);1959年01期
3 费景高;具有实现误差的共轭梯度算法[J];计算数学;1980年03期
4 黄纯一,肖相武,陈超,翟忠和;关于极大似然估计的算法[J];黑龙江大学自然科学学报;1987年02期
5 费景高;;数字仿真中应用局部解析算法的一个算例[J];航天控制;1988年01期
6 唐小我;;投入产出系统计算方法的探讨[J];电子科技大学学报;1989年04期
7 周本宽;;多变量有限元分析的有效算法[J];西南交通大学学报;1989年02期
8 郭建宁;双星定位系统的定位计算和数字地图[J];中国空间科学技术;1992年06期
9 高随祥;;线团图的性质[J];新疆大学学报(自然科学版);1992年01期
10 吕竹青,周德俊,林彦芬,赵同欣;Strassen与Winograd快速矩阵乘法研究[J];高等学校计算数学学报;1993年03期
11 刘奇志;几种高效率的最短路算法[J];数学的实践与认识;1993年02期
12 陈炬桦;;引入结构线的Thiessen三角网的数据结构和算法[J];东华理工学院学报(自然科学版);1993年03期
13 卢宗华;;分派问题的一种实用算法——对角线法[J];山东科技大学学报(自然科学版);1993年03期
14 刘元法;公茂法;;DDC数字控制的两种算法[J];山东科技大学学报(自然科学版);1993年04期
15 熊规景,韦旦;有理逼近的线性化Remes算法[J];高等学校计算数学学报;1994年02期
16 李学全,鲁大庆;一个改进的非线性规划算法及其收敛速率分析[J];长沙交通学院学报;1995年04期
17 张全伙,曾晓帆,范慧琳,余坚;任意两个多边形的求交算法[J];华侨大学学报(自然科学版);1995年01期
18 丁志中,易茂祥;自相关函数估值的快速算法[J];安徽师范大学学报(自然科学版);1996年04期
19 张鹏,葛起宏,钟珞,李桂青;求解模糊关系方程的一个简单算法[J];广西工学院学报;1997年01期
20 魏长华,王淑礼;可计算性和计算复杂性的研究及其进展[J];高等函授学报(自然科学版);1998年04期
中国重要会议论文全文数据库 前10条
1 李媛媛;郭军华;吕琳;;基于FCM和SVM的电机转子故障诊断方法研究[A];重庆市电机工程学会2010年学术会议论文集[C];2010年
2 邵玲玲;邬锐;黄炎;;多普勒天气雷达产品一中气旋在强风预报中的应用研究[A];首届长三角气象科技论坛论文集[C];2004年
3 李改肖;刘雁春;崔高嵩;刘颖;何桂敏;;海图深度基准面的确定及算法研究[A];第二十一届海洋测绘综合性学术研讨会论文集[C];2009年
4 庞兴豪;任国春;徐以涛;邱炜;;一种新型功放自适应预失真器设计[A];2009年全国无线电应用与管理学术会议论文集[C];2009年
5 庞兴豪;任国春;徐以涛;邱炜;;一种新型功放自适应预失真器设计[A];2009年全国无线电应用与管理学术会议论文集[C];2009年
6 蓝章礼;曹建秋;王华清;;基于动态梯度的指纹图像二值化算法[A];2008年计算机应用技术交流会论文集[C];2008年
7 平亮;何川;杨青彬;;无线电智能天线技术的特点及发展[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
8 杜玫芳;王昕;;基于特征加权的模糊c均值聚类算法及其应用[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
9 樊新海;李胜利;安钢;王凯;;基于Delphi的零相位数字滤波算法研究[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅲ)[C];2008年
10 罗芳;艾廷华;王洪;;闭合坐标链多边形数据的拓扑关系快速构建[A];全国测绘科技信息网中南分网第二十四次学术信息交流会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 唐煜;均匀设计的组合性质及其构作[D];苏州大学;2005年
2 余金华;电阻层析成像技术应用研究[D];浙江大学;2005年
3 Zhao Peixin;[D];山东大学;2005年
4 吕翔;波长路由光网络相关问题研究[D];浙江大学;2006年
5 申远;一些求解结构型优化的一阶算法[D];南京大学;2012年
6 赵裕众;生物序列分析算法的研究及其应用[D];中国科学技术大学;2010年
7 杨奎元;基于深层结构的图像内容分析及其应用[D];中国科学技术大学;2012年
8 Shaker Kazem Ali(沙克);应用于疾病诊断的图像分析方法[D];中南大学;2010年
9 尹华罡;基于海量时空数据的路线挖掘与检索[D];中国科学技术大学;2012年
10 石磊;基于数据的学习:埃尔米特算法与黎曼流形上的法向量估计[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 梁哲辉;自适应模糊聚类算法的研究与应用[D];华南理工大学;2011年
2 那第尔;识别蛋白质相互作用网络中的复合物[D];中南大学;2012年
3 江亮;SVM算法研究及其在交流控制系统中的应用[D];西北工业大学;2005年
4 高翔;嵌入式三维图形引擎的设计与实现[D];电子科技大学;2005年
5 朱晓丽;QoS组播路由问题研究[D];山东师范大学;2005年
6 杨浩军;计算机软件专利保护问题研究[D];中国政法大学;2006年
7 朱江;AGV车载控制原理研究[D];昆明理工大学;2006年
8 叶海锋;解鞍点问题的UZAWA算法及其收敛性分析[D];浙江大学;2005年
9 王新政;树木年轮分析系统的研究[D];东北林业大学;2007年
10 高莹莹;大孔径静态干涉成像光谱仪(LASIS)图像配准技术研究[D];中国科学院研究生院(西安光学精密机械研究所);2007年
中国重要报纸全文数据库 前10条
1 PALADIN;算法中的NP问题[N];电脑报;2003年
2 ;机器人激活算法和程序设计教学[N];中国电脑教育报;2004年
3 记者 侯建华;会计所算了经济账又算法律账[N];重庆商报;2001年
4 汪蔚;用算法改变世界[N];中国计算机报;2008年
5 PALADIN;算法演义[N];电脑报;2003年
6 记者 雷敏 张旭东 刘铮;我国人均GDP仍在世界100位之后[N];新华每日电讯;2005年
7 H Q;改善照片VCD的制作效果[N];电脑报;2003年
8 南京 朱罕非;一种实用单片机多字节除法的算法[N];电子报;2004年
9 胡英;高安全行业应考虑SSL VPN算法[N];计算机世界;2007年
10 格非;不以“饭量”算“房量”[N];中国房地产报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978