转录因子结合位点和动物毒素的分析与预测
【摘要】:
转录因子结合位点的识别是阐明基因转录调控机制的重要环节,准确的转录因子结合位点的预测算法将有助于人们识别转录因子的目标基因,进而研究其在上游调控区中的位置对转录调控的影响。然而,目前存在的预测转录因子结合位点的算法所得结果的特异性普遍较低,因此有必要提出一种新的有效的理论预测算法。动物毒素能直接作用于药物作用靶点,这使得动物毒素成为研究药物靶点的重要工具。动物毒素还在离子通道的研究、药物发现和杀虫剂的合成方面有广泛的应用。因此,预测动物毒素就变得非常重要,有必要提出-种能准确鉴别动物毒素的理论算法。
本文以转录因子结合位点、动物毒素、神经毒素、细胞毒素、突触前神经毒素和突触后神经毒素作为研究对象,利用位置关联性打分方程(positioncorrelation scoring function, PCSF)、离散增量(increment of diversity, ID)、支持向量机(Support Vector Machine, SVM)和朴素贝叶斯分类器(Naive Bayes Classifier,NB)四类算法对它们进行了预测研究。本文的研究工作如下:
首先,从转录因子结合位点数据库JASPAR选出8种实验上证实的没有冗余的转录因子结合位点数据,结合位置保守性和伪计数,构建了位置关联方程,通过定义位置关联性打分方程的最佳阈值,使得打分方程在此最佳阈值下所得结果的假阳率较低。同时为了比较打分方程在转录因子结合位点方面的预测能力,本文将打分方程与MATCHTM中所使用的位置权重矩阵进行了比较,结果显示打分方程的预测能力优于位置权重矩阵的预测能力。
其次,从动物毒素数据库ATDB下载了全部的动物毒素,用Saha和Raghava工作中提供的非毒素的蛋白质序列作为负集,利用PISCES软件对动物毒素和非毒素进行序列相似性比对,构建了序列相似小于25%、40%、60%、80%和90%的数据集合。分别选取20种氨基酸组分、400种二肽组分、6种亲疏水组分、36种二肽亲疏水组分作为离散增量算法的参数,对不同序列相似性的动物毒素数据集进行了预测。结果表明:离散增量算法在以二肽组分作为参数时预测结果最好;5种不同序列相似性的动物毒素数据集的预测结果随序列相似性变化较小。为了进一步提高动物毒素的预测精度,本文对4种不同的离散增量值进行组合并作为支持向量机的输入参数,对动物毒素进行了预测,结果显示:支持向量机的预测结果优于离散增量算法的预测结果。同时本文还对神经毒素和细胞毒素进行了预测。此外,为了将支持向量机和其它的预测算法进行比较,这里将支持向量机应用到Saha和Raghava构建的神经毒素的数据库上,预测结果显示:本文所使用的支持向量机的预测结果优于Saha和Raghava所提出的算法取得的预测结果。
最后,本文从Swiss-Prot数据库上下载了突触前和突触后神经毒素的蛋白质序列,参照数据库给出的注释信息,统计了突触前和突触后神经毒素的二硫键类型及其二硫键数目的分布。从ATDB和Swiss-Prot数据库上下载了突触前和突触后神经毒素的蛋白质序列,分别构建了序列相似性小于80%的数据集1和数据集2。本文采用了5种方法选取参数:(1):蛋白质序列的二肽参数;(2):MRMR软件提取的50个二肽参数;(3):MEME搜索到的模体特征;(4):Prosite搜索到的模体特征;(5):Interpro搜索到的模体特征。本文还对这5种参数进行了组合,一共得到了12类参数,并将这12类参数作为离散增量和朴素贝叶斯分类器的参数,在Jackknife检验下,对数据集1和2进行预测。预测结果表明:(1):增加模体参数的预测结果好于二肽参数时的预测结果;(2):使用模体参数和50个二肽参数时,突触前神经毒素和突触后神经毒素的预测结果最好。
|
|
|
|
1 |
杨磊;李前忠;左永春;李涛;;基于氨基酸组分和支持向量机的动物毒素的预测[J];内蒙古大学学报(自然科学版);2009年04期 |
2 |
钱锐;;动物毒素的应用[J];生物学通报;1984年06期 |
3 |
于力;;应重视海洋动物毒素的研究与利用[J];生命的化学;1982年02期 |
4 |
余晓东;当代生物毒素研究特点和发展趋势──参加第十三届国际动植物微生物毒素会议之感想[J];重庆师范学院学报(自然科学版);2001年01期 |
5 |
闫凤;孟庆雄;;常见的动物毒素诱导肿瘤细胞凋亡的分子机制[J];生物学杂志;2010年03期 |
6 |
陈远聪;;我国毒素研究和利用的现况[J];生命的化学;1986年01期 |
7 |
杨磊;李前忠;左永春;李涛;;基于支持向量机方法预测神经毒素[J];内蒙古大学学报(自然科学版);2009年03期 |
8 |
吴剑峰;;我国常见的有毒动物[J];大自然;1992年03期 |
9 |
周新华;;蝎毒的生化研究及临床应用[J];生物化学与生物物理进展;1984年02期 |
10 |
叶德仁;;箭毒蛙的趣事[J];生物学教学;1985年02期 |
11 |
赖仞,查宏光,张云;动物离子通道毒素与药物开发[J];动物学研究;2000年06期 |
12 |
覃新程,李志孝,王亚馥;山黧豆及其神经毒素(ODAP)的研究进展[J];生命科学;2000年02期 |
13 |
金雷;王淼;曾宗浩;胡纫秋;王大成;;一种东亚钳蝎酸性神经毒素的晶体学研究[J];科学通报;1993年06期 |
14 |
李宏民,王淼,刘延顺,赵彤,金雷,王大成;具有中等毒性的马氏钳蝎神经毒素的纯化和初步晶体学研究[J];生物化学与生物物理学报;1995年02期 |
15 |
吕秋敏;赖仞;张云;;动物毒素与人类疾病——从单一成分到组学研究,从理化性质到疾病机理,从粗毒利用到理性药物设计[J];动物学研究;2010年01期 |
16 |
孙芹;许鹏;王立山;夏斯桂;程洁;肖杭;高蓉;;昆虫神经元与骨骼肌中非突触钠通道研究进展[J];中国公共卫生;2010年06期 |
17 |
刘静芳;;眼镜王蛇神经毒素的提纯及其性质的研究[J];河北医科大学学报;1992年01期 |
18 |
苏文金;C型、D型肉毒梭菌毒素的研究进展[J];中国人兽共患病杂志;1995年01期 |
19 |
邓君鹏,王淼,李宏民,王大成;一种东亚钳蝎碱性神经毒素的纯化和初步晶体学研究[J];中国生物化学与分子生物学报;1996年05期 |
20 |
钟肖芬,彭立胜,吴文言,卫剑文,杨红,杨彦臻,徐安龙;平颏海蛇3种短链神经毒素的基因克隆与功能比较[J];生物化学与生物物理学报;2001年04期 |
|