收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于序列信息的转录因子结合位点和启动子理论预测

杨科利  
【摘要】: 基因转录调控一直是生物信息学研究的一个重要内容,转录因子结合位点和启动子的识别是研究基因转录调控的重要环节,是构建基因调控网络的一个核心问题。本文基于已知的转录因子结合位点和启动子序列数据,从序列信息出发,提出了整合位点保守型参量和位置权重矩阵预测转录因子结合位点的位置权重矩阵打分函数方法以及联合位置权重矩阵和离散增量预测启动子的支持向量机方法。 基于转录因子结合位点序列通常比较短且保守,引入矩阵模型描述转录因子结合位点的特性,同时依据转录因子结合位点的位点保守性各不相同,将碱基保守性参数引入矩阵模型,从而提出预测转录因子结合位点的位置权重打分函数算法(PWMSA)。 首先将四种碱基随机出现的频率作为背景频率,以单碱基位点保守性参量结合单碱基位置权重矩阵的PWMSA算法对22种转录因子结合位点进行预测,总体Self-consistency检验为87.59%,10-fold cross-validation检验为85.48%。 然后考虑到基因序列中的四种碱基并非随机出现,以四种碱基实际出现的频率作为背景频率,用PWMSA算法对酵母九种转录因子结合位点进行预测,Self-consistency检验预测成功率达83.14%,10-fold cross-validation检验预测成功率为77.51%。同时,引进两种最新的评价指标,将PWMSA算法与现有的10种预测转录因子结合位点的软件进行比较,结果表明PWMSA算法的评价指标均高于现有的算法,在核苷酸和结合位点片段两种评价水平上,预测成功率分别高出其他算法4%,7%个百分点。 考虑到转录因子结合位点之间存在碱基相互作用共同贡献与蛋白的亲和力,利用已知的9种酵母转录因子结合位点序列构建近邻核苷酸二联体位置权重矩阵,计算位点近邻二联体核苷酸保守性参量,使用PWMSA算法对9种酵母转录因子结合位点进行预测,Self-consistency检验和10-fold cross-validation检验预测成功率分别达到88.04%,81.10%,明显高于单碱基位置权重矩阵的结果。 基于启动子序列的内容特征和信号特征与非启动子序列的区别,利用离散量方法提取启动子序列的内容特征;构建核心启动子元件的位置权重矩阵,使用位置权重矩阵提取启动子序列的信号特征,最后提取启动子和非启动子序列碱基组份特征。构建了基于综合启动子序列的内容特征和信号特征预测启动子序列的支持向量机分类器,并对人类PolⅡ启动子进行预测,10-fold cross-validation检验为95.70%,对另外选取的独立测试集预测成功率为98.30%,同时与现有的7种预测启动子的软件和算法进行比较,我们的算法预测成功率敏感性为97.00%,特异性为97.98%,结果明显优于现有的预测算法和软件。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 田瑞琴;张静;胡俊;;酵母核糖体蛋白基因组合转录调控位点统计分析[J];生物信息学;2010年02期
2 李毅;张嘉保;赵志辉;武霞;张树敏;;猪肥胖基因ob近端启动子的生物信息学分析[J];广西农业生物科学;2006年S1期
3 周荣阁;张静;;基于对数线性模型的酵母基因转录调控模体分析[J];生物信息学;2011年02期
4 梁自文;周广举;杨宗城;陈建;陈渝;;EOLA1基因启动子序列的鉴定[J];第三军医大学学报;2009年23期
5 杨科利;许强;;基于离散增量结合支持向量机方法的果蝇启动子预测[J];生物技术;2008年02期
6 李慧敏;张静;;酵母核糖体蛋白基因启动子序列的特征[J];生物物理学报;2008年01期
7 张驰;陈其新;李明;周建设;秦楠;;哺乳动物BMP4基因A型启动子的比较分析[J];安徽农业科学;2010年11期
8 陈鸿飞;王进科;;转录因子相关数据库[J];遗传;2010年10期
9 张万里;李伟;吴川清;林学科;李航;王国斌;陶凯雄;;小鼠EDNRB基因启动子生物信息学分析[J];生物信息学;2011年01期
10 娄桂予;陈敏;李渝萍;李强;陈彬;陈健;廖荣霞;周度金;;人FXR基因5′调控区功能分析[J];中国生物化学与分子生物学报;2006年04期
11 李婷婷;蒋博;汪小我;张学工;;转录因子结合位点的计算分析方法[J];生物物理学报;2008年05期
12 杨科利;许强;;基于序列特征的人类Pol Ⅱ启动子理论预测[J];生命科学研究;2009年05期
13 曲宪成;崔严慧;周正峰;刘颖;金一春;胡萍华;薛婷君;王琼;;团头鲂促性腺激素GtH Iβ亚基基因5′端启动子区克隆及表达载体构建[J];水生生物学报;2008年04期
14 杨磊;李前忠;左永春;;基于位置关联性打分方程的果蝇转录因子结合位点的预测[J];内蒙古大学学报(自然科学版);2008年06期
15 汪新艳;赵太强;郭嘉聪;杨牧;周红;;草鱼诱导型一氧化氮合酶cDNA和启动子的克隆及分析[J];四川动物;2011年04期
16 冉茜;李忠俊;;CRIF1基因启动子克隆及活性分析[J];中国输血杂志;2010年01期
17 荀靓;张利;甄一松;惠汝太;;基于PWM扫描算法的启动子区域统计分析[J];清华大学学报(自然科学版);2006年07期
18 杨培周;郭丽琼;王艺红;林俊芳;;毛柄金钱菌gpd-Fv启动子的克隆及序列分析[J];工业微生物;2008年03期
19 敖伟;王正志;杜耀华;;一种基于多特征的大肠杆菌启动子判别算法[J];生物信息学;2006年02期
20 杨科利;李前忠;林昊;;预测酵母(Yeast)基因转录因子结合位点[J];内蒙古大学学报(自然科学版);2006年05期
中国重要会议论文全文数据库 前10条
1 赵丽丽;王建波;杨会杰;;人类启动子序列的复杂性[A];数学·力学·物理学·高新技术交叉研究进展——2010(13)卷[C];2010年
2 尉倩;张晓科;范锋贵;王轩;张帆;张钰玉;;中国小麦春化基因ZCCT-1启动子序列的多态性分析[A];中国作物学会50周年庆祝会暨2011年学术年会论文集[C];2011年
3 黄耿青;龚思颖;许文亮;李鹏;李学宝;;GhFLA1和GhFLA4基因的表达及其编码蛋白的定位研究[A];基因开启未来:新时代的遗传学与科技进步——湖北省遗传学会第八次代表大会暨学术讨论会论文摘要汇编[C];2009年
4 田爱梅;曹家树;;白菜雄性不育相关基因BcMF15启动子的克隆、序列分析及植物表达载体的构建[A];中国园艺学会十届二次理事会暨学术研讨会论文摘要集[C];2007年
5 皇甫竞坤;董菁;邓红;成军;施双双;洪源;任喜民;李莉;;乙型肝炎病毒核心基因启动子序列突变及准种的研究[A];中华医学会第七次全国感染病学术会议论文汇编[C];2001年
6 赵家军;高聆;于桂娜;IgWaiYoong;LuiKaiFoo;ThaiAhChuan;;2型糖尿病患者磷酸烯醇式丙酮酸羧激酶(PCK1)启动子序列变化分析[A];中华医学会第六次全国内分泌学术会议论文汇编[C];2001年
7 冉令华;阮晓钢;;非显著序列元件对大肠杆菌启动子识别的影响[A];第二十二届中国控制会议论文集(下)[C];2003年
8 陈嘉;杨蓓蓓;张行;曹江;;喉癌特异性启动子的构建及活性分析[A];2010全国耳鼻咽喉头颈外科中青年学术会议论文汇编[C];2010年
9 林昊;李前忠;;大肠杆菌sigma70启动子预测[A];第十次中国生物物理学术大会论文摘要集[C];2006年
10 靳昌忠;冯磊;李杰;姚航平;吴南屏;;AP-1和ETS-1位点缺失的DC-SIGN启动子荧光素酶报告质粒的构建及其活性研究[A];浙江省医学会医学微生物与免疫学及医学病毒学学术年会论文汇编[C];2009年
中国博士学位论文全文数据库 前10条
1 熊清;真核启动子预测[D];重庆大学;2004年
2 徐兵;肿瘤细胞靶向转录载体的研究[D];中国人民解放军军事医学科学院;2002年
3 李皓;心衰机理及hKv4.3基因表达调控研究[D];吉林大学;2006年
4 陈江汉;白念珠菌菌相转换基因HYR1启动子活性研究[D];第二军医大学;2006年
5 葛晶;胰岛素对人酰基辅酶A:胆固醇酰基转移酶1基因转录调控的机制研究[D];华中科技大学;2007年
6 朱晓应;hTERT启动子调控p53基因表达对T24细胞凋亡的作用[D];中国人民解放军军医进修学院;2006年
7 柴晓杰;玉米淀粉分支酶基因表达调控的研究[D];吉林农业大学;2005年
8 徐涛;小麦(Triticum aestivum L.)高分子量麦谷蛋白1By15和1Dx1.5~t基因高效表达载体的构建及转化研究[D];中国农业科学院;2006年
9 伊淑莹;多胁迫诱导型Lehsp23.8启动子的分子克隆及其功能分析[D];山东师范大学;2007年
10 高必军;甘蓝型油菜napin基因启动子的克隆与几个重要农艺性状的初步QTL定位[D];四川农业大学;2007年
中国硕士学位论文全文数据库 前10条
1 杨科利;基于序列信息的转录因子结合位点和启动子理论预测[D];内蒙古大学;2007年
2 马刚;辣椒素合成酶基因(CS)及其启动子的克隆与序列分析[D];吉林大学;2009年
3 王玉婷;甜菜BvM14-MADSbox基因启动子的克隆及瞬时表达分析[D];黑龙江大学;2009年
4 何文珺;基于启动子信息预测人类基因的组织差异表达[D];华中科技大学;2008年
5 张馨月;两种双生病毒伴随的卫星启动子的鉴定[D];浙江大学;2010年
6 李炜;丙型肝炎病毒核心蛋白结合蛋白6(HCBP6)基因转录调节机制初步研究[D];山西医科大学;2010年
7 杨雷;基于序列特征预测蛋白质编码基因及其启动子[D];华中科技大学;2006年
8 闫明旭;矮牵牛PMADS9基因启动子的克隆及功能分析[D];西南大学;2009年
9 闫利明;烟草根特异表达启动子的分离鉴定与抗病基因克隆及表达载体构建[D];福建农林大学;2009年
10 刘芳;粗糙集理论在启动子识别中的应用研究[D];中南大学;2008年
中国重要报纸全文数据库 前7条
1 张中桥;四医大西京医院发现 FAS启动子具有肿瘤靶向性[N];中国医药报;2007年
2 张中桥;FAS启动子 肿瘤细胞的探测器[N];健康报;2007年
3 董映璧;美发现基因调控可回应“RNA世界”[N];科技日报;2006年
4 宋黔云;我省高校科研花香果硕[N];贵州日报;2006年
5 宋黔云;全省植物基因工程研究进展顺利[N];贵州日报;2004年
6 本报记者 黄显斌 唐明山;乙肝病毒新编码基因被破译[N];科技日报;2003年
7 ;我国成功破译乙肝病毒基因组新编码基因[N];中国高新技术产业导报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978