收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

肿瘤患者等位基因缺失长度分布及无信息位点状态预测的研究

任立刚  
【摘要】: 恶性肿瘤正在成为全世界范围内导致人类死亡的最重要原因之一,患者的数量也呈逐年递增之势,根据前人的研究判断很可能是由于染色体的不稳定性引起的。而更深入的研究表明包括等位基因缺失和突变在内的染色体的畸变引起了肿瘤抑制基因的失活,整条染色体、染色体臂、小的染色体片段都可能发生丢失。染色体畸变可以通过自发或者诱发产生,其产生原因和机理比较复杂,关于染色体结构畸变的机理主要有两种假说:一是断裂-重接假说,另一种是互换假说。所以,等位基因缺失分析已经成为一种发现信息位点和候选肿瘤抑制基因的有效方法。在等位基因缺失实验中,同一个个体的正常组织细胞和癌细胞在有信息的分子标记位点(单核苷酸多态、短串联重复、限制性片段长度多态等)上能够初步确定缺失染色体的区段。但是,由于癌症分子研究中有效数据的缺乏和测量的错误导致了癌症治疗和预防的困难;同时,产生于等位基因缺失实验中的大量的数据却没有得到充分地处理,这是因为存在大量的被当做无信息位点的纯合性标记位点的数据几乎都没有得到利用,这篇论文就是有关于通过计算机模拟的方法根据已知信息位点的缺失信息对癌细胞染色体上等位基因缺失状态特别是对纯合性标记位点的缺失状态进行统计学推断。 近年来的研究表明肝癌患者中17号染色体短臂发生杂合性缺失的频率较高,因此对人类17p杂合性缺失的研究成为探讨癌症发生机制和寻找抑癌基因的一条途径。本文首先对上海肿瘤所提供的17号染色体短臂的SNP原始数据进行处理,利用各个发生缺失的位点与邻近位点的遗传图距可以得到各个位点发生缺失的长度(cM,centimorgan)。分析这些缺失长度和染色体缺失个数的分布情况,用适当的模型去描述这种分布,初步探讨了缺失长度的分布函数及缺失个数的分布函数与肿瘤发生的关系。其次,我们使用真实数据所得到的缺失长度分布和个数的分布去模拟100条发生缺失的癌症患者染色体,运用马尔科夫预测法的转移概率矩阵去预测无信息位点的状态,显示出了一定的效果。见附录1。 为了验证马尔科夫预测方法对等位基因缺失状态尤其是对纯合性标记位点的状态的估计效果,我们模拟了同样的100条癌细胞染色体,每一条染色体上均匀的分布着60个SNP标记位点,也就是总共6000个位点。当然,在等位基因缺失实验中会产生大量的无信息位点,我们利用目前已有的方法暂时还不能判断出这些位点的状态(缺失或保留)。模拟的过程中,在这些染色体上人为的选择了一些片段作为等位基因缺失区域,这些片段的长度是遵从伽玛分布(参数参照于实际数据拟合的结果),而染色体上等位基因缺失的个数则是遵从泊松分布(参数参照于实际数据拟合的结果)的。这个分布会随机的给出一个数字作为一个特定染色体发生缺失的个数,那么每个缺失的位置和长度就被固定了下来。到此为止,每条染色体的每个标记位点都有了一个状态,不是缺失就是保留。而为了达到验证方法效果的目的,我们按比例人为地删去了一些位点的状态作为无信息位点。马尔科夫预测方法被利用来根据已知信息位点的状态数据估计无信息位点的状态。首先,我们依据那些已知位点的状态统计出了一步转移概率,每一个位点的状态数据被我们编写的程序自动的依次写入了EXCEL表格;第二,计算机程序开始逐一地扫描每个位点的状态,当扫描到无信息位点时,计算机程序根据该位点的上一个位点的状态(缺失或保留)自动地产生一个小数,也就是根据转移概率矩阵。同时,程序随机地产生另外一个小数,我们比较这两个数字的大小然后给出这个无信息位点的状态(缺失或保留)。第三,每一个标记位点都有了一个状态值,一步转移概率被重新计算当它原有的值被用过了一次之后;这个被称作是迭代的过程需要重复1000次或者更多次直到无信息位点的状态达到稳定态。这种相对的稳定是一种平均概念上的固定,即我们取迭代的最后200次或者是更多次的状态的次数是否包含80%的缺失次数或是保留次数来决定该位点的稳定态。 转移概率矩阵被用来估计无信息位点的状态并表现出一定的效果,见附录2所示。我们可以从3282个模拟的无信息位点中推测出1563个位点的状态,这其中有1314个位点的状态推测正确,249个位点的状态推测错误,正确率是84%。在一定的程度上,每一个位点的缺失频率得到了更正。但是,似乎我们从无信息位点中推测出来的有信息位点的个数还有些少(1563/3282),大概占到47%。所以说,转移概率矩阵分析能够在一定程度上预测无信息位点的真实存在状态,也能够得到一个比较准确的位点缺失的概率。由于估计出的无信息位点的原因,所以也增加了很多小片段的缺失,而且有很多无信息位点并没有估计出来它的真实的状态,所以致使推出的分布曲线与模拟时使用的理论长度分布并不能完全吻合,但是我们还是能从分布图中看出有符合相同分布的趋势。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李洁;刘芝华;;食癌中的等位基因缺失[J];世界华人消化杂志;2003年11期
2 徐文怀,白景香,杨定成,李勇;nm23-H1等位基因缺失与大肠癌转移相关性研究[J];中华肿瘤杂志;1995年04期
3 高洁生;汤虹;吴轰;文继舫;;82例肺癌p53基因缺失与突变初步研究[J];中华医学遗传学杂志;1994年06期
4 杨亚龙;结肠癌基因[J];西藏医药杂志;1991年03期
5 张玉勤;;肿瘤抑制基因和卵巢癌转移的危险性[J];国外医学情报;1994年04期
6 钱桦,刘君;结肠直肠癌第17号染色体短臂等位基因丢失[J];国外医学.外科学分册;1996年01期
7 梁任远;王楚;颜庆;闭晓勇;;男性Amelogenin基因座X片段缺失1例[J];广西警官高等专科学校学报;2008年S1期
8 张丽萍,袁建达,张泰明,许良中;乳腺癌nm23-H_1等位基因缺失与肿瘤淋巴结转移相关性的研究[J];实用肿瘤杂志;1997年06期
9 陈军!610041成都,周清华!610041成都,覃扬,孙芝琳,孙泽芳,刘伦旭!610041成都;人肺癌中nm23等位基因缺失的研究[J];中国肺癌杂志;2000年01期
10 周清华,陈军,孙芝琳,覃扬,孙泽芳,刘伦旭,王允,杨振华;nm23-H1等位基因缺失与人非小细胞肺癌转移相关性研究[J];中国胸心血管外科临床杂志;1998年03期
11 丁勇;药动学随机过程模型[J];数学的实践与认识;2004年08期
12 ;食管腺癌中DPC4基因的等位基因缺失和突变分析[J];国外医学.遗传学分册;1997年05期
13 游思洪,刘平,张道富,丁小健,张小勇;胃癌中脆性组氨酸三联体基因异常的检测分析[J];南京医科大学学报(自然科学版);2005年04期
14 孙诚谊;结直肠癌肝转移时染色体等位基因缺失以及与临床现象的关系(英)[J];国外医学.外科学分册;1995年03期
15 方前胜,韩静;马尔科夫方法在预测药品市场占有率中的应用[J];中国卫生经济;1996年03期
16 单祥年,赵寿元,严明,黄鹰,王世浚;在中国人胃癌组织DNA中发现癌基因Ha-ras等位基因缺失[J];中国医学科学院学报;1991年03期
17 张玉玲;人膀胱癌中染色体9上等位基因缺失和微小卫星体改变[J];国外医学.分子生物学分册;1994年06期
18 侯培彬;俞泽鹏;;吸收马尔柯夫链在流行病学中的应用[J];四川理工学院学报(自然科学版);2007年04期
19 彭志行;马红霞;赵杨;易洪刚;娄冬华;于浩;陈峰;;马尔可夫链模型在医学高等教育教学质量评价中的应用研究[J];中国高等医学教育;2009年05期
20 罗永胜;张丕德;;应用马尔可夫链评价教学质量[J];数理医药学杂志;2008年05期
中国重要会议论文全文数据库 前10条
1 杜笑平;杨启纲;杨家沅;;过零周期转移概率矩阵语音识别部件的研制[A];第二届全国人机语音通讯学术会议论文集[C];1992年
2 李光;张海峰;王军梅;王全红;;膀胱癌等位基因缺失研究[A];中华医学会病理学分会2005年学术年会论文汇编[C];2005年
3 杜笑平;杨家沅;;升降周期转移概率矩阵(TPMRF)语音识别方法的研究[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
4 潘英俊;刘焕淋;;长度分布特性对异步光分组交换性能影响研究[A];2007年全国第十六届十三省(市)光学学术会议论文集[C];2007年
5 李军;郝天珧;;二维马尔可夫链模型岩相随机模拟[A];中国地球物理学会第22届年会论文集[C];2006年
6 郭晓贤;宋浩雷;江贤章;黄建忠;;ADH2等位基因缺失的酿酒酵母杂合子的构建[A];华东六省一市生物化学与分子生物学学会2006年学术交流会论文集[C];2006年
7 高江波;李双成;;基于马尔可夫模型的土地利用变化情景分析—以京津冀地区为例[A];中国地理学会2007年学术年会论文摘要集[C];2007年
8 王世成;康铁笙;荆贵茹;周礼成;汪屹华;;磷灰石裂变径迹长度及年龄的热历史意义及应用[A];1992年中国地球物理学会第八届学术年会论文集[C];1992年
9 袁旭梅;康键;张昕;;动态CRM模型在电子商务中的应用[A];2003年中国管理科学学术会议论文集[C];2003年
10 郭健;陈孝威;;一种基于内容的WWW图像搜索引擎系统模型[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 徐先发;喉癌9p13-23区域微卫星DNA杂合性缺失的研究[D];中国协和医科大学;2000年
2 葛伟平;隐私保护的数据挖掘[D];复旦大学;2005年
3 李万波;人类食管癌的基因丢失研究[D];中国协和医科大学;1991年
4 林琛;WEB环境下的社会网络挖掘研究[D];复旦大学;2009年
5 常桂松;生物序列分析中若干概率模型研究及应用[D];大连理工大学;2011年
6 董浩;RNA二级结构预测方法研究[D];吉林大学;2011年
7 刘焕淋;异步光分组交换节点的若干关键技术研究[D];重庆大学;2008年
8 刘亚芬;事件监测统计过程控制方法研究[D];天津大学;2011年
9 孙彦洵;Smad5基因在小鼠胚胎干细胞增殖、分化及凋亡中的功能与机制[D];中国人民解放军军事医学科学院;2005年
10 晁恒军;肿瘤抑制基因p53及其拮抗基因mdm2在急性白血病发病机制中作用的研究[D];中国协和医科大学;1995年
中国硕士学位论文全文数据库 前10条
1 任立刚;肿瘤患者等位基因缺失长度分布及无信息位点状态预测的研究[D];西北农林科技大学;2007年
2 严翠婷;微生物全基因组寡聚核苷酸转移概率矩阵的进化生物学分析[D];华南理工大学;2012年
3 郭军;基于信用转移概率矩阵的中国上市公司债券信用风险度量研究[D];南京理工大学;2010年
4 牛芳;预测模型在数据挖掘技术中的研究与实现[D];大连海事大学;2002年
5 牛裕琪;可修混联系统的可靠性研究[D];西南交通大学;2002年
6 陈俊杰;基于改进转移概率矩阵的计算信用VaR的MonteCarlo模拟法[D];上海交通大学;2012年
7 李慧音;水库多目标优化调度研究[D];华中科技大学;2011年
8 冉小庆;Oracle性能分析与预测研究[D];大连海事大学;2003年
9 王俊;人力资源柔性管理与人员流动优化模型研究[D];天津大学;2005年
10 张永强;基于转移概率的PageRank算法研究[D];暨南大学;2009年
中国重要报纸全文数据库 前5条
1 记者 蔡崇金 通讯员 李建军;开展五手活动见成效[N];中国铁道建筑报;2005年
2 实习生 崔文苑;携号转网蓄势待发[N];科技日报;2010年
3 柳迪;耐盐碱杨树新品种通过鉴定[N];农民日报;2002年
4 记者 白毅;p53基因治疗晚期肝癌可明显延长患者生存期[N];中国医药报;2010年
5 本报记者 张九陆;携号转网:饱和市场下的竞争优化[N];通信产业报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978