亚洲精品午夜精品,日本二手网站,国产AⅤ爽AV久久久久成人社区,日本一二三区不收费av

使用 WeGene 需要啟用 Cookies, 請啟用后刷新頁面獲得更好的體驗
mxlever mxlever 祖源分析

請教大俠,如何利用Y-STR和Y-SNP計算TMRCA,利用它們計算分別有什么優(yōu)缺點?

2016-07-29 ? IP屬地上海
按熱門排序    按默認(rèn)排序

2 個回復(fù)

wang - 哈佛醫(yī)學(xué)院、德國馬普所分子人類學(xué)博士后
社區(qū)的話題逐漸科研化啊!
?
Y染色體上的突變形成的個體差異主要有兩大類,單核苷酸多態(tài)(SNP)和短串聯(lián)重復(fù)(STR)。DNA分子由四種堿基(A、T、C、G)按照一定的順序連接而成,SNP是僅僅一個位置上的堿基類型變化。Y染色體上的同一個SNP在人群中一般只有兩種類型。STR則是在染色體的特定區(qū)段,由幾個堿基組成一個單位重復(fù)出現(xiàn),不同的Y染色體上的同一個STR位置往往有不同的重復(fù)拷貝數(shù)。SNP和STR由于突變性質(zhì)和突變速度不同,在分析中有著不同的用途。SNP突變因為突變速率極低,可以做到在后代中永久地保留,后代只能在祖先的突變基礎(chǔ)上積累新的突變,而不會丟失祖先的突變特征。通過比較人類與黑猩猩的Y染色體差異,以及大家系中的Y染色體的差異程度,Y染色體上的SNP突變的速率被計算了出來。每出生一個男子,一個染色體位置上發(fā)生SNP突變的概率為大約三千萬分之一。實際上由于Y常染色質(zhì)區(qū)的保守性,以及人類歷史上大量男子都沒有男性后代保留至今的事實,實際的群體中突變率應(yīng)該低幾個數(shù)量級。而我們通常研究的是Y染色體非重組區(qū)大約三千萬個堿基對的常染色質(zhì)區(qū),按照每個堿基對三千萬分之一的突變率,這個區(qū)段內(nèi)每個男子平均都會有一個新的突變。這個新的突變隨機地出現(xiàn)在Y常染區(qū)的任意一個點上,如果這個突變了的點上再發(fā)生一次突變,那么這個突變就在后代中丟失了,我們就無法通過后代確定祖先的Y染色體突變譜。但是同一個點上先后發(fā)生兩次突變的概率,按照概率計算方法就是三千萬分之一的平方,也就是九百萬億分之一,相對于人類自古以來的人口,這個概率就近似于零。所以我們可以說,絕大多數(shù)情況下,祖先的Y染色體上出現(xiàn)的SNP突變特征在后代中能夠找到,而后代只能在祖先Y染色體突變譜的基礎(chǔ)上增加新的突變。利用Y染色體上穩(wěn)定遺傳的SNP,我們可以構(gòu)建出個體或家族之間明確的遺傳淵源。而且,既然SNP有穩(wěn)定的突變速率,當(dāng)我們統(tǒng)計出不同人的Y染色體之間的突變差異數(shù),將差異數(shù)除以速率,經(jīng)過換算就可以估算兩條Y染色體之間的分化時間。但是,由于SNP的突變速率實在太低,個體之間的突變差異散布在Y染色體的各處,只能使用Y染色體全測序來尋找,而目前全測序的成本太高,尚不能普遍應(yīng)用。這一缺點被Y染色體上的另一遺傳標(biāo)記STR彌補了。一些STR位點分布在Y染色體上的固定位置,每一個STR位點內(nèi)部的重復(fù)單位在傳代過程中改變著拷貝數(shù),這種改變也是有著固定的速率的。而STR突變速率要比SNP大得多,在家系中每出生一個男子每個STR位點突變概率大約是三百分之一。一般的Y染色體分析中,我們調(diào)查15個STR位點,那么總體突變率就大約是二十分之一。而Y染色體上大約有150個4至6個核苷酸重復(fù)的STR,如果分析全部的STR位點,那么總突變率大約就是二分之一。這一高突變率就非常有利于估算不同Y染色體之間的分化時間,因此STR位點成為了Y染色體上的“時鐘”。STR的突變是雙向性的,拷貝數(shù)可以增加或減少。有同一祖先的不同個體的同一STR位點,可能有不同突變方向和重復(fù)數(shù)。同SNP一樣,數(shù)個不同位置上的STR也可以構(gòu)成單倍型。在群體中分析STR單倍型的多樣性程度可以計算群體的共祖時間。
?
Y-STR計算TMRCA的常用方法是ASD法,參考Zhivotovsky et al 2001,Sengupta 2006.需要先計算:
Mean
Median
V(VARP)
D
tD
TD
這幾個函數(shù)。Mean是你要計算的某一單倍型的某一位點的STR變異次數(shù)的AVERAGE函數(shù),Median是這一位點的中值(Median函數(shù)),V(VARP)是該位點的無偏估計方差(VARP函數(shù)),然后計算D=(Mean - Median)power2 +V(VARP),(power2是2次方),D是每個STR位點一個值,然后計算你所有STR的D值的平均tD值(AVERADE(D)),TD=tD*25/0.00069,SE=STDEV(D),計算和TD一樣過程。
?
Y-STR計算TMRCA的另一方法是BATWING:Bayesian analysis of trees with internal node generation,需要設(shè)定initial effective population size (N), population growth rate per generation (α), the time in coalescent units when exponential growth (β) began was used gamma (2, 1) ,最后TMRCA由estimated population size N 與the height of the tree T (in coalescent units)相乘得出.
?
參考我的論文:Wang, Chuan-Chao, and Hui Li. "Evaluating the Y chromosomal STR dating in deep-rooting pedigrees." Investigative genetics 6.1 (2015): 1.
?
Y-SNP計算TMRCA的方法有很多,比如用BEAST (Bayesian MCMC).用SNP的主要問題在于如何選用突變率,選用家系突變率還是進化突變率等,兩者差別還是蠻大的,現(xiàn)在學(xué)界也不清楚哪個突變率更適合。參考我的論文:Wang, Chuan-Chao, et al. "Evaluating the Y chromosomal timescale in human demographic and lineage dating." Investigative genetics 5.1 (2014): 1.
?
Y-STR和Y-SNP計算TMRCA的比較請參考我的論文:Wang, Chuan-Chao, and Li Hui. "Comparison of Y-chromosomal lineage dating using either evolutionary or genealogical Y-STR mutation rates." bioRxiv (2014): 004705.
?
?
?
cedre - -----------------------------------------------------------
可以參考王大神的此文
Convergence of Y Chromosome STR Haplotypes from Different SNP Haplogroups Compromises Accuracy of Haplogroup Prediction
?
還有一片文章是對比str方法和全序方法共祖時間差異的,但忽然想不起在哪里了

要回復(fù)問題請先登錄注冊

  • <track id="ffr4e"></track>

      <dfn id="ffr4e"></dfn>

      主站蜘蛛池模板: 上栗县| 海林市| 刚察县| 黄石市| 当雄县| 台东市| 铜山县| 津南区| 板桥市| 监利县| 孟村| 苍南县| 当雄县| 芒康县| 额济纳旗| 吉安市| 高唐县| 福安市| 佛冈县| 东兰县| 南澳县| 葵青区| 新营市| 兴山县| 镇宁| 湘潭县| 苗栗县| 平度市| 满城县| 江门市| 安康市| 抚顺县| 日照市| 甘洛县| 申扎县| 虞城县| 揭西县| 额尔古纳市| 余庆县| 栾川县| 潍坊市|