
“祖源分析”是什么鬼?
? ? ? ? ? ? ? ? ? ? ? ? ? ?
?
?相信大家在心底都會有這樣一個問題:我是從哪里來?又要到哪里去?我們一直在試圖回答這兩個終極命題。從哪里來,指的是“祖源”分析,從遺傳學角度來描繪你的祖先是誰;到哪里去,也就是健康風險,在疾病和遺傳位點關聯分析的基礎上,來預測你患某些疾病的可能性。我這里主要談第一個問題。
現代科學告訴我們,我們是從500多萬年前的古猿進化而來,我們最晚近的共同祖先生活在20多萬年前的非洲,在進化的過程中,我們并不孤單,直到3萬多年前,地球上還有著我們的兄弟姐妹,比如歐洲的尼安德特人、西伯利亞的丹尼索瓦人,但他們最終滅絕了。而我們的祖先在5-10萬年前也走出了非洲,經由歐亞大陸,到達大洋洲和美洲,最后成功遍布了地球上的各個角落。從遺傳學的角度,我們沒有辦法直接將500萬年前的古猿DNA和我們的DNA進行比較,但我們可以理清楚從20萬年前到千百年前我們的祖先的遷徙和混合情況,比如說你的體內有多少歐洲人的血統?你是南方人還是北方人?甚至可以回答你是不是可能的三皇五帝的后代?
我們的工具是整合了60萬個遺傳位點的高密度全基因組芯片,包括了近2萬個Y染色體位點和近5千個線粒體(mtDNA)位點,剩余的位點位于22對常染色體和X染色體上。這22對常染色體的每一對染色體都有一條來自父系,一條來自母系,兩條染色體在傳代過程中對應的部分會發生交換,從而造成混血的效應,就是遺傳學上說的重組,使得后代帶有父母雙方的遺傳特征。而Y染色體卻直接代表著父系遺傳,永遠是父子相傳的,不會受到任何社會文化和自然因素的影響,而且不同類型的Y染色體有著不同的地理分布,所以研究Y染色體是直接追溯群體或者家族的父系起源的最佳方法,是驗證祖先與后代的父系關聯的唯一手段。例如,在曹操的后人中分析Y染色體特征,我們就可以了解曹操本人的Y染色體特征。同樣地,mtDNA只能有母親傳給子女,代表了單純的母系遺傳,我們可以由mtDNA來追溯母親的母親的母親……。我們所檢測的Y染色體和mtDNA位點是世界同行業中最多的,所涉及的支系是最全面的,這也是許多溯祖愛好者選擇WeGene的原因。相比于Y染色體和mtDNA所描繪的久遠歷史,常染色體更能反映近千百年來的混血,比如你帶有蒙古人特有的Y染色體,但常染色體上卻可能是南方漢族。也就是說,要綜合這三部分的結果,才能更全面地解讀自己的遺傳源流。
祖源分析其實是一個比較的過程,將你的數據和不同人群的進行比較來看你和哪些人群最相近、你可以模擬成由哪些人群按何種比例混合而成的等。因為要比較,所以參考數據庫至關重要。舉個簡單的例子,可能是由于缺少參考數據,23andme只能將你劃分為中國人,而Ancestry更離譜地把你認為是波利尼西亞人。而我們有著涵蓋全球200多個族群的數據庫,在東亞范圍內有著北方漢族、南方漢族、日韓、藏緬語、苗瑤語、侗傣語、南島語、南亞語以及西北和東北的眾多蒙古、通古斯和突厥語人群。有了參考人群之后,提取這些人群各自的特征性遺傳標記是后續解構祖源成分的關鍵。這一步主要是根據遺傳位點在人群中的頻率分布,簡單來講就是A位點的某分型在A人群中高頻出現,而在其他人群中是沒有的或極低頻的,那我們就可以把A位點的這個分型認為是A人群的特征性位點。推算完這些位點的歸屬人群,那么我們只要數一數你基因組上的不同類別的遺傳位點的數目就大致得出了你的祖源成分。
?
雖然我們對東亞人群的解析度遠遠高于世界范圍內的其他同行,但仍有一些問題是現在難以回答清楚的,比如說誰是“源”誰是“流”,我們難以準確判斷某樣本中高比例的韓國人成分是由于基因從大陸流向朝韓半島還是相反(或者兩者都有),因為我們參考數據庫里的現代人群可能都是復雜混合過了的,解決辦法是尋找古代的未經混合的人群來做參考數據,這是我們正在做的。
?
?相信大家在心底都會有這樣一個問題:我是從哪里來?又要到哪里去?我們一直在試圖回答這兩個終極命題。從哪里來,指的是“祖源”分析,從遺傳學角度來描繪你的祖先是誰;到哪里去,也就是健康風險,在疾病和遺傳位點關聯分析的基礎上,來預測你患某些疾病的可能性。我這里主要談第一個問題。
現代科學告訴我們,我們是從500多萬年前的古猿進化而來,我們最晚近的共同祖先生活在20多萬年前的非洲,在進化的過程中,我們并不孤單,直到3萬多年前,地球上還有著我們的兄弟姐妹,比如歐洲的尼安德特人、西伯利亞的丹尼索瓦人,但他們最終滅絕了。而我們的祖先在5-10萬年前也走出了非洲,經由歐亞大陸,到達大洋洲和美洲,最后成功遍布了地球上的各個角落。從遺傳學的角度,我們沒有辦法直接將500萬年前的古猿DNA和我們的DNA進行比較,但我們可以理清楚從20萬年前到千百年前我們的祖先的遷徙和混合情況,比如說你的體內有多少歐洲人的血統?你是南方人還是北方人?甚至可以回答你是不是可能的三皇五帝的后代?
我們的工具是整合了60萬個遺傳位點的高密度全基因組芯片,包括了近2萬個Y染色體位點和近5千個線粒體(mtDNA)位點,剩余的位點位于22對常染色體和X染色體上。這22對常染色體的每一對染色體都有一條來自父系,一條來自母系,兩條染色體在傳代過程中對應的部分會發生交換,從而造成混血的效應,就是遺傳學上說的重組,使得后代帶有父母雙方的遺傳特征。而Y染色體卻直接代表著父系遺傳,永遠是父子相傳的,不會受到任何社會文化和自然因素的影響,而且不同類型的Y染色體有著不同的地理分布,所以研究Y染色體是直接追溯群體或者家族的父系起源的最佳方法,是驗證祖先與后代的父系關聯的唯一手段。例如,在曹操的后人中分析Y染色體特征,我們就可以了解曹操本人的Y染色體特征。同樣地,mtDNA只能有母親傳給子女,代表了單純的母系遺傳,我們可以由mtDNA來追溯母親的母親的母親……。我們所檢測的Y染色體和mtDNA位點是世界同行業中最多的,所涉及的支系是最全面的,這也是許多溯祖愛好者選擇WeGene的原因。相比于Y染色體和mtDNA所描繪的久遠歷史,常染色體更能反映近千百年來的混血,比如你帶有蒙古人特有的Y染色體,但常染色體上卻可能是南方漢族。也就是說,要綜合這三部分的結果,才能更全面地解讀自己的遺傳源流。
祖源分析其實是一個比較的過程,將你的數據和不同人群的進行比較來看你和哪些人群最相近、你可以模擬成由哪些人群按何種比例混合而成的等。因為要比較,所以參考數據庫至關重要。舉個簡單的例子,可能是由于缺少參考數據,23andme只能將你劃分為中國人,而Ancestry更離譜地把你認為是波利尼西亞人。而我們有著涵蓋全球200多個族群的數據庫,在東亞范圍內有著北方漢族、南方漢族、日韓、藏緬語、苗瑤語、侗傣語、南島語、南亞語以及西北和東北的眾多蒙古、通古斯和突厥語人群。有了參考人群之后,提取這些人群各自的特征性遺傳標記是后續解構祖源成分的關鍵。這一步主要是根據遺傳位點在人群中的頻率分布,簡單來講就是A位點的某分型在A人群中高頻出現,而在其他人群中是沒有的或極低頻的,那我們就可以把A位點的這個分型認為是A人群的特征性位點。推算完這些位點的歸屬人群,那么我們只要數一數你基因組上的不同類別的遺傳位點的數目就大致得出了你的祖源成分。
?
雖然我們對東亞人群的解析度遠遠高于世界范圍內的其他同行,但仍有一些問題是現在難以回答清楚的,比如說誰是“源”誰是“流”,我們難以準確判斷某樣本中高比例的韓國人成分是由于基因從大陸流向朝韓半島還是相反(或者兩者都有),因為我們參考數據庫里的現代人群可能都是復雜混合過了的,解決辦法是尋找古代的未經混合的人群來做參考數據,這是我們正在做的。
7 個回復
贊同來自: yanc 、zoushuhua 、MrDoubleX 、黃隆思 、pds1990 、小黑gg 、yuezhongfu 、cece0910更多 ?
贊同來自: 藍星旗 、C142857
贊同來自: C142857
贊同來自:
贊同來自:
贊同來自:
贊同來自:
要回復問題請先登錄或注冊