
imputation擴展數據的有效性
自己把在兩個公司測的(核心)位點和了一下,然后傳上dnagenics做了個數據?擴展+祖源分析
?
整合拓展出來的結果,比單個公司的結果都更說得通很多……單個公司的結果里都有比較莫名其妙的成分,整合拓展之后的沒有了。dnagenics而且可以出兩種結果,一個500年內近祖,一個超過500年的遠祖
?
擴展數據的有效性在理論上真的有這么強大嗎?還是這個只是碰巧了?
?
?
?
整合拓展出來的結果,比單個公司的結果都更說得通很多……單個公司的結果里都有比較莫名其妙的成分,整合拓展之后的沒有了。dnagenics而且可以出兩種結果,一個500年內近祖,一個超過500年的遠祖
?
擴展數據的有效性在理論上真的有這么強大嗎?還是這個只是碰巧了?
?
?
2 個回復
以前國內就有人試著將DNALAND(現已消失)生成的擴展數據轉化并傳到Gedmatch,結果共祖方面匹配到了不少外國人,大概率因為DNALAND用的模型以外國人為主。
贊同來自: Indocina
?
簡單整合不同公司的芯片測序位點數據,能互補增加各自芯片沒有納入檢測的SNP位點,位點多了,再做單倍群分型或祖源分析,可以增加可信度。
?
但impute基因插補受所使用的 reference panel 影響很大,以前大都是用歐美的基因面板庫做impute,比如亞洲的1KGP3,英國生物樣本庫(UK Biobank),腫瘤基因組圖譜(TCGA)計劃和多組學精準醫學研究計劃(TOPMed),但歐美人突變情況和東亞人肯定有一定差異。
?
我國科學家最近幾年在做中國人自己的reference panel,一個是2020年上海交通大學醫學院附屬瑞金醫院、國家代謝性疾病臨床醫學研究中心的寧光院士,王衛慶教授和畢宇芳教授,用了華大智造DNBSEQ測序平臺,從10588例人DNA樣本進行了40X深度全基因組測序,這個庫包含中國人數前10的民族,漢族、壯族、回族、滿族、苗族、彝族、藏族和蒙古族,含1.36億個基因多態性位點(SNP)和1千萬個插入或缺失位點(INDEL)
基因插補:https://www.chinamap.com/?
論文:https://www.nature.com/articles/s41422-021-00564-z
?
另一個是2021年11月16日剛出來的,中國科學院生物物理研究所徐濤院士團隊和何順民研究員團隊合作,?從2,999 個中國人(漢族人群)的全基因組深度測序數據(26.2X),并以中國神話中創造人類的女媧命名。包含7106萬SNPs 和819萬InDels的中國人群遺傳變異圖譜,并對其進行全面注釋。
基因插補:http://bigdata.ibp.ac.cn/NyuWa/
論文:https://www.cell.com/cell-reports/fulltext/S2211-1247(21)01499-6
?
中國人用中國自己的reference panel做impute,應該更能反映真實的突變情況。
贊同來自: orz_wohencai 、神秘的TP53 、yaoxt 、大灰狼
要回復問題請先登錄或注冊