使用本網站需要啟用 JavaScript, 請啟用后刷新頁面獲得更好的體驗
贊同來自: wang 、cqnyfz 、flyboyleo 、Guy_KAI 、yysky723 、元月十號更多 ?
要回復問題請先登錄或注冊
大航寶
一句話介紹
綜合討論組
8194 個討論
1 個回復
?
首先,大部分關于運動、營養、疾病、藥物等內容的解讀規則是來自ClinVar,dbSNP,DrugBank等等數據庫的,并不是來自任何原始數據的分析。現在諸如個人的風險跟平均風險的關系,相同人數的百分比,以及祖源等分析和解讀的模型是用到了大量的原始數據來構建。接下來說說WeGene用到的數據和大概的應用。
?
現在WeGene用到的數據一部分來自公共數據集,例如千人基因組、HGDP等等,另一部分是WeGene自己的數據。
?
千人基因組、HGDP等數據是用在了祖源成分分析的模型構建中。@wang 通過一些人類學的規則,篩選出了500多個有可能能代表各個族群的樣本,然后@ ?通過使用一些分析方法再篩掉了一些異常的樣本,最終得到我們的祖源成分的訓練數據集。
?
另外,WeGene自己的數據主要是用在諸如有多少人給你有一樣的基因型,以及類似運動基因中各項內容的分數分布的計算上,做一些中國人的群體統計的分析。
?
各種具體的算法我們會整理之后逐步開源的,相關技術的白皮書也會發布出來,數據的使用會有官方的倫理委員會來審查,請大家指點和監督:)
贊同來自: wang 、cqnyfz 、flyboyleo 、Guy_KAI 、yysky723 、元月十號更多 ?
要回復問題請先登錄或注冊