亚洲精品午夜精品,日本二手网站,国产AⅤ爽AV久久久久成人社区,日本一二三区不收费av

使用 WeGene 需要啟用 Cookies, 請啟用后刷新頁面獲得更好的體驗
yhlhhhhh yhlhhhhh - 每日與生物工程斗智斗勇到謝頂 綜合討論組

利用Ancol PCA法將祖源計算器結果與實際情況相結合可視化分析

前言:看到題目的小伙伴是不是內心有一萬個?是不是想問那個Ancol PCA是什么鬼。不知道正常,因為這詞是我造的233333
為什么叫這個名字:眾所周知血統的英文是Ancestry,位置的英文是location,這倆單詞取前三個字母,loc再倒過來去掉c,組合在一起不就是Ancol嗎~PCA就是主成分分析的意思不變哦~
下面教程正式開始:
編程語言:python3.8
模塊:pandas,numpy,sklearn,matplotlib,geopy
整體思路:先將計算器的多維數據降為二維數據并使其作為x,y軸,再將位置數據轉化為一維數據并使其作為z軸,最后組合為三維數據并可視化
代碼:
獲取位置經緯度

截屏2021-07-28_下午3.19_.04_.png

?
可視化:

截屏2021-07-28_下午3.20_.18_.png

?
結果展示:

截屏2021-07-28_下午3.25_.08_.png

?
(此示例是利用了韓國人和吉林省朝鮮族的e11數據以及位置信息做出來的Ancol PCA圖)
此方法的優勢:可以將計算器結果極為相似的兩個或多個族群在散點圖上分散開,并且實現了將基因水平與個體水平較為科學的相結合分析
此方法缺點:點與點的的歐式距離不能準確的反映族群間的遺傳距離,此外,對于暈3D的人來說數據的讀取也較為難受。
此方法的意義:以前大家看祖源的分析方法就只是直接看計算器結果再問問哪里人什么族,推斷。最多也就再結合著傳統的PCA看看。但利用此方法可以將位置信息數字化,更加科學的進行溯源。
下面是Ancol PCA的流程圖:

截屏2021-07-28_下午2.13_.11_.png

?
以及繪制流程圖用的代碼:

截屏2021-07-28_下午3.44_.40_.png

?
感謝:
數據提供:母系-mtDNA祖源群 ? ?QQ:923891525
提供編程語言:Python ? ? 官網:https://www.python.org
提供模塊:
pandas ? ? ? 官網:https://pandas.pydata.org
numpy ? ? ? ?官網:https://www.numpy.org/
matplotlib ? 官網:https://matplotlib.org
sklearn ? ? ? 官網:https://scikit-learn.org/stable/
geopy ? ? ? ? 項目網站:https://github.com/geopy/geopy
graphviz ? ? 官網:http://www.graphviz.org
??楊昊霖
轉載時請注明出處
2021-07-28 ? IP屬地北京
按熱門排序    按默認排序

0 個回復

要回復問題請先登錄注冊

  • <track id="ffr4e"></track>

      <dfn id="ffr4e"></dfn>

      主站蜘蛛池模板: 奉贤区| 玛曲县| 青龙| 横峰县| 菏泽市| 屏东市| 多伦县| 左贡县| 汉川市| 侯马市| 临朐县| 区。| 绥棱县| 顺昌县| 商水县| 张家界市| 隆尧县| 旅游| 惠水县| 凉山| 保亭| 商丘市| 阜平县| 广水市| 密山市| 贺州市| 津南区| 沁阳市| 金塔县| 定襄县| 永川市| 敖汉旗| 自治县| 靖远县| 平山县| 眉山市| 濮阳县| 延庆县| 古田县| 尼玛县| 海林市|