亚洲精品午夜精品,日本二手网站,国产AⅤ爽AV久久久久成人社区,日本一二三区不收费av

使用 WeGene 需要啟用 Cookies, 請啟用后刷新頁面獲得更好的體驗
yhlhhhhh yhlhhhhh - 每日與生物工程斗智斗勇到謝頂 綜合討論組

利用Python讀取fasta文件并進行一系列操作(上)

概述:
語言:python3.8
模塊:pysam,collections
可選:jupyter noebook
整體思路:將fasta格式的基因原始數據處理為方便讀寫的txt格式并進行操作
步驟:
1. 獲取自己的fasta文件(這里我將從NCBI上下載人類的ABO基因參考序列的fasta文件為例)

截屏2021-06-18_下午3.40_.18_.png

?
2. 利用pysam模塊的FastaFile函數讀取fasta,之后即可獲取fasta的基本信息:filename 文件名,references 染色體編號(因為這里我下載的是ABO基因的fasta,所以不是染色體編號),nreferences 染色體數,lengths 每條染色體長度(這個非常重要!)

截屏2021-06-18_下午3.59_.33_.png

?
3. 通過判斷輸出的長度,我們知道了這個ABO基因的長度值為42144,我們再利用fetch函數獲取ABO基因堿基序列(注意索引是從0開始)
?
4. 我們的最終目的是要輸出txt,所以就需要將我們的堿基序列寫到txt上

截屏2021-06-18_下午4.36_.43_.png

?
5. 我們可以利用我們輸出的txt來做點事情,例如看看這個序列中各種堿基數量,先讀取文件,再處理為列表,利用collection模塊的Counter函數來輸出結果

截屏2021-06-18_下午4.45_.30_.png

?
更多操作將在下篇解鎖!
2021-06-18 ? IP屬地北京
按熱門排序    按默認排序

1 個回復

看不懂呢

要回復問題請先登錄注冊

  • <track id="ffr4e"></track>

      <dfn id="ffr4e"></dfn>

      主站蜘蛛池模板: 鸡西市| 开原市| 年辖:市辖区| 博湖县| 海原县| 江津市| 万源市| 开原市| 股票| 章丘市| 凤庆县| 靖边县| 东至县| 东光县| 开阳县| 大洼县| 金坛市| 东乌珠穆沁旗| 拉萨市| 壶关县| 竹山县| 墨江| 灌云县| 文昌市| 安溪县| 重庆市| 安宁市| 昭通市| 伊宁县| 宝兴县| 昌乐县| 安达市| 长泰县| 托克逊县| 托里县| 巴中市| 中江县| 繁峙县| 额济纳旗| 甘洛县| 石嘴山市|