
利用Python讀取fasta文件并進(jìn)行一系列操作(三)
概述:
本節(jié)目標(biāo):計(jì)算智人與猩猩ABO基因的相對(duì)熵
語(yǔ)言:python3.8
模塊:pysam, scipy
整體思路:先計(jì)算出序列中“AG”“CT”“AC”“AT”“GC”“GT”六種組合序列所占比,再計(jì)算相對(duì)熵
步驟:
1. 利用pysam模塊分別讀取智人ABO基因所有序列和猩猩ABO基因所有序列
?
2. 利用split函數(shù)切序列并用len函數(shù)返回結(jié)果-1,分別得出六種組合序列數(shù)量,再求占比
?
3. 利用scipy模塊的entropy函數(shù)求相對(duì)熵
?
結(jié)果:
0.6930868205144018
本節(jié)目標(biāo):計(jì)算智人與猩猩ABO基因的相對(duì)熵
語(yǔ)言:python3.8
模塊:pysam, scipy
整體思路:先計(jì)算出序列中“AG”“CT”“AC”“AT”“GC”“GT”六種組合序列所占比,再計(jì)算相對(duì)熵
步驟:
1. 利用pysam模塊分別讀取智人ABO基因所有序列和猩猩ABO基因所有序列
?
2. 利用split函數(shù)切序列并用len函數(shù)返回結(jié)果-1,分別得出六種組合序列數(shù)量,再求占比
?
3. 利用scipy模塊的entropy函數(shù)求相對(duì)熵
?
結(jié)果:
0.6930868205144018
0 個(gè)回復(fù)
要回復(fù)問(wèn)題請(qǐng)先登錄或注冊(cè)