亚洲精品午夜精品,日本二手网站,国产AⅤ爽AV久久久久成人社区,日本一二三区不收费av

使用 WeGene 需要啟用 Cookies, 請(qǐng)啟用后刷新頁(yè)面獲得更好的體驗(yàn)
yhlhhhhh yhlhhhhh - 每日與生物工程斗智斗勇到謝頂 綜合討論組

詳解AlphaFold生成的PDB文件以及3D打印需要的STL文件

繼上篇帖子
http://www.sofreetech.com/question/25230?
里寫的獎(jiǎng)?lì)A(yù)測(cè)的模型用3D打印機(jī)打印出來(lái),而這其中就涉及到格式轉(zhuǎn)換的問(wèn)題,但據(jù)我所知貌似沒(méi)有專門的轉(zhuǎn)換工具,所以需要用編程實(shí)現(xiàn)。而用編程實(shí)現(xiàn)的兩個(gè)基礎(chǔ)就是要知道待轉(zhuǎn)換格式的數(shù)據(jù)框架和轉(zhuǎn)換格式的數(shù)據(jù)框架分別是什么,之后再想解決方案。
--------------------
PDB文件部分:
首先我百度了一下,發(fā)現(xiàn)網(wǎng)上給的資料并不多,有些給出的則是比較籠統(tǒng)的解釋,并沒(méi)有針對(duì)某個(gè)實(shí)例。這是找到的資料:
https://blog.sciencenet.cn/blog-548663-895916.html
于是我就想通過(guò)某種方式打開這個(gè)文件并輸出到txt上。受以前繪制發(fā)育樹貼:
http://www.sofreetech.com/question/24154
的啟發(fā),我發(fā)現(xiàn)雖然biopython要求的是Newick格式,但是把形如Newick的數(shù)據(jù)框架放在txt中同樣能輸出結(jié)果,我就想到既然能夠直接用txt讀取,那為什么不能試試以txt的形式打開呢,于是我打開VScode,寫了這一段Python腳本:

截屏2022-01-14_上午10.00_.31_.png

輸出結(jié)果發(fā)現(xiàn)竟然成功了:

截屏2022-01-14_上午10.00_.44_.png

于是我又寫了下面一段腳本將結(jié)果輸出到txt中以方便觀察:

截屏2022-01-14_上午10.05_.19_.png

輸出結(jié)果:

截屏2022-01-14_上午10.07_.05_.png

?
首先根據(jù)我目前已有的生物和化學(xué)知識(shí)可以直接看出:
第一列代表的是微粒類型,ATOM代表原子,TER代表殘基
第二列很明顯是微粒編號(hào)
第三列嘛。。。不知道,先跳過(guò)去,一會(huì)再看
第四列,氨基酸名稱,并且是三字母縮寫
第五列,不知道,先跳過(guò)
第六列,一看和氨基酸名稱的分布相同,并且有向下標(biāo)序號(hào)的感覺(jué),所以猜是氨基酸序列編號(hào)
之后看到后面有5列數(shù),其中第3列仿佛和第4列有些分開,所以我猜7,8,9列是一組數(shù)據(jù),10,11列是另一種或兩種數(shù)據(jù)。我又看了看7,8,9列都有負(fù)有正,況且pdb文件中肯定要有表示位置的數(shù)據(jù),所以我猜測(cè)7,8,9列分別代表著x,y,z坐標(biāo)。至于10,11列是什么不知道,也先跳過(guò)
最后一列,我一看都是字母,而且大多是CHON,所以是元素符號(hào)
之后我就查閱了資料,說(shuō)第三列是原子名稱,第五列是肽鏈名,第11列是占有率,第12列是溫度因子
通過(guò)我的感覺(jué)以及不斷嘗試,我發(fā)現(xiàn)第3列是帶著位置信息的原子名稱,規(guī)則如下:
第三列表示原子在中心碳或R基的位置

肽鍵上的原子直接寫元素名稱即可
字符第一位為元素名稱

第二位為從中心碳開始到遠(yuǎn)中心碳端的距離(從B~Y,不包括C,G)
當(dāng)R基上存在苯環(huán)時(shí),連接苯環(huán)的近中心碳端字符第二位為G;該位置的對(duì)位碳位置字符第二位則為Z;兩臨位碳字符第二位按照順序向下標(biāo),并在第三位分別加上1和2以區(qū)分兩個(gè)臨位碳;兩對(duì)位碳的標(biāo)注方法與臨位碳相同

若出現(xiàn)4位的情況,則說(shuō)明R基上有支鏈,此時(shí)第3位代表的是主鏈或支鏈,第4位則代表的才是各個(gè)氫原子。
?
emmmm這么說(shuō)可能比較抽象,我舉幾個(gè)例子吧:
?
甘氨酸:

WechatIMG398.jpeg


WechatIMG399.jpeg

?
亮氨酸:

WechatIMG400.jpeg


WechatIMG401.jpeg

?
苯丙氨酸:

WechatIMG402.jpeg

?
-----------------
STL文件部分:
根據(jù)我當(dāng)時(shí)在清華做項(xiàng)目的那段時(shí)間教授跟我說(shuō)的,STL有明碼形式和二進(jìn)制形式,它會(huì)將表面用三角來(lái)代替以方便打印。但是這執(zhí)導(dǎo)的信息太少了,于是,我一去問(wèn)了一下度娘:

二進(jìn)制STL文件用固定的字節(jié)數(shù)來(lái)給出三角面片的幾何信息。
文件起始的80個(gè)字節(jié)是文件頭,用于存貯文件名;
緊接著用 4 個(gè)字節(jié)的整數(shù)來(lái)描述模型的三角面片個(gè)數(shù),
后面逐個(gè)給出每個(gè)三角面片的幾何信息。每個(gè)三角面片占用固定的50個(gè)字節(jié),依次是:
3個(gè)4字節(jié)浮點(diǎn)數(shù)(角面片的法矢量)
3個(gè)4字節(jié)浮點(diǎn)數(shù)(1個(gè)頂點(diǎn)的坐標(biāo))
3個(gè)4字節(jié)浮點(diǎn)數(shù)(2個(gè)頂點(diǎn)的坐標(biāo))
3個(gè)4字節(jié)浮點(diǎn)數(shù)(3個(gè)頂點(diǎn)的坐標(biāo))個(gè)
三角面片的最后2個(gè)字節(jié)用來(lái)描述三角面片的屬性信息。
一個(gè)完整二進(jìn)制STL文件的大小為三角形面片數(shù)乘以 50再加上84個(gè)字節(jié)。
?

UINT8//Header//文件頭
UINT32//Numberoftriangles//三角面片數(shù)量
//foreachtriangle(每個(gè)三角面片中)
REAL32[3]//Normalvector//法線矢量
REAL32[3]//Vertex1//頂點(diǎn)1坐標(biāo)
REAL32[3]//Vertex2//頂點(diǎn)2坐標(biāo)
REAL32[3]//Vertex3//頂點(diǎn)3坐標(biāo)
UINT16//Attributebytecountend//文件屬性統(tǒng)計(jì)
?
嘿嘿,謝謝度娘(doge
2022-01-14 ? IP屬地北京
按熱門排序    按默認(rèn)排序

0 個(gè)回復(fù)

要回復(fù)問(wèn)題請(qǐng)先登錄注冊(cè)

  • <track id="ffr4e"></track>

      <dfn id="ffr4e"></dfn>

      主站蜘蛛池模板: 绿春县| 双柏县| 封丘县| 乌什县| 仁化县| 如东县| 乾安县| 抚远县| 云南省| 衢州市| 宜川县| 射阳县| 石嘴山市| 许昌市| 比如县| 盐亭县| 浦北县| 湘阴县| 安溪县| 陈巴尔虎旗| 涟水县| 离岛区| 广水市| 东山县| 酒泉市| 漳浦县| 金阳县| 德州市| 新竹县| 抚远县| 益阳市| 宾阳县| 南投县| 家居| 建昌县| 团风县| 容城县| 汉阴县| 南江县| 定远县| 龙里县|