使用本網(wǎng)站需要啟用 JavaScript, 請(qǐng)啟用后刷新頁(yè)面獲得更好的體驗(yàn)

亚洲精品午夜精品,日本二手网站,国产AⅤ爽AV久久久久成人社区,日本一二三区不收费av

<bdo id="fef0z"></bdo>

社區(qū)首頁(yè) 綜合討論區(qū) 討論詳情

yhlhhhhh - 每日與生物工程斗智斗勇到謝頂綜合討論組

從微基因的姓氏祖源中的祖源相似性一欄中爬取自己與所有地區(qū)的祖源相似度

為什么我會(huì)有這個(gè)沖動(dòng)：因?yàn)槲⒒蛑粫?huì)給出相似度最高地區(qū)，祖籍地以及現(xiàn)居地的祖源相似度。然而身為一個(gè)跨省混血表示很委屈。
話(huà)不多說(shuō)，教程開(kāi)始。
用到的軟件：VScode，Chrome
編程語(yǔ)言：Python3.8
編程模塊：chardet，pandas
思路：用Chrome的開(kāi)發(fā)者模式在官網(wǎng)前端上找到相似度，之后將數(shù)據(jù)記在txt上，選取一小段加密字符串，推測(cè)編碼方式，再根據(jù)找到的編碼方式解碼，將數(shù)據(jù)整理輸出成csv
步驟：
1. 找到下圖頁(yè)面，看到‘地圖’二字，將script標(biāo)簽展開(kāi)，會(huì)發(fā)現(xiàn)這里定義了一些變量，其中發(fā)現(xiàn)了變量名中有similar result等字樣，同時(shí)后面定義的字符串中包括一個(gè)類(lèi)似于python字典的東西，雖然鍵我們讀不懂，顯然是被加密的，但是值我們可以看出來(lái)都小于1，所以這應(yīng)該表示這是一個(gè)率，所以認(rèn)定這部分應(yīng)該和相似度關(guān)系很大。所以我們將這個(gè)script標(biāo)簽下的所有東西都copy下來(lái)，粘貼到一個(gè)txt上。

截屏2021-07-15_下午11.05_.31_.png

?
2. 我們開(kāi)始破解那些謎一樣的鍵。我們利用chardet模塊過(guò)程來(lái)先識(shí)別，先拿一小塊試試。
代碼：

截屏2021-07-12_下午4.44_.01_.png

?
結(jié)果：

截屏2021-07-12_下午4.44_.21_.png

?
有大概93%的概率是utf-8加密，所以我們就利用utf-8方法將這段字符串解碼
代碼：

截屏2021-07-12_下午4.44_.32_.png

?
結(jié)果：

截屏2021-07-12_下午4.44_.48_.png

?
最后發(fā)現(xiàn)真的是個(gè)地名
3. 最后到了熟悉的讀取處理數(shù)據(jù)環(huán)節(jié)
代碼：

截屏2021-07-12_下午4.45_.10_.png

?
結(jié)果：

截屏2021-07-12_下午4.45_.34_.png

?
4. 將字典數(shù)據(jù)轉(zhuǎn)換為pandas的series，再輸出到csv中

2021-07-15 ? IP屬地北京

按熱門(mén)排序按默認(rèn)排序

2 個(gè)回復(fù)

yhlhhhhh

- 每日與生物工程斗智斗勇到謝頂

前排提示！！！注意只能提取自己數(shù)據(jù)哦，禁止在未經(jīng)別人允許情況下提取他人數(shù)據(jù)（求生欲滿(mǎn)滿(mǎn)）

懵懂的PRDM2基因

要回復(fù)問(wèn)題請(qǐng)先登錄或注冊(cè)

每日與生物工程斗智斗勇到謝頂

綜合討論組

8211 個(gè)討論

進(jìn)入小組

<track id="ffr4e"></track>

<dfn id="ffr4e"></dfn>

主站蜘蛛池模板：任丘市| 贵溪市| 科技| 阿图什市| 奉节县| 麦盖提县| 苗栗县| 昌图县| 江油市| 旌德县| 和田县| 乐山市| 东丽区| 普陀区| 泽库县| 孟连| 常州市| 政和县| 重庆市| 泽州县| 常山县| 象山县| 孟津县| 柳林县| 昔阳县| 大邑县| 林甸县| 印江| 水城县| 伊川县| 芦溪县| 丰顺县| 麦盖提县| 乳山市| 德昌县| 乐山市| 淮阳县| 邓州市| 额济纳旗| 宁陕县| 绍兴市|

<ul id="ni934"></ul>