亚洲精品午夜精品,日本二手网站,国产AⅤ爽AV久久久久成人社区,日本一二三区不收费av

使用 WeGene 需要啟用 Cookies, 請啟用后刷新頁面獲得更好的體驗
爽朗的RGMA基因 綜合討論組

請問我下載到的數據,為什么很多位點是缺失的,是什么原因導致的,能否解決?

缺失的數據量大概5-10%沒詳細看
2018-01-14 ? IP屬地中國
按熱門排序    按默認排序

4 個回復

核心數據確實缺失的少,1.47%
我是這樣算比例的,我把文件用UltraEdit打開,
顯示行數為10073391
以--作為關鍵詞
找到1215874個結果
得到結果0.1207
是不是就意味著我的樣本12.7%的位點是無法識別的呢?
zhengqiang - 勤奮學習
目前我們提供的核心數據部分NOCALL的比例應該不會超過2%,絕大部分都是1%左右。超過這個比例樣本都會做失敗處理。
出現nocall的原因主要是對應位點上的數據質量在臨界值附近,很難區分a或c,g或t,所以算法會把這類的信號做nocall處理。隨著積累的原始數據增加,其中會有一些nocall的數據因為算法和原始數據的迭代變成有值的部分。
大概百分比的話能有多少呢?

要回復問題請先登錄注冊

  • <track id="ffr4e"></track>

      <dfn id="ffr4e"></dfn>

      主站蜘蛛池模板: 姚安县| 二连浩特市| 武平县| 浦东新区| 安龙县| 正镶白旗| 扬州市| 孝昌县| 双牌县| 侯马市| 佛冈县| 达日县| 隆德县| 宝坻区| 建湖县| 达州市| 罗江县| 醴陵市| 昌都县| 合阳县| 眉山市| 武宁县| 阿拉善右旗| 武威市| 绥滨县| 宁晋县| 遵义县| 砀山县| 锦屏县| 新源县| 阿拉善右旗| 凤庆县| 铜陵市| 琼海市| 始兴县| 罗源县| 通州区| 赤水市| 肥东县| 嘉兴市| 岗巴县|