
科學分析DTC基因檢測為什么假陽性特別高
最近權威期刊發表DTC基因檢查(類似23andme, 微基因, 23魔方等等)的突變假陽性高達40%。
https://www.nature.com/articles/gim201838
現在我告訴你為啥這個可能是真的。
首先突變多數是發生率極低的那種,類似于幾千到幾十萬分之一。
做醫生的人選擇檢查時往往會去了解一個檢查項目的敏感性、特異性。很多醫生朋友把這個數值看做是檢驗的預測值。雖然說,理論上檢查的敏感性和特異性越高,該檢查的預測價值越大。但很可惜的是,如果患者的檢驗前概率很低,哪怕該檢查的理論敏感性和特異性達到99%,該檢查也不具有很高的預測性。
假陽性率=假陽性數量/(假陽性數量+真陰性數量)。它也等于1-特異性。根據上面CT假設的特異性,可知假陽性率是1%。
假陰性率=假陰性數量/(假陰性數量+真陽性數量)。它也等于1-敏感性。同上所述,可知假陰性率是1%。
中國的近年來的數據顯示,中國的男性肺癌發病率約為10萬分之50。假設高分辨率CT的敏感性和特異性都達到99%。那么一個人做高分辨率CT的結果是陽性的,請問,你有多大把握認定他是肺癌呢?
我們首先來看陽性預測值,即CT發現有問題的人里有多少是肺癌的。我們知道10萬人里有50個是肺癌,那么真陰性人數是99950人。假設假陽性人數是X,則為X/(X+99950)=1%,求X≈1009.6,也就是說在檢驗前概率只有10萬分之50的情況下,你做完CT,會有1009個左右的假陽性肺癌人數----他們不是肺癌,卻被你懷疑是肺癌。而這其中其實約只有50個人是肺癌。這里面僅僅約4.9%的人是肺癌。
再看看陰性預測值呢?即CT發現沒問題的人里有多少是真正無肺癌的。我們知道真陽性人數是50個人,那么計算數值是X/(X+50)=1%,X≈0.505。也就是說,在檢驗前概率只有10萬分之50人的情況下,你做完CT,會有0.5個人是假陰性肺癌----他們是肺癌卻被你認為不是肺癌。他的陰性預測值是99.999%。也就是說,在這個情況下,CT檢查是陰性,你可以很肯定的告訴他幾乎不可能是肺癌。
我們發現一點,這種很低概率的疾病下,哪怕檢查非常好,如果你是陽性的,也不能證明你有這個病,但如果檢查是陰性的,倒是可以肯定你沒這個病。
好了,現在假設微基因的基因檢測敏感性和特異性達到99.9%,某種罕見遺傳病發病率是萬分之一,那么微基因30萬用戶應該有30個病人,那么真陰性人數是299970人。假設假陽性人數是X,則為X/(X+299970)=0.1%,求X≈300,好了結果300個基因檢測陽性的結果真正患病的只有30個。
結論:對于罕見突變的遺傳病,即使某基因檢測有很高的特異性,如果你是陽性的,也不能證明你有這個病。
https://www.nature.com/articles/gim201838
現在我告訴你為啥這個可能是真的。
首先突變多數是發生率極低的那種,類似于幾千到幾十萬分之一。
做醫生的人選擇檢查時往往會去了解一個檢查項目的敏感性、特異性。很多醫生朋友把這個數值看做是檢驗的預測值。雖然說,理論上檢查的敏感性和特異性越高,該檢查的預測價值越大。但很可惜的是,如果患者的檢驗前概率很低,哪怕該檢查的理論敏感性和特異性達到99%,該檢查也不具有很高的預測性。
假陽性率=假陽性數量/(假陽性數量+真陰性數量)。它也等于1-特異性。根據上面CT假設的特異性,可知假陽性率是1%。
假陰性率=假陰性數量/(假陰性數量+真陽性數量)。它也等于1-敏感性。同上所述,可知假陰性率是1%。
中國的近年來的數據顯示,中國的男性肺癌發病率約為10萬分之50。假設高分辨率CT的敏感性和特異性都達到99%。那么一個人做高分辨率CT的結果是陽性的,請問,你有多大把握認定他是肺癌呢?
我們首先來看陽性預測值,即CT發現有問題的人里有多少是肺癌的。我們知道10萬人里有50個是肺癌,那么真陰性人數是99950人。假設假陽性人數是X,則為X/(X+99950)=1%,求X≈1009.6,也就是說在檢驗前概率只有10萬分之50的情況下,你做完CT,會有1009個左右的假陽性肺癌人數----他們不是肺癌,卻被你懷疑是肺癌。而這其中其實約只有50個人是肺癌。這里面僅僅約4.9%的人是肺癌。
再看看陰性預測值呢?即CT發現沒問題的人里有多少是真正無肺癌的。我們知道真陽性人數是50個人,那么計算數值是X/(X+50)=1%,X≈0.505。也就是說,在檢驗前概率只有10萬分之50人的情況下,你做完CT,會有0.5個人是假陰性肺癌----他們是肺癌卻被你認為不是肺癌。他的陰性預測值是99.999%。也就是說,在這個情況下,CT檢查是陰性,你可以很肯定的告訴他幾乎不可能是肺癌。
我們發現一點,這種很低概率的疾病下,哪怕檢查非常好,如果你是陽性的,也不能證明你有這個病,但如果檢查是陰性的,倒是可以肯定你沒這個病。
好了,現在假設微基因的基因檢測敏感性和特異性達到99.9%,某種罕見遺傳病發病率是萬分之一,那么微基因30萬用戶應該有30個病人,那么真陰性人數是299970人。假設假陽性人數是X,則為X/(X+299970)=0.1%,求X≈300,好了結果300個基因檢測陽性的結果真正患病的只有30個。
結論:對于罕見突變的遺傳病,即使某基因檢測有很高的特異性,如果你是陽性的,也不能證明你有這個病。
2 個回復
1989年的時候,他為了申請保險,接受了一次抽血檢查,檢查項目是HIV,也就是導致艾滋病的那種病毒。很不幸的是,他的這項檢查結果是陽性的。醫生告訴他,這個結果意味著,他有999‰的概率得了艾滋病,并且會在10年內死去(當時是1989年,現在艾滋病的死亡率已經明顯降低了。)
我想,幾乎所有人聽到這樣的結果,應該都會感到無比的痛苦和沮喪;但是,Leonard并沒有,畢竟他是位物理學家,他懂貝葉斯定理,所以,他知道醫生其實犯了個錯誤。
醫生之所以說他有999‰的概率得病了,是因為這項檢查的陽性預測值是999‰,也就是說每1000個檢查結果陽性的人中,有999個是患者——換句話說,也就意味著,每1000個結果陽性的人中,會有1個人是假陽性的,也就是根本沒有得病。
不過,1‰的概率實在太小了,沒有人會對這個小概率抱有多大希望。
但是,Leonard知道,以這種算法給出的概率是不對的,因為它忽略了艾滋病的人群發病率。
Leonard是異性戀,不用**,在當時的美國,這樣的白人男性得艾滋病的人群發病率是萬分之一,也就是每10000個人里,有一個是艾滋病患者。現在我們假設給這10000個人都做了HIV的檢查,根據檢查1‰的假陽性率,會有10個健康人被錯查出來得了艾滋病。假設那一個真正的艾滋病患者也同樣被查出來陽性,那么這10000個人里,有9989個人查出來結果陰性,11個結果陽性。因此,從概率上講,這11個被查出來陽性的人中,只有1/11的幾率是真正的患者。
也就是說,如果在沒有危險因素的全人群中篩查,即使結果陽性,也有超過90%(10/11)的概率,其實你并沒有得病。
這么計算過之后,Leonard表示情緒穩定,而且最終事實證明,他確實沒有感染HIV。
Leonard沒有得艾滋病當然是好事,但是這反映出一個重要的問題,那就是,當人群發病率低的時候,檢查的準確度再高,只要不是100%,它所帶來的假陽性結果就不容小覷。
贊同來自: 監聽員1379 、可愛的圓圓
贊同來自:
要回復問題請先登錄或注冊