在醫學界的共識下,p-value 雖然一直以來都被廣泛地應用在各種醫學文獻中,但它還是有其一定的限制性。
以下將為大家簡介 p-value的一些先天弱點及其應用上的迷思。
首先,p-value < 0.05 雖代表著兩個群體之間具有統計學上之顯著差異,
但反過來當p-value > 0.05 時,卻並不意味著兩個群體之間就一定沒有差異,
它只是告訴我們這趟比較未能確定這兩個群體之間是否有所差異而已。
實際上,p-value < 0.05 只能回答我們這樣的一個問題:『兩個處置之間是否能造成統計學上之顯著差異?』
但我們必須切記,所謂臨床醫學上重要的差異,不管它是否具統計學上的意義,
本身定義上就是重要的! 畢竟,臨床上的重要性(Clinical Importance)應取決於該醫學領域之專業判斷,
例如: 某醫療處置之介入可能只會造成極少數人失明(統計學上並無顯著差異),但此等臨床上的差異性即便很小,
仍屬非常嚴重,不容忽視。相反地,某一種差異即便具有統計學上的意義(Statistical Significance),
卻仍可能不具臨床上的重要性。
例如: 某醫療處置之介入可能會造成蠻多人腋毛變得較柔軟(統計學上具顯著差異),但此等臨床上的差異性即便頗大,仍非十分重要。
由於p-value 乃代表兩個群體之間的差別是純粹機緣巧合導致的機率,其並沒有任何單位,
因此光看p-value 無法一目了然地從中直接看出比較結果的差距幅度及其臨床重要性。
另外,p-value 只能告訴我們兩個群體之間有否統計學上之顯著差異,不是『有』就是『沒有』,
讀者完全未能從p-value 劃分的界線上看出來位於邊緣地帶的差異程度,
例如: p-value 只能告訴我們某醫療處置之介入能否造成血中膽固醇之變化具顯著差異(即有否Hypercholesterolemia),
但卻沒有告訴我們當中的差異是由拿來比較之群體中所有個體均勻一致地造成的(全部有服藥的人total cholesterol都在150 mg/dl 以下),
還是分佈不均地產生的(有些有服藥的人total cholesterol 在150 mg/dl 以下,但有些卻在190 mg/dl 以上)。
p-value 並不考慮效果的大小。一項大型研究中的一個小小的影響,往往可以與一個小型研究中的一個大大的影響具有相同的p-value。
因此,一個統計力(power)低、樣本數(sample size)小而呈無統計學上差異的研究結果,
我們並不可以武斷地說其發現一定是『負面』的,卻只能說該項研究是『無定論』的而已。
針對上述p-value 的種種弱點,在下一篇文章中,我將為大家介紹一個日漸受到各大醫學期刊重視的替代方案 ~ 信賴區間(Confidence Interval)。
- Mar 14 Wed 2012 21:37
p-Value的限制(醫護人員版) 急診專科醫師 李啟偉 撰
close
全站熱搜
留言列表