2019年8月19日 星期一

醫療數據的意向大數據分析應用 - 醫療實驗有效嗎?


我使用醫療數據說明了如何建立樹狀圖與貝氏定理的機率,這篇網誌則是我們想知道


醫療實驗中,總膽固醇的前後變化是如何,實驗有效嗎?

所以,我們有實驗組與對照組。所謂實驗組是有進行醫療實驗的,而對照組則是沒有進行醫療實驗的。




因為有樹狀圖的每個路徑的機率,同樣也可以計算出所有條件下的條件機率,再加上這都是文字類型的數據,所以,我從機率當中排序找出中位數、眾數還有最小機率對應的數據,討論實驗後的總膽固醇反推實驗前的總膽固醇為何。

我設定的流程是先確定是否在實驗組→在實驗前測量總膽固醇→實驗後再測量總膽固醇。所以,在所有的數據分析後,實驗組在實驗前的總膽固醇是正常,同樣對照組也是。也就是說實驗體都是正常的。

如果使用最小機率法,則是實驗前的總膽固醇為動脈硬化高危險群。





如果在實驗類別與實驗前總膽固醇分類條件下,分析實驗後總膽固醇狀況是否改善。從中位數法與眾數法可以發現,實驗組的實驗前總膽固醇過高會在實驗後便正常,而一開始正常,實驗後仍是正常。至於對照組,同樣也發生實驗後有改善現象。

至於最小機率法則是實驗組的總膽固醇變化很極端,同樣對照組也一樣。

--------------

接著,我想知道實驗後的總膽固醇結果下,他們在實驗前的總膽固醇是如何。這是一個貝氏定理的概念。甚至我也想知道總膽固醇的前後面化是來自哪種實驗類型。

下表顯示無論實驗後膽固醇是正常、過高或過低,都對應實驗前是正常。甚至實驗後的總膽固醇是動脈硬化高危險群,但實際上實驗前是過高而已。至於若使用最小機率法來判斷,則實驗後的總膽固醇正常或過高,都會反推為實驗前是動脈硬化高危險群。若實驗後是過低的總膽固醇,則實驗前是過高的總膽固醇。至於實驗後是動脈硬化高危險群,在實驗前則是正常。





如果從三個層次來看,更能看出怪異的情況。從實驗前後的總膽固醇條件下,是來自哪種實驗類型的結果可以看出,

由中位數與眾數得到
當實驗後是正常,實驗前是過高的情況是來自於對照組
當實驗後是過低,實驗前是過高的情況是來自於對照組
當實驗後是正常,實驗前是正常的情況是來自於實驗組

上面的三個現象是我希望看到的,代表實驗確實能夠改善總膽固醇。但是,三個結果,兩個來自對照組,一個來自實驗組,實驗組還是前後都是正常。換句話說這個實驗是無效的。

當實驗後是過高,實驗前是過高的情況是來自於實驗組
當實驗後是過高,實驗前是正常的情況是來自於對照組
當時實驗後是高危險群,實驗前是過高的情況來自於對照組
當時實驗後是高危險群,實驗前是高危險群的情況來自於對照組

上面的四種現象是我不希望看到的,好在多數來自於對照組,而實驗組則是實驗前後無改變的過高情況。所以,三個層次結果很明顯說明這個實驗是無效的。

當然這樣的結果很怪異,但這卻是由數據所分析出來的。就了解數據來源,可以發現這樣的實驗不是在實驗室進行,而是在我們的日常生活中進行。也就是說,很多因素並沒有控制,都有可能造成實驗的分析結果無法很有效地歸納出有用的訊息。