Chi square test

Chi-square test (χ² test) သို့မဟုတ် ကျန်းမာရေးဆိုင်ရာ သုတေသနတွေရဲ့ ပင်မတိုင်းတာမှု

ကျန်းမာရေး (healthcare) နယ်ပယ်မှာ Chi-square test (χ² test) က အရမ်း အသုံးများပါတယ်။ အထူးသဖြင့် ဆေးပညာ သုတေသန၊ ဆေးခန်း ဒေတာ၊ ရောဂါ ကာကွယ်ရေး၊ ဆေးဝါး စမ်းသပ်မှု စတဲ့ နေရာတွေ မှာ အများဆုံး တွေ့ရပါတယ်။ ဒီ test က categorical data (အမျိုးအစား ဒေတာ) တွေ နဲ့ အလုပ်လုပ်တာ ဖြစ်လို့ ဆေးရုံ လူနာ အမျိုးအစား၊ ကုသမှု ရလဒ် (ကောင်း/မကောင်း)၊ ရောဂါ ရှိ/မရှိ စတဲ့ အချက်တွေ ကို ခွဲခြမ်းစိတ်ဖြာ ဖို့ အဆင်ပြေပါတယ်။

Chi-square test ဆိုတာ ဘာလဲ?
Chi-square test က ကျွန်တော်တို့ မှာရှိတဲ့ ဒေတာ တွေ က ကျွန်တော်တို့ မျှော်လင့်ထားတဲ့ ပုံစံ နဲ့ ကွာခြားနေလား၊ ဒါမှမဟုတ် ဆက်စပ်မှု ရှိလား ဆိုတာ စစ်ဆေးတဲ့ non-parametric test တစ်ခုဖြစ်ပါတယ်။ ပုံမှန် ဖြန့်ဖြူးမှု (normal distribution) ဖြစ်နေဖို့ မလိုအပ်ပါဘူး။ အဓိက အသုံးပြုပုံ နှစ်မျိုး ရှိပါတယ်။

1. Chi-square Goodness-of-Fit Test
   categorical variable တစ်ခု ရဲ့ frequency distribution ဖြန့်ဖြူးပုံ က ကျွန်တော်တို့ မျှော်လင့်ထားတဲ့ frequency distribution ဖြန့်ဖြူးပုံ နဲ့ ကွာလား ဆိုတာ စစ်တာပါ။

   – ဆေးရုံ တစ်ခု မှာ လူနာ အမျိုးအစား frequency distribution ဖြန့်ဖြူးပုံက တစ်ပတ်မှာ တန်းတူ ဖြစ်ရမယ်လို့ ယူဆထားတယ် (တနင်္လာ ကနေ တနင်္ဂနွေ အထိ လူနာ အရေအတွက် တူညီရမယ်)။ တကယ့် ဒေတာ က တနင်္ဂနွေ မှာ လူနာ အများဆုံး လာနေရင် ဒီ test နဲ့ စစ်ပြီး ကွာခြားမှု ရှိမရှိ သိနိုင်ပါတယ်။
   – ရောဂါ တစ်မျိုး ရဲ့ လက္ခဏာ အမျိုးအစား frequency distribution ဖြန့်ဖြူးပုံ က သီအိုရီ အရ မျှော်လင့်ထားတဲ့ ပုံစံ နဲ့ ကိုက်ညီလား စစ်နိုင်ပါတယ်။

2. Chi-square Test of Independence (အသုံးအများဆုံး တစ်ခု)
categorical variable နှစ်ခု ကြား ဆက်စပ်မှု ရှိလား၊ မရှိလား စစ်နိုင်ပါတယ်။ ဆိုလိုတာ တစ်ခု ပြောင်းလဲရင် နောက်တစ်ခု ပြောင်းလဲမှု ရှိလား ဆိုတာကို စစ်ဆေးတာပါ။

   – ဆေးဝါး အသစ် တစ်မျိုး ရဲ့ အကျိုးသက်ရောက်မှုက ကုသမှုရရှိတဲ့ လူနာ နဲ့ placebo ရတဲ့ လူနာကြား ကွာခြားလား? (ကုသမှု အမျိုးအစား vs ရောဂါ သက်သာ/မသက်သာ)
   – ဆေးလိပ်သောက်တဲ့ သူ နဲ့ မသောက်တဲ့ သူ မှာ အဆုတ်ကင်ဆာ ဖြစ်နှုန်း ကွာခြားလား? (ဆေးလိပ်သောက်/မသောက် vs ကင်ဆာ ရှိ/မရှိ)
   – အမျိုးသား နဲ့ အမျိုးသမီး မှာ ဆေးဝါး ရဲ့ ဘေးထွက်ဆိုးကျိုး ဖြစ်နှုန်း ကွာလား?
   – အသက်အရွယ် အလိုက် (လူငယ် vs သက်ကြီး) နဲ့ ရောဂါ ကာကွယ်ဆေး ထိုးပြီး ရောဂါ မဖြစ်တာ ကွာခြားလား?
   – ဆေးရုံ မှာ လူနာ ကျေနပ်မှုအဆင့် က ဆရာဝန်အမျိုးအစား (အထူးကု vs အထွေထွေ) နဲ့ ဆက်စပ်နေလား?

3. Chi-square Test of Homogeneity
   အုပ်စု နှစ်ခု အထက်တွေ မှာ categorical variable တစ်ခု ရဲ့ ဖြန့်ဖြူးပုံ တူညီလား စစ်နိုင်ပါတယ်။ Independence test နဲ့ ဆင်တူပါတယ်၊ ဒါပေမဲ့ အုပ်စု တွေ ကို နှိုင်းယှဉ်တာဖြစ်ပါတယ်။
ဆေးရုံ သုံးခု မှာ လူနာ အမျိုးအစား (အရေးပေါ်၊ ခွဲစိတ်၊ အထွေထွေ) ဖြန့်ဖြူးပုံ တူညီလား စစ်တာမျိုးပါ။

Chi-square test ရဲ့ အဓိက ယူဆချက် (Assumptions)တွေကတော့

– ဒေတာ က categorical (nominal သို့မဟုတ် ordinal) ဖြစ်ရမယ်။ ဥပမာ ကျား/မ၊ ရောဂါ ရှိ/မရှိ၊ ကုသမှု အောင်မြင်/မအောင်မြင်။
– လူနာ တွေ က independent (တစ်ယောက် က တစ်ယောက် ကို မထိခိုက်ရဘူး)။
– Contingency table မှာ expected frequency (မျှော်လင့်ထားတဲ့ အရေအတွက်) တစ်ခုချင်း အနည်းဆုံး ၅ ရှိရမယ် (အများစု cell မှာ)။ မရှိရင် Fisher’s exact test သုံးရပ့ါမယ်။
– Sample size လုံလောက်ရမယ် (များသောအားဖြင့် အနည်းဆုံး ၂၀-၅၀ လောက်)။

Chi-square test ရဲ့ တွက်ချက်ပုံ

χ² = Σ (Observed – Expected)² / Expected

– Observed (O) → တကယ် ရလာတဲ့ အရေအတွက်
– Expected (E) → ဆက်စပ်မှု မရှိရင် ရရှိသင့်တဲ့ အရေအတွက် (row total × column total / grand total)
– တွက်ပြီး ရလာတဲ့ χ² ကြီးရင် p-value သေးလာပြီး ဆက်စပ်မှု ရှိတယ်လို့ ဆိုလိုပါတယ် (များသောအားဖြင့် p < 0.05 ဆို သိသာတယ်)။

χ² = Σ (Observed – Expected)² / Expected ဆိုတဲ့ ဖော်မြူလာ ကို ဘာကြောင့် အဲ့လို ဖန်တီးထားသလဲ ဆိုတာ နားလည်လွယ်အောင် ရှင်းပြချင်ပါတယ်။

1. Observed (O) နဲ့ Expected (E) ကြား ကွာခြားချက် ကို အရင် ရှာကြပါတယ်
   ပထမ အဆင့်က တကယ် ရလာတဲ့ အရေအတွက် (Observed) နဲ့ ရသင့်တဲ့ အရေအတွက် (Expected) ကြား ကွာခြားချက် ကို ကြည့်ရတာပါ။ ဆက်စပ်မှု မရှိရင် (null hypothesis မှန်ရင်) ကွာခြားချက်မရှိပါဘူး။ ကွာခြားချက် ကြီးရင် ကျွန်တော်တို့ ယူဆချက် (null hypothesis) က မမှန်နိုင်ဘူး ဆိုတဲ့ အရိပ်အမြွက် ရပါတယ်။
   ဒါကြောင့် ပထမ အပိုင်း က (O – E) ကို တွက်ချက်တာဖြစ်ပါတယ်။

2. ဘာကြောင့် ကွာခြားချက် ကို နှစ်ထပ်ကိန်း (²) လုပ်ရတာလဲ?
   ကွာခြားချက် က အပေါင်း ဖြစ်နိုင်သလို အနှုပ် လည်း ဖြစ်နိုင်ပါတယ်။ အပေါင်း နဲ့ အနှုပ် ရောပြီး ပေါင်းရင် တချို့ ကွာခြားချက် တွေ ပျက်သွားနိုင်ပါတယ် (cancel out ဖြစ်တယ်)။
   ဒါကြောင့် အားလုံး ကို အပေါင်း ဖြစ်အောင် နှစ်ထပ်ကိန်း လုပ်ရပါတယ် → (O – E)²။
   ဒါက ကွာခြားချက် ရဲ့ ပမာဏ ကို မပျက်စီးစေဘဲ တိုင်းတာ ပေးနိုင်ပါတယ်။ (ဒါက စာရင်းအင်း test တွေ မှာ အများစု သုံးတဲ့ နည်းပဲ ဖြစ်ပါတယ်။)

3. ဘာကြောင့် Expected (E) နဲ့ ပြန်စားရတာလဲ? (အရေးအကြီးဆုံး အပိုင်း)
   ဒီ အပိုင်းကို အဓိက ရှင်းပြချင်တာပါ။ ကွာခြားချက်တူတူပဲ ဆိုရင်တောင်မှ အဓိပ္ပာယ် မတူနိုင်ပါဘူး။ ဥပမာအားဖြင့်
   – မျှော်လင့်ထားတာ ၁၀ ပဲ ရှိပြီး တကယ် ၁၅ ရလာရင်လည်း ကွာခြားချက် ၅၊ ထို့အတူ
   – မျှော်လင့်ထားတာ ၁၀၀၀ ရှိပြီး တကယ် ၁၀၀၅ ရလာရင်လည်း ကွာခြားချက် ၅ ပါပဲ၊ ဒါပေမဲ့ အဲ့ကွာခြားချက် တစ်ခုနှင့်တစ်ခုက သက်ရောက်မှု မတူပါဘူး။
ဒါကြောင့် ကွာခြားချက် ကို အရွယ်အစား နဲ့ နှိုင်းယှဉ်ဖို့ လိုလာပါတယ်။ အဲ့ဒါ ကို လုပ်ပေးတာ က Expected နဲ့ ပြန်စားလိုက်တာပဲဖြစ်ပါတယ်။ အဲ့လို စားလိုက်ရင် ကွာခြားချက် က အရွယ်အစား နဲ့ အချိုးကျ ဖြစ်သွားပါတယ် (standardize ဖြစ်တယ်)။
   ဆိုလိုတာက ကြီးကြီးမားမား expected ရှိတဲ့ cell မှာ ကွာခြားချက် နည်းနည်း ဆို သက်ရောက်မှု နည်းတယ်။ expected သေးသေးလေး မှာ ကွာခြားချက် နည်းနည်း ဆို သက်ရောက်မှု ကြီးတယ်။ ဒါမှ တရားမျှတတဲ့ ကွာခြားမှု ဖြစ်လာပါမယ်။

4. ဘာကြောင့် အားလုံး ပေါင်းရတာလဲ?
   cell တစ်ခုချင်း ရဲ့ ကွာခြားချက်တွေကို စုစည်းပြီး တစ်ခုလုံး ရဲ့ ကွာခြားမှုပမာဏ ကိုရအောင် ပေါင်းရတာဖြစ်ပါတယ်။ ပေါင်းလိုက်ရင် တစ်ခုလုံး အတွက် ဘယ်လောက်ကွာနေလဲ သိနိုင်ပါတယ်။

sample အကြီးကြီးတစ်ခုမှာ၊ null hypothesis မှန်ရင် cell တစ်ခုချင်းရဲ့ (O – E) / √E က standard normal distribution (mean 0, variance 1) နဲ့ ဆင်တူ ဖြစ်ပါတယ်။

အနှစ်ချုပ်ပြောရရင်
– (O – E) က ဘယ်လောက် ကွာခြားနေလဲ တိုင်းတာပါ
– X² နှစ်ထပ်ကိန်းက အပေါင်း အနှုပ် ရောပြီး ကြေမသွားအောင် လုပ်တာပါ
– / Expected နှင့် ပြန်စားလိုက်တာက ကွာခြားချက် ကို အရွယ်အစား နဲ့ ချိန်ညှိ တာပါ။(တရားမျှတအောင် standardize) လုပ်တာပေါ့
– Σ (ပေါင်း) တာက တစ်ခု လုံး ရဲ့ စုစုပေါင်း ကွာခြားမှု ရအောင် လုပ်တာပါ။

နပေတိုး

Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Discover more from naywinaung

Leave a Reply Cancel reply

Related Post

Regression လွယ်သလား၊ ခက်သလားRegression လွယ်သလား၊ ခက်သလား

QQ Plot ဆိုတာ ဘာလဲ?QQ Plot ဆိုတာ ဘာလဲ?

Chain of InfectionChain of Infection