naywinaung blog,statistics Chi square test

Chi square test

Chi-square test (χ² test) သို့မဟုတ် ကျန်းမာရေးဆိုင်ရာ သုတေသနတွေရဲ့ ပင်မတိုင်းတာမှု

ကျန်းမာရေး (healthcare) နယ်ပယ်မှာ Chi-square test (χ² test) က အရမ်း အသုံးများပါတယ်။ အထူးသဖြင့် ဆေးပညာ သုတေသန၊ ဆေးခန်း ဒေတာ၊ ရောဂါ ကာကွယ်ရေး၊ ဆေးဝါး စမ်းသပ်မှု စတဲ့ နေရာတွေ မှာ အများဆုံး တွေ့ရပါတယ်။ ဒီ test က categorical data (အမျိုးအစား ဒေတာ) တွေ နဲ့ အလုပ်လုပ်တာ ဖြစ်လို့ ဆေးရုံ လူနာ အမျိုးအစား၊ ကုသမှု ရလဒ် (ကောင်း/မကောင်း)၊ ရောဂါ ရှိ/မရှိ စတဲ့ အချက်တွေ ကို ခွဲခြမ်းစိတ်ဖြာ ဖို့ အဆင်ပြေပါတယ်။

Chi-square test ဆိုတာ ဘာလဲ?
Chi-square test က ကျွန်တော်တို့ မှာရှိတဲ့ ဒေတာ တွေ က ကျွန်တော်တို့ မျှော်လင့်ထားတဲ့ ပုံစံ နဲ့ ကွာခြားနေလား၊ ဒါမှမဟုတ် ဆက်စပ်မှု ရှိလား ဆိုတာ စစ်ဆေးတဲ့ non-parametric test တစ်ခုဖြစ်ပါတယ်။ ပုံမှန် ဖြန့်ဖြူးမှု (normal distribution) ဖြစ်နေဖို့ မလိုအပ်ပါဘူး။ အဓိက အသုံးပြုပုံ နှစ်မျိုး ရှိပါတယ်။

1. Chi-square Goodness-of-Fit Test 
   categorical variable တစ်ခု ရဲ့  frequency distribution ဖြန့်ဖြူးပုံ က ကျွန်တော်တို့ မျှော်လင့်ထားတဲ့ frequency distribution ဖြန့်ဖြူးပုံ နဲ့ ကွာလား ဆိုတာ စစ်တာပါ။

   – ဆေးရုံ တစ်ခု မှာ လူနာ အမျိုးအစား frequency distribution  ဖြန့်ဖြူးပုံက တစ်ပတ်မှာ တန်းတူ ဖြစ်ရမယ်လို့ ယူဆထားတယ် (တနင်္လာ ကနေ တနင်္ဂနွေ အထိ လူနာ အရေအတွက် တူညီရမယ်)။ တကယ့် ဒေတာ က တနင်္ဂနွေ မှာ လူနာ အများဆုံး လာနေရင် ဒီ test နဲ့ စစ်ပြီး ကွာခြားမှု ရှိမရှိ သိနိုင်ပါတယ်။ 
   – ရောဂါ တစ်မျိုး ရဲ့ လက္ခဏာ အမျိုးအစား frequency distribution ဖြန့်ဖြူးပုံ က သီအိုရီ အရ မျှော်လင့်ထားတဲ့ ပုံစံ နဲ့ ကိုက်ညီလား စစ်နိုင်ပါတယ်။

2. Chi-square Test of Independence (အသုံးအများဆုံး တစ်ခု) 
  categorical variable နှစ်ခု ကြား ဆက်စပ်မှု ရှိလား၊ မရှိလား စစ်နိုင်ပါတယ်။ ဆိုလိုတာ တစ်ခု ပြောင်းလဲရင် နောက်တစ်ခု ပြောင်းလဲမှု ရှိလား ဆိုတာကို စစ်ဆေးတာပါ။

   – ဆေးဝါး အသစ် တစ်မျိုး ရဲ့ အကျိုးသက်ရောက်မှုက ကုသမှုရရှိတဲ့ လူနာ နဲ့ placebo ရတဲ့ လူနာကြား ကွာခြားလား? (ကုသမှု အမျိုးအစား vs ရောဂါ သက်သာ/မသက်သာ) 
   – ဆေးလိပ်သောက်တဲ့ သူ နဲ့ မသောက်တဲ့ သူ မှာ အဆုတ်ကင်ဆာ ဖြစ်နှုန်း ကွာခြားလား? (ဆေးလိပ်သောက်/မသောက် vs ကင်ဆာ ရှိ/မရှိ) 
   – အမျိုးသား နဲ့ အမျိုးသမီး မှာ ဆေးဝါး ရဲ့ ဘေးထွက်ဆိုးကျိုး ဖြစ်နှုန်း ကွာလား? 
   – အသက်အရွယ် အလိုက် (လူငယ် vs သက်ကြီး) နဲ့ ရောဂါ ကာကွယ်ဆေး ထိုးပြီး ရောဂါ မဖြစ်တာ ကွာခြားလား? 
   – ဆေးရုံ မှာ လူနာ ကျေနပ်မှုအဆင့် က ဆရာဝန်အမျိုးအစား (အထူးကု vs အထွေထွေ) နဲ့ ဆက်စပ်နေလား?

3. Chi-square Test of Homogeneity
   အုပ်စု နှစ်ခု အထက်တွေ မှာ categorical variable တစ်ခု ရဲ့ ဖြန့်ဖြူးပုံ တူညီလား စစ်နိုင်ပါတယ်။ Independence test နဲ့ ဆင်တူပါတယ်၊ ဒါပေမဲ့ အုပ်စု တွေ ကို နှိုင်းယှဉ်တာဖြစ်ပါတယ်။
ဆေးရုံ သုံးခု မှာ လူနာ အမျိုးအစား (အရေးပေါ်၊ ခွဲစိတ်၊ အထွေထွေ) ဖြန့်ဖြူးပုံ တူညီလား စစ်တာမျိုးပါ။

Chi-square test ရဲ့ အဓိက ယူဆချက် (Assumptions)တွေကတော့

– ဒေတာ က categorical (nominal သို့မဟုတ် ordinal) ဖြစ်ရမယ်။ ဥပမာ ကျား/မ၊ ရောဂါ ရှိ/မရှိ၊ ကုသမှု အောင်မြင်/မအောင်မြင်။ 
– လူနာ တွေ က independent (တစ်ယောက် က တစ်ယောက် ကို မထိခိုက်ရဘူး)။ 
– Contingency table မှာ expected frequency (မျှော်လင့်ထားတဲ့ အရေအတွက်) တစ်ခုချင်း အနည်းဆုံး ၅ ရှိရမယ် (အများစု cell မှာ)။ မရှိရင် Fisher’s exact test သုံးရပ့ါမယ်။ 
– Sample size လုံလောက်ရမယ် (များသောအားဖြင့် အနည်းဆုံး ၂၀-၅၀ လောက်)။

Chi-square test ရဲ့ တွက်ချက်ပုံ

χ² = Σ (Observed – Expected)² / Expected

– Observed (O) → တကယ် ရလာတဲ့ အရေအတွက် 
– Expected (E) → ဆက်စပ်မှု မရှိရင် ရရှိသင့်တဲ့ အရေအတွက် (row total × column total / grand total) 
– တွက်ပြီး ရလာတဲ့ χ² ကြီးရင် p-value သေးလာပြီး ဆက်စပ်မှု ရှိတယ်လို့ ဆိုလိုပါတယ် (များသောအားဖြင့် p < 0.05 ဆို သိသာတယ်)။

χ² = Σ (Observed – Expected)² / Expected ဆိုတဲ့ ဖော်မြူလာ ကို ဘာကြောင့် အဲ့လို ဖန်တီးထားသလဲ ဆိုတာ နားလည်လွယ်အောင် ရှင်းပြချင်ပါတယ်။

1. Observed (O) နဲ့ Expected (E) ကြား ကွာခြားချက် ကို အရင် ရှာကြပါတယ် 
   ပထမ အဆင့်က တကယ် ရလာတဲ့ အရေအတွက် (Observed) နဲ့ ရသင့်တဲ့ အရေအတွက် (Expected) ကြား ကွာခြားချက် ကို ကြည့်ရတာပါ။  ဆက်စပ်မှု မရှိရင် (null hypothesis မှန်ရင်) ကွာခြားချက်မရှိပါဘူး။ ကွာခြားချက် ကြီးရင် ကျွန်တော်တို့ ယူဆချက် (null hypothesis) က မမှန်နိုင်ဘူး ဆိုတဲ့ အရိပ်အမြွက် ရပါတယ်။ 
   ဒါကြောင့် ပထမ အပိုင်း က (O – E) ကို တွက်ချက်တာဖြစ်ပါတယ်။

2. ဘာကြောင့် ကွာခြားချက် ကို နှစ်ထပ်ကိန်း (²) လုပ်ရတာလဲ? 
   ကွာခြားချက် က အပေါင်း ဖြစ်နိုင်သလို အနှုပ် လည်း ဖြစ်နိုင်ပါတယ်။ အပေါင်း နဲ့ အနှုပ် ရောပြီး ပေါင်းရင် တချို့ ကွာခြားချက် တွေ ပျက်သွားနိုင်ပါတယ် (cancel out ဖြစ်တယ်)။ 
   ဒါကြောင့် အားလုံး ကို အပေါင်း ဖြစ်အောင်  နှစ်ထပ်ကိန်း လုပ်ရပါတယ် → (O – E)²။ 
   ဒါက ကွာခြားချက် ရဲ့ ပမာဏ ကို မပျက်စီးစေဘဲ တိုင်းတာ ပေးနိုင်ပါတယ်။ (ဒါက စာရင်းအင်း test တွေ မှာ အများစု သုံးတဲ့ နည်းပဲ ဖြစ်ပါတယ်။)

3. ဘာကြောင့် Expected (E) နဲ့ ပြန်စားရတာလဲ? (အရေးအကြီးဆုံး အပိုင်း) 
   ဒီ အပိုင်းကို အဓိက ရှင်းပြချင်တာပါ။ ကွာခြားချက်တူတူပဲ ဆိုရင်တောင်မှ အဓိပ္ပာယ် မတူနိုင်ပါဘူး။ ဥပမာအားဖြင့်
   – မျှော်လင့်ထားတာ ၁၀ ပဲ ရှိပြီး တကယ် ၁၅ ရလာရင်လည်း ကွာခြားချက် ၅၊ ထို့အတူ 
   – မျှော်လင့်ထားတာ ၁၀၀၀ ရှိပြီး တကယ် ၁၀၀၅ ရလာရင်လည်း ကွာခြားချက် ၅ ပါပဲ၊ ဒါပေမဲ့ အဲ့ကွာခြားချက် တစ်ခုနှင့်တစ်ခုက သက်ရောက်မှု မတူပါဘူး။
ဒါကြောင့် ကွာခြားချက် ကို အရွယ်အစား နဲ့ နှိုင်းယှဉ်ဖို့ လိုလာပါတယ်။ အဲ့ဒါ ကို လုပ်ပေးတာ က Expected နဲ့  ပြန်စားလိုက်တာပဲဖြစ်ပါတယ်။ အဲ့လို စားလိုက်ရင် ကွာခြားချက် က အရွယ်အစား နဲ့ အချိုးကျ ဖြစ်သွားပါတယ် (standardize ဖြစ်တယ်)။ 
   ဆိုလိုတာက ကြီးကြီးမားမား expected ရှိတဲ့ cell မှာ ကွာခြားချက် နည်းနည်း ဆို သက်ရောက်မှု နည်းတယ်။ expected သေးသေးလေး မှာ ကွာခြားချက် နည်းနည်း ဆို သက်ရောက်မှု ကြီးတယ်။ ဒါမှ တရားမျှတတဲ့ ကွာခြားမှု ဖြစ်လာပါမယ်။

4. ဘာကြောင့် အားလုံး ပေါင်းရတာလဲ? 
   cell တစ်ခုချင်း ရဲ့ ကွာခြားချက်တွေကို စုစည်းပြီး တစ်ခုလုံး ရဲ့ ကွာခြားမှုပမာဏ ကိုရအောင် ပေါင်းရတာဖြစ်ပါတယ်။ ပေါင်းလိုက်ရင် တစ်ခုလုံး အတွက် ဘယ်လောက်ကွာနေလဲ သိနိုင်ပါတယ်။

sample အကြီးကြီးတစ်ခုမှာ၊ null hypothesis မှန်ရင် cell တစ်ခုချင်းရဲ့ (O – E) / √E က standard normal distribution (mean 0, variance 1) နဲ့ ဆင်တူ ဖြစ်ပါတယ်။

အနှစ်ချုပ်ပြောရရင်
– (O – E) က ဘယ်လောက် ကွာခြားနေလဲ တိုင်းတာပါ 
– X² နှစ်ထပ်ကိန်းက အပေါင်း အနှုပ် ရောပြီး ကြေမသွားအောင် လုပ်တာပါ
– / Expected  နှင့် ပြန်စားလိုက်တာက ကွာခြားချက် ကို အရွယ်အစား နဲ့ ချိန်ညှိ တာပါ။(တရားမျှတအောင် standardize) လုပ်တာပေါ့
– Σ (ပေါင်း) တာက တစ်ခု လုံး ရဲ့ စုစုပေါင်း ကွာခြားမှု ရအောင် လုပ်တာပါ။

နပေတိုး


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

ရှုပ်ထွေးစေသောအကြောင်းရင်း (Confounding)ရှုပ်ထွေးစေသောအကြောင်းရင်း (Confounding)

ရှုပ်ထွေးစေသောအကြောင်းရင်း (Confounding) ရှုပ်ထွေးစေသောအကြောင်းရင်း (Confounding) ဆိုတာ ဘာလဲ? သုတေသနမှာ ကျွန်တော်တို့လေ့လာချင်တဲ့ ထိတွေ့မှု (exposure) နဲ့ ရလဒ် (outcome) ဆက်စပ်မှုကို ရှုပ်ထွေးအောင်လုပ်တဲ့ တတိယ အချက်တစ်ခုပါ။ ဥပမာ ပြောရရင်၊ ကော်ဖီသောက်တာက နှလုံးရောဂါဖြစ်စေတယ်လို့ လေ့လာတယ်ဆိုပါစို့။ ဒါပေမယ့် ဆေးလိပ်သောက်တတ်တဲ့သူတွေက ကော်ဖီလည်း များများသောက်တယ်ဆိုရင်၊ ဆေးလိပ်သောက်တာက နှလုံးရောဂါဖြစ်နိုင်ခြေကို တိုးစေတယ်။ ဒီမှာ

Grounded Theory ResearchGrounded Theory Research

Grounded Theory Research ဆိုတာ လူမှုဗေဒနဲ့ သုတေသနလောကမှာ အသုံးများတဲ့ Qualitative Research (အရည်အသွေးအခြေပြု သုတေသန) နည်းလမ်းတစ်ခု ဖြစ်ပါတယ်။ရိုးရိုးသုတေသနတွေက ရှိပြီးသား Theory (သီအိုရီ) တစ်ခုကို အမှန် ဟုတ်၊ မဟုတ် စမ်းသပ်တာမျိုးဖြစ်ပေမဲ့ Grounded Theory ကတော့ “အချက်အလက်တွေကနေတစ်ဆင့် သီအိုရီအသစ်တစ်ခုကို အောက်ခြေကနေ စတင်တည်ဆောက်တာ” ဖြစ်ပါတယ်။Grounded Theory

Statistics သမိုင်းကြောင်းStatistics သမိုင်းကြောင်း

စာရင်းအင်းပညာ (Statistics) ရဲ့ သမိုင်းကြောင်း စာရင်းအင်းပညာဟာ ရှေးခေတ်ကတည်းက အသုံးပြုခဲ့၊ အသုံးဝင်ခဲ့ပါတယ်။ ကနဦးမှာ တိုင်းပြည်ရဲ့ လူဦးရေ၊ ငွေကြေး၊ စစ်အင်အား စတဲ့ အချက်အလက်တွေကို စုစည်းပြီး စီမံခန့်ခွဲဖို့အတွက် အသုံးပြုခဲ့ပါတယ်။ မီဆိုပိုတေးမီးယား၊ အီဂျစ်၊ ရောမ စသည့် ရှေးဟောင်းနိုင်ငံတွေမှာ တိုင်းရင်းစုစာရင်း၊ ကုန်ပစ္စည်းစာရင်း တွေကို ပြုစုခဲ့ကြပါတယ်။ အထူးသဖြင့် မီဆိုပိုတေးမီးယားမှာ ဘုရားရှိခိုးကျောင်းတွေက