naywinaung blog,statistics Chi square test

Chi square test

Chi-square test (χ² test) သို့မဟုတ် ကျန်းမာရေးဆိုင်ရာ သုတေသနတွေရဲ့ ပင်မတိုင်းတာမှု

ကျန်းမာရေး (healthcare) နယ်ပယ်မှာ Chi-square test (χ² test) က အရမ်း အသုံးများပါတယ်။ အထူးသဖြင့် ဆေးပညာ သုတေသန၊ ဆေးခန်း ဒေတာ၊ ရောဂါ ကာကွယ်ရေး၊ ဆေးဝါး စမ်းသပ်မှု စတဲ့ နေရာတွေ မှာ အများဆုံး တွေ့ရပါတယ်။ ဒီ test က categorical data (အမျိုးအစား ဒေတာ) တွေ နဲ့ အလုပ်လုပ်တာ ဖြစ်လို့ ဆေးရုံ လူနာ အမျိုးအစား၊ ကုသမှု ရလဒ် (ကောင်း/မကောင်း)၊ ရောဂါ ရှိ/မရှိ စတဲ့ အချက်တွေ ကို ခွဲခြမ်းစိတ်ဖြာ ဖို့ အဆင်ပြေပါတယ်။

Chi-square test ဆိုတာ ဘာလဲ?
Chi-square test က ကျွန်တော်တို့ မှာရှိတဲ့ ဒေတာ တွေ က ကျွန်တော်တို့ မျှော်လင့်ထားတဲ့ ပုံစံ နဲ့ ကွာခြားနေလား၊ ဒါမှမဟုတ် ဆက်စပ်မှု ရှိလား ဆိုတာ စစ်ဆေးတဲ့ non-parametric test တစ်ခုဖြစ်ပါတယ်။ ပုံမှန် ဖြန့်ဖြူးမှု (normal distribution) ဖြစ်နေဖို့ မလိုအပ်ပါဘူး။ အဓိက အသုံးပြုပုံ နှစ်မျိုး ရှိပါတယ်။

1. Chi-square Goodness-of-Fit Test 
   categorical variable တစ်ခု ရဲ့  frequency distribution ဖြန့်ဖြူးပုံ က ကျွန်တော်တို့ မျှော်လင့်ထားတဲ့ frequency distribution ဖြန့်ဖြူးပုံ နဲ့ ကွာလား ဆိုတာ စစ်တာပါ။

   – ဆေးရုံ တစ်ခု မှာ လူနာ အမျိုးအစား frequency distribution  ဖြန့်ဖြူးပုံက တစ်ပတ်မှာ တန်းတူ ဖြစ်ရမယ်လို့ ယူဆထားတယ် (တနင်္လာ ကနေ တနင်္ဂနွေ အထိ လူနာ အရေအတွက် တူညီရမယ်)။ တကယ့် ဒေတာ က တနင်္ဂနွေ မှာ လူနာ အများဆုံး လာနေရင် ဒီ test နဲ့ စစ်ပြီး ကွာခြားမှု ရှိမရှိ သိနိုင်ပါတယ်။ 
   – ရောဂါ တစ်မျိုး ရဲ့ လက္ခဏာ အမျိုးအစား frequency distribution ဖြန့်ဖြူးပုံ က သီအိုရီ အရ မျှော်လင့်ထားတဲ့ ပုံစံ နဲ့ ကိုက်ညီလား စစ်နိုင်ပါတယ်။

2. Chi-square Test of Independence (အသုံးအများဆုံး တစ်ခု) 
  categorical variable နှစ်ခု ကြား ဆက်စပ်မှု ရှိလား၊ မရှိလား စစ်နိုင်ပါတယ်။ ဆိုလိုတာ တစ်ခု ပြောင်းလဲရင် နောက်တစ်ခု ပြောင်းလဲမှု ရှိလား ဆိုတာကို စစ်ဆေးတာပါ။

   – ဆေးဝါး အသစ် တစ်မျိုး ရဲ့ အကျိုးသက်ရောက်မှုက ကုသမှုရရှိတဲ့ လူနာ နဲ့ placebo ရတဲ့ လူနာကြား ကွာခြားလား? (ကုသမှု အမျိုးအစား vs ရောဂါ သက်သာ/မသက်သာ) 
   – ဆေးလိပ်သောက်တဲ့ သူ နဲ့ မသောက်တဲ့ သူ မှာ အဆုတ်ကင်ဆာ ဖြစ်နှုန်း ကွာခြားလား? (ဆေးလိပ်သောက်/မသောက် vs ကင်ဆာ ရှိ/မရှိ) 
   – အမျိုးသား နဲ့ အမျိုးသမီး မှာ ဆေးဝါး ရဲ့ ဘေးထွက်ဆိုးကျိုး ဖြစ်နှုန်း ကွာလား? 
   – အသက်အရွယ် အလိုက် (လူငယ် vs သက်ကြီး) နဲ့ ရောဂါ ကာကွယ်ဆေး ထိုးပြီး ရောဂါ မဖြစ်တာ ကွာခြားလား? 
   – ဆေးရုံ မှာ လူနာ ကျေနပ်မှုအဆင့် က ဆရာဝန်အမျိုးအစား (အထူးကု vs အထွေထွေ) နဲ့ ဆက်စပ်နေလား?

3. Chi-square Test of Homogeneity
   အုပ်စု နှစ်ခု အထက်တွေ မှာ categorical variable တစ်ခု ရဲ့ ဖြန့်ဖြူးပုံ တူညီလား စစ်နိုင်ပါတယ်။ Independence test နဲ့ ဆင်တူပါတယ်၊ ဒါပေမဲ့ အုပ်စု တွေ ကို နှိုင်းယှဉ်တာဖြစ်ပါတယ်။
ဆေးရုံ သုံးခု မှာ လူနာ အမျိုးအစား (အရေးပေါ်၊ ခွဲစိတ်၊ အထွေထွေ) ဖြန့်ဖြူးပုံ တူညီလား စစ်တာမျိုးပါ။

Chi-square test ရဲ့ အဓိက ယူဆချက် (Assumptions)တွေကတော့

– ဒေတာ က categorical (nominal သို့မဟုတ် ordinal) ဖြစ်ရမယ်။ ဥပမာ ကျား/မ၊ ရောဂါ ရှိ/မရှိ၊ ကုသမှု အောင်မြင်/မအောင်မြင်။ 
– လူနာ တွေ က independent (တစ်ယောက် က တစ်ယောက် ကို မထိခိုက်ရဘူး)။ 
– Contingency table မှာ expected frequency (မျှော်လင့်ထားတဲ့ အရေအတွက်) တစ်ခုချင်း အနည်းဆုံး ၅ ရှိရမယ် (အများစု cell မှာ)။ မရှိရင် Fisher’s exact test သုံးရပ့ါမယ်။ 
– Sample size လုံလောက်ရမယ် (များသောအားဖြင့် အနည်းဆုံး ၂၀-၅၀ လောက်)။

Chi-square test ရဲ့ တွက်ချက်ပုံ

χ² = Σ (Observed – Expected)² / Expected

– Observed (O) → တကယ် ရလာတဲ့ အရေအတွက် 
– Expected (E) → ဆက်စပ်မှု မရှိရင် ရရှိသင့်တဲ့ အရေအတွက် (row total × column total / grand total) 
– တွက်ပြီး ရလာတဲ့ χ² ကြီးရင် p-value သေးလာပြီး ဆက်စပ်မှု ရှိတယ်လို့ ဆိုလိုပါတယ် (များသောအားဖြင့် p < 0.05 ဆို သိသာတယ်)။

χ² = Σ (Observed – Expected)² / Expected ဆိုတဲ့ ဖော်မြူလာ ကို ဘာကြောင့် အဲ့လို ဖန်တီးထားသလဲ ဆိုတာ နားလည်လွယ်အောင် ရှင်းပြချင်ပါတယ်။

1. Observed (O) နဲ့ Expected (E) ကြား ကွာခြားချက် ကို အရင် ရှာကြပါတယ် 
   ပထမ အဆင့်က တကယ် ရလာတဲ့ အရေအတွက် (Observed) နဲ့ ရသင့်တဲ့ အရေအတွက် (Expected) ကြား ကွာခြားချက် ကို ကြည့်ရတာပါ။  ဆက်စပ်မှု မရှိရင် (null hypothesis မှန်ရင်) ကွာခြားချက်မရှိပါဘူး။ ကွာခြားချက် ကြီးရင် ကျွန်တော်တို့ ယူဆချက် (null hypothesis) က မမှန်နိုင်ဘူး ဆိုတဲ့ အရိပ်အမြွက် ရပါတယ်။ 
   ဒါကြောင့် ပထမ အပိုင်း က (O – E) ကို တွက်ချက်တာဖြစ်ပါတယ်။

2. ဘာကြောင့် ကွာခြားချက် ကို နှစ်ထပ်ကိန်း (²) လုပ်ရတာလဲ? 
   ကွာခြားချက် က အပေါင်း ဖြစ်နိုင်သလို အနှုပ် လည်း ဖြစ်နိုင်ပါတယ်။ အပေါင်း နဲ့ အနှုပ် ရောပြီး ပေါင်းရင် တချို့ ကွာခြားချက် တွေ ပျက်သွားနိုင်ပါတယ် (cancel out ဖြစ်တယ်)။ 
   ဒါကြောင့် အားလုံး ကို အပေါင်း ဖြစ်အောင်  နှစ်ထပ်ကိန်း လုပ်ရပါတယ် → (O – E)²။ 
   ဒါက ကွာခြားချက် ရဲ့ ပမာဏ ကို မပျက်စီးစေဘဲ တိုင်းတာ ပေးနိုင်ပါတယ်။ (ဒါက စာရင်းအင်း test တွေ မှာ အများစု သုံးတဲ့ နည်းပဲ ဖြစ်ပါတယ်။)

3. ဘာကြောင့် Expected (E) နဲ့ ပြန်စားရတာလဲ? (အရေးအကြီးဆုံး အပိုင်း) 
   ဒီ အပိုင်းကို အဓိက ရှင်းပြချင်တာပါ။ ကွာခြားချက်တူတူပဲ ဆိုရင်တောင်မှ အဓိပ္ပာယ် မတူနိုင်ပါဘူး။ ဥပမာအားဖြင့်
   – မျှော်လင့်ထားတာ ၁၀ ပဲ ရှိပြီး တကယ် ၁၅ ရလာရင်လည်း ကွာခြားချက် ၅၊ ထို့အတူ 
   – မျှော်လင့်ထားတာ ၁၀၀၀ ရှိပြီး တကယ် ၁၀၀၅ ရလာရင်လည်း ကွာခြားချက် ၅ ပါပဲ၊ ဒါပေမဲ့ အဲ့ကွာခြားချက် တစ်ခုနှင့်တစ်ခုက သက်ရောက်မှု မတူပါဘူး။
ဒါကြောင့် ကွာခြားချက် ကို အရွယ်အစား နဲ့ နှိုင်းယှဉ်ဖို့ လိုလာပါတယ်။ အဲ့ဒါ ကို လုပ်ပေးတာ က Expected နဲ့  ပြန်စားလိုက်တာပဲဖြစ်ပါတယ်။ အဲ့လို စားလိုက်ရင် ကွာခြားချက် က အရွယ်အစား နဲ့ အချိုးကျ ဖြစ်သွားပါတယ် (standardize ဖြစ်တယ်)။ 
   ဆိုလိုတာက ကြီးကြီးမားမား expected ရှိတဲ့ cell မှာ ကွာခြားချက် နည်းနည်း ဆို သက်ရောက်မှု နည်းတယ်။ expected သေးသေးလေး မှာ ကွာခြားချက် နည်းနည်း ဆို သက်ရောက်မှု ကြီးတယ်။ ဒါမှ တရားမျှတတဲ့ ကွာခြားမှု ဖြစ်လာပါမယ်။

4. ဘာကြောင့် အားလုံး ပေါင်းရတာလဲ? 
   cell တစ်ခုချင်း ရဲ့ ကွာခြားချက်တွေကို စုစည်းပြီး တစ်ခုလုံး ရဲ့ ကွာခြားမှုပမာဏ ကိုရအောင် ပေါင်းရတာဖြစ်ပါတယ်။ ပေါင်းလိုက်ရင် တစ်ခုလုံး အတွက် ဘယ်လောက်ကွာနေလဲ သိနိုင်ပါတယ်။

sample အကြီးကြီးတစ်ခုမှာ၊ null hypothesis မှန်ရင် cell တစ်ခုချင်းရဲ့ (O – E) / √E က standard normal distribution (mean 0, variance 1) နဲ့ ဆင်တူ ဖြစ်ပါတယ်။

အနှစ်ချုပ်ပြောရရင်
– (O – E) က ဘယ်လောက် ကွာခြားနေလဲ တိုင်းတာပါ 
– X² နှစ်ထပ်ကိန်းက အပေါင်း အနှုပ် ရောပြီး ကြေမသွားအောင် လုပ်တာပါ
– / Expected  နှင့် ပြန်စားလိုက်တာက ကွာခြားချက် ကို အရွယ်အစား နဲ့ ချိန်ညှိ တာပါ။(တရားမျှတအောင် standardize) လုပ်တာပေါ့
– Σ (ပေါင်း) တာက တစ်ခု လုံး ရဲ့ စုစုပေါင်း ကွာခြားမှု ရအောင် လုပ်တာပါ။

နပေတိုး


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

သင့်တော်တဲ့ Conceptual Framework တစ်ခု ဘယ်လိုတည်ဆောက်ရမလဲသင့်တော်တဲ့ Conceptual Framework တစ်ခု ဘယ်လိုတည်ဆောက်ရမလဲ

Conceptual Framework ဆိုတာ သုတေသနကို လမ်းညွှန်ပေးမယ့် မြေပုံတစ်ခုနဲ့တူပါတယ်။ သုတေသနမေးခွန်းတွေ၊ Variable တွေနဲ့ ဆက်စပ်မှုတွေကို ပုံနဲ့ ဖော်ပြပြီး ဘယ်လို အကြောင်းအရာတွေကို လေ့လာရမလဲဆိုတာကို ပြသပေးပါတယ်။ Conceptual Framework ကောင်းတစ်ခုကသုတေသနကို ပိုပြီး ရှင်းလင်းစေပြီး တိကျတဲ့ ရလဒ်တွေကို ရရှိနိုင်ပါတယ်။ Conceptual Framework ကို ဘယ်လိုတည်ဆောက်ရမလဲ ၁။ သုတေသနမေးခွန်းကို

Chapter 2 Literature Review ကို ဘယ်လိုရေးရမလဲChapter 2 Literature Review ကို ဘယ်လိုရေးရမလဲ

Literature Review ဆိုတာက သုတေသနနဲ့ သက်ဆိုင်တဲ့ အရင်က ထွက်ထားတဲ့ စာအုပ်တွေ၊ ဂျာနယ်စာတမ်းတွေ၊ ကွန်ဖရင့် စာတမ်းတွေ၊ ဒါမှမဟုတ် အခြား ယုံကြည်စိတ်ချရတဲ့ အရင်းအမြစ်တွေကို စနစ်တကျ စုစည်း၊ တင်ပြ၊ ဆန်းစစ်၊ ဝေဖန်သုံးသပ်ပြီး သုတေသနရဲ့ နေရာချထားမှု (position) ကို ရှင်းရှင်းလင်းလင်း ပြသတဲ့ အခန်းဖြစ်ပါတယ်။ ဒီအခန်းက သုတေသန ဘယ်လောက်

Thesis ရဲ့ Chapter 3Thesis ရဲ့ Chapter 3

Thesis ရဲ့ Chapter 3 ကို ကျောင်းတော်တော်များများက research methodology ရေးပါတယ်။ အချို့သော ကျောင်း၊ဘာသာရပ်တွေကတော့ situational analysis သို့မဟုတ် background သို့မဟုတ် Overview ကိုရေးပါတယ်။ အခုကတော့ Research Methodology ကို ‌ပြောပြချင်တာပါ။ Chapter 3 ဆိုတာ သုတေသနကို ဘယ်လိုလုပ်ခဲ့လဲဆိုတာကို အသေးစိတ်ရှင်းပြတဲ့ အခန်းပဲဖြစ်ပါတယ်။