statistical test များရွေးချယ်ခြင်း
ကိုယ့်ရဲ့ဒေတာတွေကို ဘယ်လို test တွေ သုံးပြီး စမ်းစစ်မလဲဆိုတာကို အကြမ်းဖျဉ်းလေး ရှင်းပြပါမယ်။
ပထမဆုံးအနေနဲ့ မိမိရဲ့ဒေတာတွေကို ကွဲပြားခြားနားမှု ရှိ၊ မရှိ သိချင်တာလား၊ သို့မဟုတ်၊ ဆက်စပ်မှု ရှိမရှိ သိချင်တာလား ဆိုတာ အရင်ဆုံး စဉ်းစားကြရပါမယ်။
ကွဲပြားမှု ရှိ မရှိ သိချင်တာဆိုရင် မိမိ သိချင်တဲ့ data တွေရဲ့ variables တွေက ဘယ်လို ဒေတာတွေလဲဆိုတာ စဉ်းစားရပါမယ်။
တကယ်လို့ numerical, continuous data တွေဆိုရင် ထပ်ပြီး စဉ်းစားရမှာက မိမိတွက်ချက်မဲ့ variable တွေဟာ normal distribution ရှိမရှိပေါ့။ တကယ်လို့ normal distribution လို့ သတ်မှတ်မယ်ဆိုရင် ကျွန်တော်တို့အနေနဲ့ parametric test တွေကို လုပ်ပါမယ်။
ဟုတ်ပြီ ဒါဆို ဘာကိုထပ်စဉ်းစားမလဲ။
တကယ်လို့ ကိုယ့်ဒေတာတွေက paired data ဆိုရင် pair t test ကိုလုပ်ပါမယ်။
တကယ်လို့ unpaired data တွေဆိုရင်တော့ ကျွန်တော်တို့ ဒေတာတွေဟာ mean ကိုတွက်မလား၊ propotion ကိုတွက်မလားစဉ်းစားရပါမယ်။
mean ကိုတွက်မယ်ဆိုရင် ထပ်စဉ်းစားရမှာက ကျွန်တော်တို့အနေနဲ့ variance ကို သိသလား၊ မသိဘူးလားပေါ့။ variance ကိုသိရင် z test ကိုသုံးပါမယ်။ variance ကို မသိရင်တော့ t test ကိုသုံးပါမယ်။
t test ကို အကြမ်းအားဖြင့် သုံးမျိုးခွဲပါတယ်။
student t test, pair t test နှင့် independent t test ဆိုပြီး ခွဲပါတယ်။
ကိုယ်လေ့လာတဲ့ sample ရဲ့ mean နဲ့ population ရဲ့ mean နဲ့ ယှဉ်ပြီး တွက်မယ်ဆို student t test ကိုသုံးလေ့ရှိပါတယ်။
တကယ်လို့ sample အုပ်စုက တစ်ခုတည်းဖြစ်ပြီး အချိန်ကာလ မတူညီတဲ့ mean နှစ်ခုကို တွက်ချင်ရင်သော်လည်းကောင်း၊ sample အုပ်စုက နှစ်ခုဖြစ်ပြီး အုပ်စုတစ်ခုအတွက် mean တစ်ခုဆိုရင် ( အုပ်စုနှစ်ခုကလည်း ဆက်စပ်နေရင်) pair t test ကိုသုံးပါတယ်။
တကယ်လို့ sample အုပ်စုက ၂ ခု၊ အုပ်စု တစ်ခုအတွက် mean တစ်ခုစီ နှင့် အဆိုပါအုပ်စုနှစ်ခုကလည်း သီးခြား( မဆက်စပ်ရင်)တော့ independent t test ကို သုံးလေ့ရှိပါတယ်။
တကယ်လို့ အုပ်စုက နှစ်ခုထက်ပိုသွားရင်တော့ ANOVA ကို သုံးပါတယ်။
propotion ကိုတွက်မယ်ဆိုရင်တော့ z test ကိုသုံးပါမယ်။
ဒါက ကွဲပြားခြားနားမှုတွေကို ရှာတဲ့အခါမှာ သုံးတဲ့ test တွေဖြစ်ပါတယ်။ ဒီနေရာမှာ hypothesis က သုံးမျိုးဖြစ်နိုင်ပါတယ်။ ကြီးတယ်၊ငယ်တယ်၊တူညီတယ် ဆိုတဲ့ hypothesis ဖြစ်ပါတယ်။
နောက်တစ်ခုကတော့ ဆက်စပ်မှုတွေကို တွက်တဲ့ နည်းလမ်းတွေဖြစ်ပါတယ်။
တကယ်လို့ nominal data တွေရဲ့ ဆက်စပ်မှုကို သိချင်ရင်တော့ chi square ကို အသုံးပြုပါတယ်။
ordinal data တွေကိုတော့ spearman correlation ကိုသုံးပါတယ်။
continuous data တွေရဲ့ ဆက်စပ်မှုကို တိုင်းမယ်ဆိုရင်တော့ pearson correlation ကို သုံးပါတယ်။ ဒီတွက်ချက်မှုရဲ့ ဝိသေသက ဆက်စပ်မှုပမာဏနှင့် ဆက်စပ်မှုပုံစံကို ပြသပေးနိုင်တာဖြစ်ပါတယ်။ strong, moderate, weak association , positive and negative association ဆိုတာမျိုးပါ။
နောက်တစ်နည်းကတော့ regression analysis ဖြစ်ပါတယ်။
ဒီမှာကတော့ မှီခိုခံ dependent variable က တစ်ခုတည်းဖြစ်ပြီး၊ independent variable ကတော့ တစ်ခုထက်မက ဖြစ်နိုင်ပါတယ်။ ဆက်စပ်မှုဖော်ပြတဲ့အခါမှာ independent variable ရဲ့ value က 0 ဆိုတဲ့အခြေအနေစပါတယ်။ အဲ့အခြေအနေကို constant လို့ခေါ်ပါတယ်။ ထို့နောက်မှာတော့ independent variable များရဲ့ B value များဖြင့် တွက်ချက်ဖော်ပြပါတယ်။
နပေတိုး
non parametric test များကိုတော့ နောက်မှ ရှင်းပြပါမယ်ခဗျ။
Discover more from naywinaung
Subscribe to get the latest posts sent to your email.