naywinaung Research Methodology statistical test များရွေးချယ်ခြင်း

statistical test များရွေးချယ်ခြင်း

statistical test များရွေးချယ်ခြင်း
ကိုယ့်ရဲ့ဒေတာတွေကို ဘယ်လို test တွေ သုံးပြီး စမ်းစစ်မလဲဆိုတာကို အကြမ်းဖျဉ်းလေး ရှင်းပြပါမယ်။
ပထမဆုံးအနေနဲ့ မိမိရဲ့ဒေတာတွေကို ကွဲပြားခြားနားမှု ရှိ၊ မရှိ သိချင်တာလား၊ သို့မဟုတ်၊ ဆက်စပ်မှု ရှိမရှိ သိချင်တာလား ဆိုတာ အရင်ဆုံး စဉ်းစားကြရပါမယ်။
ကွဲပြားမှု ရှိ မရှိ သိချင်တာဆိုရင် မိမိ သိချင်တဲ့ data တွေရဲ့ variables တွေက ဘယ်လို ဒေတာတွေလဲဆိုတာ စဉ်းစားရပါမယ်။
တကယ်လို့ numerical, continuous data တွေဆိုရင် ထပ်ပြီး စဉ်းစားရမှာက မိမိတွက်ချက်မဲ့ variable တွေဟာ normal distribution ရှိမရှိပေါ့။ တကယ်လို့ normal distribution လို့ သတ်မှတ်မယ်ဆိုရင် ကျွန်တော်တို့အနေနဲ့ parametric test တွေကို လုပ်ပါမယ်။
ဟုတ်ပြီ ဒါဆို ဘာကိုထပ်စဉ်းစားမလဲ။
တကယ်လို့ ကိုယ့်ဒေတာတွေက paired data ဆိုရင် pair t test ကိုလုပ်ပါမယ်။
တကယ်လို့ unpaired data တွေဆိုရင်တော့ ကျွန်တော်တို့ ဒေတာတွေဟာ mean ကိုတွက်မလား၊ propotion ကိုတွက်မလားစဉ်းစားရပါမယ်။
mean ကိုတွက်မယ်ဆိုရင် ထပ်စဉ်းစားရမှာက ကျွန်တော်တို့အနေနဲ့ variance ကို သိသလား၊ မသိဘူးလားပေါ့။ variance ကိုသိရင် z test ကိုသုံးပါမယ်။ variance ကို မသိရင်တော့ t test ကိုသုံးပါမယ်။
t test ကို အကြမ်းအားဖြင့် သုံးမျိုးခွဲပါတယ်။
student t test, pair t test နှင့် independent t test ဆိုပြီး ခွဲပါတယ်။
ကိုယ်လေ့လာတဲ့ sample ရဲ့ mean နဲ့ population ရဲ့ mean နဲ့ ယှဉ်ပြီး တွက်မယ်ဆို student t test ကိုသုံးလေ့ရှိပါတယ်။
တကယ်လို့ sample အုပ်စုက တစ်ခုတည်းဖြစ်ပြီး အချိန်ကာလ မတူညီတဲ့ mean နှစ်ခုကို တွက်ချင်ရင်သော်လည်းကောင်း၊ sample အုပ်စုက နှစ်ခုဖြစ်ပြီး အုပ်စုတစ်ခုအတွက် mean တစ်ခုဆိုရင် ( အုပ်စုနှစ်ခုကလည်း ဆက်စပ်နေရင်) pair t test ကိုသုံးပါတယ်။
တကယ်လို့ sample အုပ်စုက ၂ ခု၊ အုပ်စု တစ်ခုအတွက် mean တစ်ခုစီ နှင့် အဆိုပါအုပ်စုနှစ်ခုကလည်း သီးခြား( မဆက်စပ်ရင်)တော့ independent t test ကို သုံးလေ့ရှိပါတယ်။
တကယ်လို့ အုပ်စုက နှစ်ခုထက်ပိုသွားရင်တော့ ANOVA ကို သုံးပါတယ်။
propotion ကိုတွက်မယ်ဆိုရင်တော့ z test ကိုသုံးပါမယ်။
ဒါက ကွဲပြားခြားနားမှုတွေကို ရှာတဲ့အခါမှာ သုံးတဲ့ test တွေဖြစ်ပါတယ်။ ဒီနေရာမှာ hypothesis က သုံးမျိုးဖြစ်နိုင်ပါတယ်။ ကြီးတယ်၊ငယ်တယ်၊တူညီတယ် ဆိုတဲ့ hypothesis ဖြစ်ပါတယ်။
နောက်တစ်ခုကတော့ ဆက်စပ်မှုတွေကို တွက်တဲ့ နည်းလမ်းတွေဖြစ်ပါတယ်။
တကယ်လို့ nominal data တွေရဲ့ ဆက်စပ်မှုကို သိချင်ရင်တော့ chi square ကို အသုံးပြုပါတယ်။
ordinal data တွေကိုတော့ spearman correlation ကိုသုံးပါတယ်။
continuous data တွေရဲ့ ဆက်စပ်မှုကို တိုင်းမယ်ဆိုရင်တော့ pearson correlation ကို သုံးပါတယ်။ ဒီတွက်ချက်မှုရဲ့ ဝိသေသက ဆက်စပ်မှုပမာဏနှင့် ဆက်စပ်မှုပုံစံကို ပြသပေးနိုင်တာဖြစ်ပါတယ်။ strong, moderate, weak association , positive and negative association ဆိုတာမျိုးပါ။
နောက်တစ်နည်းကတော့ regression analysis ဖြစ်ပါတယ်။
ဒီမှာကတော့ မှီခိုခံ dependent variable က တစ်ခုတည်းဖြစ်ပြီး၊ independent variable ကတော့ တစ်ခုထက်မက ဖြစ်နိုင်ပါတယ်။ ဆက်စပ်မှုဖော်ပြတဲ့အခါမှာ independent variable ရဲ့ value က 0 ဆိုတဲ့အခြေအနေစပါတယ်။  အဲ့အခြေအနေကို constant လို့ခေါ်ပါတယ်။ ထို့နောက်မှာတော့ independent variable များရဲ့ B value များဖြင့် တွက်ချက်ဖော်ပြပါတယ်။

နပေတိုး
non parametric test များကိုတော့ နောက်မှ ရှင်းပြပါမယ်ခဗျ။


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

Research ParadigmResearch Paradigm

(Research Paradigm) တွေထဲက အဓိက အရေးကြီးတဲ့ ၆ ခု၁. Constructivist (တည်ဆောက်ဝါဒ)ဒါက လူတွေရဲ့ အတွေ့အကြုံ၊ အမြင်၊ ယုံကြည်ချက်တွေကနေ “အမှန်” ဆိုတာ ဖြစ်လာတယ်လို့ ယုံကြည်တဲ့ အယူအဆပါ။ တစ်ယောက်နဲ့တစ်ယောက် အတွေ့အကြုံ မတူတော့ အမှန်တရားလည်း မတူနိုင်ဘူး။ ဥပမာ – ကျောင်းထဲမှာ ဆရာတစ်ယောက်က ကလေးတွေကို ဘာသာရပ်တစ်ခု သင်ပေးတယ်ဆိုပါစို့။

Cluster SamplingCluster Sampling

Cluster SamplingCluster Sampling ဆိုတာ လူအုပ်စုအကြီးကြီးကို လေ့လာချင်တဲ့အခါ သုံးတဲ့နည်းဖြစ်ပါတယ်။ ဒါပေမဲ့ လူတွေကို တစ်ယောက်ချင်းစီ မရွေးထုတ်ဘဲ အုပ်စုလိုက် ရွေးထုတ်တာကို Cluster Sampling လို့ခေါ်ပါတယ်။ အဲ့ဒီမှာ Cluster ဆိုတာက သဘာဝအလျောက် ဖြစ်နေတဲ့ အုပ်စုတွေကို ပြောတာ။ ဥပမာ… ကျောင်းတွေဆို အတန်းတွေက Cluster တွေပါပဲ။ ရွာတွေဆိုရင် အိမ်ထောင်စုတွေက

QQ Plot ဆိုတာ ဘာလဲ?QQ Plot ဆိုတာ ဘာလဲ?

QQ plot ဆိုတာ ဒေတာ (အထူးသဖြင့် regression လုပ်ပြီးထွက်လာတဲ့ residual တွေ) က ပုံမှန်ဖြန့်ကျက်မှု (Normal Distribution) ရှိလား၊ မရှိဘူးလားဆိုတာကို မျက်စိနဲ့မြင်အောင် စစ်ဆေးတဲ့ နည်းလမ်းတစ်ခုဖြစ်ပါတယ်။ဘာလို့ ဒီကောင်ကို သုံးတာလဲ?linear regression လုပ်တယ်ဆိုတာ အိမ်တစ်လုံးရဲ့ အကျယ်အဝန်းကိုကြည့်ပြီး ဈေးနှုန်းခန့်မှန်းတာမျိုးပေါ့။ အဲဒီမှာ သင်္ချာနည်းကျ ယူဆချက်တစ်ခုက “ငါ့ရဲ့ ခန့်မှန်းချက်