Chapter 6 ဟာ စာရင်းအင်းဆိုင်ရာ ကောက်ချက်ချခြင်း (statistical inference) မှာ ပထမဆုံးအရေးကြီးတဲ့အပိုင်းဖြစ်တဲ့ “ခန့်မှန်းခြင်း” (estimation) ကို အဓိက ရှင်းလင်းထားပါတယ်။ ဒီခန့်မှန်းခြင်း ဆိုတာကတော့ Chapter 5 မှာ တင်ပြခဲ့တဲ့ sampling distribution သီအိုရီနဲ့ Central Limit Theorem ကို အခြေခံထားတာပါ။
Chapter 6 ရဲ့ ရည်ရွယ်ချက်ကတော့ နမူနာ (sample) မှ ရရှိတဲ့ အချက်အလက်တွေကို သုံးပြီး လူဦးရေတစ်ခုလုံး (population) အကြောင်း သိနိုင်ဖို့ ဖြစ်ပါတယ်။ ဒါကို ခန့်မှန်းတဲ့အခါမှာတော့ နှစ်မျိုးရှိပါတယ်။ တစ်ခုက တည်ရှိမှု ခန့်မှန်းခြင်း (point estimate) ဖြစ်ပြီး၊ တစ်ခုက ကြားကာလ ခန့်မှန်းခြင်း (interval estimate) ပါ။
တည်ရှိမှုခန့်မှန်းခြင်း (Point Estimate) ဆိုတာကတော့…
လူဦးရေ parameter တစ်ခုကို ကိုယ်စားပြုဖို့နဲ့ ပတ်သက်တဲ့ တန်ဖိုးတစ်ခုတည်းကို နမူနာကနေ တွက်ထုတ်လိုက်တဲ့ အချက်လေးပါ။
ဥပမာ – လူဦးရေ ပျမ်းမျှတန်ဖိုး (µ) ကို ခန့်မှန်းဖို့ နမူနာပျမ်းမျှ (x̄) ကို အသုံးပြုတာမျိုးကို ပြောလိုတာပါ။
ကြားကာလ ခန့်မှန်းခြင်း (Interval Estimate) ဆိုတာကတော့…
လူဦးရေ parameter တန်ဖိုးဟာ ဤကြားကာလ (interval) ထဲမှာ တကယ်ရှိနေနိုင်တယ်လို့ ခန့်မှန်းတာပါ။
ထို့အပြင် ယုံကြည်မှုတစ်ခုပါ ထည့်သွင်းနိုင်ပါတယ်။ ဒါကြောင့်လည်း ဒီအမျိုးအစားခန့်မှန်းခြင်းကို “ယုံကြည်မှု ကြားကာလ (Confidence Interval)” လို့လည်း ခေါ်ပါတယ်။
ယုံကြည်မှု ကြားကာလတစ်ခု တည်ဆောက်ဖို့ လိုအပ်တဲ့ အစိတ်အပိုင်းတွေကတော့…
ခန့်မှန်းချက် (Estimator): သုံးတဲ့ နမူနာအချက်အလက်ကပဲ parameter ကို ခန့်မှန်းဖို့ အခြေခံတယ်။
ဥပမာ – µ ကို ခန့်မှန်းဖို့ x̄ ကို သုံးတာပါ။
Standard Error: ခန့်မှန်းချက် (estimator) ရဲ့ ဖြန့်ဝေမှုက ဘယ်လောက် ပြောင်းလဲနိုင်လဲဆိုတာကို တိုင်းတာပါတယ်။
ယုံကြည်မှုကိန်းရှင် (Confidence Coefficient – 1-α): ကြားကာလထဲမှာ လူဦးရေ parameter ဟာ တကယ်ဖြစ်နေတာ ဘယ်လောက်အထိ ယုံကြည်ရမလဲဆိုတာကို ပြတာပါ။
Reliability Coefficient: Z သို့မဟုတ် t တန်ဖိုးလိုမျိုးနဲ့ ယုံကြည်မှုကိန်းရှင်ကို တည်ဆောက်ဖို့ သုံးတဲ့ တန်ဖိုးပါ။
Margin of Error (MOE) သို့မဟုတ် precision : တိကျမှုအနေနဲ့ ရှင်းပြနိုင်ပါတယ်။ ဒါက Reliability Coefficient နဲ့ Standard Error ကို မြှောက်ထားတဲ့ တန်ဖိုးပါ။ ကြားကာလရဲ့ အကျယ်တစ်ဝက်လည်း ဖြစ်ပါတယ်။
ယုံကြည်မှုကြားကာလ တွက်တဲ့နည်းလမ်းကို ကျယ်ကျယ်ပြောရရင်
Point Estimate ± Margin of Error
သို့မဟုတ်
Estimator ± (Reliability Coefficient × Standard Error) ဖြစ်ပါတယ်။
ယုံကြည်မှုကြားကာလရဲ့ အဓိပ္ပာယ်ကို နားလည်ဖို့…
ဖြစ်နိုင်ခြေ ရှုထောင့် (Probabilistic View):
ဤနည်းလမ်းကို ထပ်ခါထပ်ခါသုံးရင်၊ တစ်ခါလောက် parameter အမှန်က ကြားကာလထဲမှာပါလာမယ်လို့ ယူဆရပါတယ်။
လက်တွေ့ ရှုထောင့် (Practical View):
အခု တွက်ထားတဲ့ interval ထဲမှာ လူဦးရေ parameter ဟာ တကယ်အနားနားမှာရှိနေနိုင်တယ်လို့ ယုံကြည်နိုင်တဲ့ ရာခိုင်နှုန်း (ဥပမာ – 95%) တစ်ခု ပါပါတယ်။
အမျိုးမျိုးသော Parameters များအတွက် ခန့်မှန်းခြင်း နည်းလမ်းများ
1. Population Mean (µ)
σ² သိလျှင် → z-distribution ကို သုံး
σ² မသိသေးဘဲ normal ဖြစ်လျှင် → t-distribution ကို သုံး
2. Difference Between Two Means (µ₁ – µ₂)
σ₁², σ₂² သိလျှင် → z-distribution
မသိလျှင် → t-distribution
(equal/unequal variances နဲ့ပတ်သက်တဲ့ Method များပါဝင်တယ်)
3. Population Proportion (p)
နမူနာကြီးပြီး binomial → normal approximation → z-distribution
4. Difference Between Two Proportions (p₁ – p₂)
နမူနာကြီးလျှင် → z-distribution
5. Variance of Normally Distributed Population (σ²)
Chi-Square Distribution ကို သုံး
6. Ratio of Two Variances (σ₁²/σ₂²)
F-distribution ကို သုံး
(Chapter 8 မှာ ပိုမိုအသေးစိတ်ပါဝင်ပါမယ်)
နမူနာ အရွယ်အစား သတ်မှတ်ခြင်း
Chapter 6 မှာလည်း နမူနာကြီးလွန်းတာနဲ့ သေးလွန်းတာ ရဲ့ ထိခိုက်မှုအကြောင်းကို ပြောထားပါတယ်။
ထို့ကြောင့် ခန့်မှန်းခြင်းတိကျဖို့ parameter ရဲ့ variability ကိုသိပြီးမှ sample size ကို မှန်မှန်တွက်ဖို့လိုပါတယ်။
Sampling Distributions နဲ့ CLT ရဲ့ အရေးပါမှု
ယုံကြည်မှုကြားကာလတွေအတွက် အခြေခံသီအိုရီက Chapter 5 မှာ ပြထားတဲ့ Sampling Distribution ဖြစ်ပြီး၊
Central Limit Theorem ကြောင့် မိမိယူတဲ့ နမူနာကြီးလာတာနဲ့ အတူ sample mean distribution ကတော့ normal ဖြစ်လာတာကို အသုံးပြုထားပါတယ်။ ဒါကြောင့် z နဲ့ t-distribution တွေကို သုံးလို့ရလာတာပါ။
Chapter 6 ဟာ Hypothesis Testing (Chapter 7) တို့လို နောက်ပိုင်း အခန်းတွေသို့ မသွားမဖြစ် အခြေခံအဖြစ် တည်ဆောက်ပေးနေတဲ့အခန်းတစ်ခုဖြစ်ပါတယ်။
ဥပမာနဲ့ လေ့ကျင့်ခန်းတွေအပြင် MINITAB နဲ့ SAS တို့ကို အသုံးပြုထားတဲ့ ပုံမှန်နည်းလမ်းတွေလည်း ပါပါတယ်။