statistical inference

Chapter 6 ဟာ စာရင်းအင်းဆိုင်ရာ ကောက်ချက်ချခြင်း (statistical inference) မှာ ပထမဆုံးအရေးကြီးတဲ့အပိုင်းဖြစ်တဲ့ “ခန့်မှန်းခြင်း” (estimation) ကို အဓိက ရှင်းလင်းထားပါတယ်။ ဒီခန့်မှန်းခြင်း ဆိုတာကတော့ Chapter 5 မှာ တင်ပြခဲ့တဲ့ sampling distribution သီအိုရီနဲ့ Central Limit Theorem ကို အခြေခံထားတာပါ။

Chapter 6 ရဲ့ ရည်ရွယ်ချက်ကတော့ နမူနာ (sample) မှ ရရှိတဲ့ အချက်အလက်တွေကို သုံးပြီး လူဦးရေတစ်ခုလုံး (population) အကြောင်း သိနိုင်ဖို့ ဖြစ်ပါတယ်။ ဒါကို ခန့်မှန်းတဲ့အခါမှာတော့ နှစ်မျိုးရှိပါတယ်။ တစ်ခုက တည်ရှိမှု ခန့်မှန်းခြင်း (point estimate) ဖြစ်ပြီး၊ တစ်ခုက ကြားကာလ ခန့်မှန်းခြင်း (interval estimate) ပါ။

တည်ရှိမှုခန့်မှန်းခြင်း (Point Estimate) ဆိုတာကတော့…
လူဦးရေ parameter တစ်ခုကို ကိုယ်စားပြုဖို့နဲ့ ပတ်သက်တဲ့ တန်ဖိုးတစ်ခုတည်းကို နမူနာကနေ တွက်ထုတ်လိုက်တဲ့ အချက်လေးပါ။
ဥပမာ – လူဦးရေ ပျမ်းမျှတန်ဖိုး (µ) ကို ခန့်မှန်းဖို့ နမူနာပျမ်းမျှ (x̄) ကို အသုံးပြုတာမျိုးကို ပြောလိုတာပါ။

ကြားကာလ ခန့်မှန်းခြင်း (Interval Estimate) ဆိုတာကတော့…
လူဦးရေ parameter တန်ဖိုးဟာ ဤကြားကာလ (interval) ထဲမှာ တကယ်ရှိနေနိုင်တယ်လို့ ခန့်မှန်းတာပါ။
ထို့အပြင် ယုံကြည်မှုတစ်ခုပါ ထည့်သွင်းနိုင်ပါတယ်။ ဒါကြောင့်လည်း ဒီအမျိုးအစားခန့်မှန်းခြင်းကို “ယုံကြည်မှု ကြားကာလ (Confidence Interval)” လို့လည်း ခေါ်ပါတယ်။

ယုံကြည်မှု ကြားကာလတစ်ခု တည်ဆောက်ဖို့ လိုအပ်တဲ့ အစိတ်အပိုင်းတွေကတော့…
ခန့်မှန်းချက် (Estimator): သုံးတဲ့ နမူနာအချက်အလက်ကပဲ parameter ကို ခန့်မှန်းဖို့ အခြေခံတယ်။
ဥပမာ – µ ကို ခန့်မှန်းဖို့ x̄ ကို သုံးတာပါ။

Standard Error: ခန့်မှန်းချက် (estimator) ရဲ့ ဖြန့်ဝေမှုက ဘယ်လောက် ပြောင်းလဲနိုင်လဲဆိုတာကို တိုင်းတာပါတယ်။

ယုံကြည်မှုကိန်းရှင် (Confidence Coefficient – 1-α): ကြားကာလထဲမှာ လူဦးရေ parameter ဟာ တကယ်ဖြစ်နေတာ ဘယ်လောက်အထိ ယုံကြည်ရမလဲဆိုတာကို ပြတာပါ။

Reliability Coefficient: Z သို့မဟုတ် t တန်ဖိုးလိုမျိုးနဲ့ ယုံကြည်မှုကိန်းရှင်ကို တည်ဆောက်ဖို့ သုံးတဲ့ တန်ဖိုးပါ။

Margin of Error (MOE) သို့မဟုတ် precision : တိကျမှုအနေနဲ့ ရှင်းပြနိုင်ပါတယ်။ ဒါက Reliability Coefficient နဲ့ Standard Error ကို မြှောက်ထားတဲ့ တန်ဖိုးပါ။ ကြားကာလရဲ့ အကျယ်တစ်ဝက်လည်း ဖြစ်ပါတယ်။

ယုံကြည်မှုကြားကာလ တွက်တဲ့နည်းလမ်းကို ကျယ်ကျယ်ပြောရရင်
Point Estimate ± Margin of Error
သို့မဟုတ်
Estimator ± (Reliability Coefficient × Standard Error) ဖြစ်ပါတယ်။

ယုံကြည်မှုကြားကာလရဲ့ အဓိပ္ပာယ်ကို နားလည်ဖို့…

ဖြစ်နိုင်ခြေ ရှုထောင့် (Probabilistic View):
ဤနည်းလမ်းကို ထပ်ခါထပ်ခါသုံးရင်၊ တစ်ခါလောက် parameter အမှန်က ကြားကာလထဲမှာပါလာမယ်လို့ ယူဆရပါတယ်။

လက်တွေ့ ရှုထောင့် (Practical View):
အခု တွက်ထားတဲ့ interval ထဲမှာ လူဦးရေ parameter ဟာ တကယ်အနားနားမှာရှိနေနိုင်တယ်လို့ ယုံကြည်နိုင်တဲ့ ရာခိုင်နှုန်း (ဥပမာ – 95%) တစ်ခု ပါပါတယ်။

အမျိုးမျိုးသော Parameters များအတွက် ခန့်မှန်းခြင်း နည်းလမ်းများ
1. Population Mean (µ)
σ² သိလျှင် → z-distribution ကို သုံး

σ² မသိသေးဘဲ normal ဖြစ်လျှင် → t-distribution ကို သုံး

2. Difference Between Two Means (µ₁ – µ₂)
σ₁², σ₂² သိလျှင် → z-distribution

မသိလျှင် → t-distribution
(equal/unequal variances နဲ့ပတ်သက်တဲ့ Method များပါဝင်တယ်)

3. Population Proportion (p)
နမူနာကြီးပြီး binomial → normal approximation → z-distribution

4. Difference Between Two Proportions (p₁ – p₂)
နမူနာကြီးလျှင် → z-distribution

5. Variance of Normally Distributed Population (σ²)
Chi-Square Distribution ကို သုံး

6. Ratio of Two Variances (σ₁²/σ₂²)
F-distribution ကို သုံး
(Chapter 8 မှာ ပိုမိုအသေးစိတ်ပါဝင်ပါမယ်)

နမူနာ အရွယ်အစား သတ်မှတ်ခြင်း
Chapter 6 မှာလည်း နမူနာကြီးလွန်းတာနဲ့ သေးလွန်းတာ ရဲ့ ထိခိုက်မှုအကြောင်းကို ပြောထားပါတယ်။
ထို့ကြောင့် ခန့်မှန်းခြင်းတိကျဖို့ parameter ရဲ့ variability ကိုသိပြီးမှ sample size ကို မှန်မှန်တွက်ဖို့လိုပါတယ်။

Sampling Distributions နဲ့ CLT ရဲ့ အရေးပါမှု

ယုံကြည်မှုကြားကာလတွေအတွက် အခြေခံသီအိုရီက Chapter 5 မှာ ပြထားတဲ့ Sampling Distribution ဖြစ်ပြီး၊
Central Limit Theorem ကြောင့် မိမိယူတဲ့ နမူနာကြီးလာတာနဲ့ အတူ sample mean distribution ကတော့ normal ဖြစ်လာတာကို အသုံးပြုထားပါတယ်။ ဒါကြောင့် z နဲ့ t-distribution တွေကို သုံးလို့ရလာတာပါ။

Chapter 6 ဟာ Hypothesis Testing (Chapter 7) တို့လို နောက်ပိုင်း အခန်းတွေသို့ မသွားမဖြစ် အခြေခံအဖြစ် တည်ဆောက်ပေးနေတဲ့အခန်းတစ်ခုဖြစ်ပါတယ်။
ဥပမာနဲ့ လေ့ကျင့်ခန်းတွေအပြင် MINITAB နဲ့ SAS တို့ကို အသုံးပြုထားတဲ့ ပုံမှန်နည်းလမ်းတွေလည်း ပါပါတယ်။

Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

အခန်း ၁၀ ဖြစ်တဲ့ “မျိုးစုံသုံး ပြန်လည်ဆန်းစစ်ခြင်းနှင့် ဆက်စပ်မှု (Multiple Regression and Correlation)” အကြောင်းကို ဆွေးနွေးပေးပါမယ်။ ဒါဟာ ကျွန်တော်တို့ အရင်ဆွေးနွေးခဲ့တဲ့ အခန်း ၂ က ဖော်ပြချက်ဆိုင်ရာ စာရင်းအင်းပညာနဲ့ အခန်း ၉ က ရိုးရှင်းသော ပြန်လည်ဆန်းစစ်ခြင်း (Simple Linear Regression) တို့ရဲ့ အဆက်ဖြစ်ပါတယ်।မျိုးစုံသုံး

statistical inference

Discover more from naywinaung

Leave a Reply Cancel reply

Related Post

Chapter 12 The Chi-Square DistributionChapter 12 The Chi-Square Distribution

Chapter 10 Multiple Regression and CorrelationChapter 10 Multiple Regression and Correlation

Chapter 13 Nonparametric and DistributionChapter 13 Nonparametric and Distribution