naywinaung Biostatistics statistical inference

statistical inference

Chapter 6 ဟာ စာရင်းအင်းဆိုင်ရာ ကောက်ချက်ချခြင်း (statistical inference) မှာ ပထမဆုံးအရေးကြီးတဲ့အပိုင်းဖြစ်တဲ့ “ခန့်မှန်းခြင်း” (estimation) ကို အဓိက ရှင်းလင်းထားပါတယ်။ ဒီခန့်မှန်းခြင်း ဆိုတာကတော့ Chapter 5 မှာ တင်ပြခဲ့တဲ့ sampling distribution သီအိုရီနဲ့ Central Limit Theorem ကို အခြေခံထားတာပါ။

Chapter 6 ရဲ့ ရည်ရွယ်ချက်ကတော့ နမူနာ (sample) မှ ရရှိတဲ့ အချက်အလက်တွေကို သုံးပြီး လူဦးရေတစ်ခုလုံး (population) အကြောင်း သိနိုင်ဖို့ ဖြစ်ပါတယ်။ ဒါကို ခန့်မှန်းတဲ့အခါမှာတော့ နှစ်မျိုးရှိပါတယ်။ တစ်ခုက တည်ရှိမှု ခန့်မှန်းခြင်း (point estimate) ဖြစ်ပြီး၊ တစ်ခုက ကြားကာလ ခန့်မှန်းခြင်း (interval estimate) ပါ။

တည်ရှိမှုခန့်မှန်းခြင်း (Point Estimate) ဆိုတာကတော့…
လူဦးရေ parameter တစ်ခုကို ကိုယ်စားပြုဖို့နဲ့ ပတ်သက်တဲ့ တန်ဖိုးတစ်ခုတည်းကို နမူနာကနေ တွက်ထုတ်လိုက်တဲ့ အချက်လေးပါ။
ဥပမာ – လူဦးရေ ပျမ်းမျှတန်ဖိုး (µ) ကို ခန့်မှန်းဖို့ နမူနာပျမ်းမျှ (x̄) ကို အသုံးပြုတာမျိုးကို ပြောလိုတာပါ။

ကြားကာလ ခန့်မှန်းခြင်း (Interval Estimate) ဆိုတာကတော့…
လူဦးရေ parameter တန်ဖိုးဟာ ဤကြားကာလ (interval) ထဲမှာ တကယ်ရှိနေနိုင်တယ်လို့ ခန့်မှန်းတာပါ။
ထို့အပြင် ယုံကြည်မှုတစ်ခုပါ ထည့်သွင်းနိုင်ပါတယ်။ ဒါကြောင့်လည်း ဒီအမျိုးအစားခန့်မှန်းခြင်းကို “ယုံကြည်မှု ကြားကာလ (Confidence Interval)” လို့လည်း ခေါ်ပါတယ်။

ယုံကြည်မှု ကြားကာလတစ်ခု တည်ဆောက်ဖို့ လိုအပ်တဲ့ အစိတ်အပိုင်းတွေကတော့…
ခန့်မှန်းချက် (Estimator): သုံးတဲ့ နမူနာအချက်အလက်ကပဲ parameter ကို ခန့်မှန်းဖို့ အခြေခံတယ်။
ဥပမာ – µ ကို ခန့်မှန်းဖို့ x̄ ကို သုံးတာပါ။

Standard Error: ခန့်မှန်းချက် (estimator) ရဲ့ ဖြန့်ဝေမှုက ဘယ်လောက် ပြောင်းလဲနိုင်လဲဆိုတာကို တိုင်းတာပါတယ်။

ယုံကြည်မှုကိန်းရှင် (Confidence Coefficient – 1-α): ကြားကာလထဲမှာ လူဦးရေ parameter ဟာ တကယ်ဖြစ်နေတာ ဘယ်လောက်အထိ ယုံကြည်ရမလဲဆိုတာကို ပြတာပါ။

Reliability Coefficient: Z သို့မဟုတ် t တန်ဖိုးလိုမျိုးနဲ့ ယုံကြည်မှုကိန်းရှင်ကို တည်ဆောက်ဖို့ သုံးတဲ့ တန်ဖိုးပါ။

Margin of Error (MOE) သို့မဟုတ် precision : တိကျမှုအနေနဲ့ ရှင်းပြနိုင်ပါတယ်။ ဒါက Reliability Coefficient နဲ့ Standard Error ကို မြှောက်ထားတဲ့ တန်ဖိုးပါ။ ကြားကာလရဲ့ အကျယ်တစ်ဝက်လည်း ဖြစ်ပါတယ်။

ယုံကြည်မှုကြားကာလ တွက်တဲ့နည်းလမ်းကို ကျယ်ကျယ်ပြောရရင်
Point Estimate ± Margin of Error
သို့မဟုတ်
Estimator ± (Reliability Coefficient × Standard Error) ဖြစ်ပါတယ်။

ယုံကြည်မှုကြားကာလရဲ့ အဓိပ္ပာယ်ကို နားလည်ဖို့…

ဖြစ်နိုင်ခြေ ရှုထောင့် (Probabilistic View):
ဤနည်းလမ်းကို ထပ်ခါထပ်ခါသုံးရင်၊ တစ်ခါလောက် parameter အမှန်က ကြားကာလထဲမှာပါလာမယ်လို့ ယူဆရပါတယ်။

လက်တွေ့ ရှုထောင့် (Practical View):
အခု တွက်ထားတဲ့ interval ထဲမှာ လူဦးရေ parameter ဟာ တကယ်အနားနားမှာရှိနေနိုင်တယ်လို့ ယုံကြည်နိုင်တဲ့ ရာခိုင်နှုန်း (ဥပမာ – 95%) တစ်ခု ပါပါတယ်။

အမျိုးမျိုးသော Parameters များအတွက် ခန့်မှန်းခြင်း နည်းလမ်းများ
1. Population Mean (µ)
σ² သိလျှင် → z-distribution ကို သုံး

σ² မသိသေးဘဲ normal ဖြစ်လျှင် → t-distribution ကို သုံး

2. Difference Between Two Means (µ₁ – µ₂)
σ₁², σ₂² သိလျှင် → z-distribution

မသိလျှင် → t-distribution
(equal/unequal variances နဲ့ပတ်သက်တဲ့ Method များပါဝင်တယ်)

3. Population Proportion (p)
နမူနာကြီးပြီး binomial → normal approximation → z-distribution

4. Difference Between Two Proportions (p₁ – p₂)
နမူနာကြီးလျှင် → z-distribution

5. Variance of Normally Distributed Population (σ²)
Chi-Square Distribution ကို သုံး

6. Ratio of Two Variances (σ₁²/σ₂²)
F-distribution ကို သုံး
(Chapter 8 မှာ ပိုမိုအသေးစိတ်ပါဝင်ပါမယ်)

နမူနာ အရွယ်အစား သတ်မှတ်ခြင်း
Chapter 6 မှာလည်း နမူနာကြီးလွန်းတာနဲ့ သေးလွန်းတာ ရဲ့ ထိခိုက်မှုအကြောင်းကို ပြောထားပါတယ်။
ထို့ကြောင့် ခန့်မှန်းခြင်းတိကျဖို့ parameter ရဲ့ variability ကိုသိပြီးမှ sample size ကို မှန်မှန်တွက်ဖို့လိုပါတယ်။

Sampling Distributions နဲ့ CLT ရဲ့ အရေးပါမှု

ယုံကြည်မှုကြားကာလတွေအတွက် အခြေခံသီအိုရီက Chapter 5 မှာ ပြထားတဲ့ Sampling Distribution ဖြစ်ပြီး၊
Central Limit Theorem ကြောင့် မိမိယူတဲ့ နမူနာကြီးလာတာနဲ့ အတူ sample mean distribution ကတော့ normal ဖြစ်လာတာကို အသုံးပြုထားပါတယ်။ ဒါကြောင့် z နဲ့ t-distribution တွေကို သုံးလို့ရလာတာပါ။

Chapter 6 ဟာ Hypothesis Testing (Chapter 7) တို့လို နောက်ပိုင်း အခန်းတွေသို့ မသွားမဖြစ် အခြေခံအဖြစ် တည်ဆောက်ပေးနေတဲ့အခန်းတစ်ခုဖြစ်ပါတယ်။
ဥပမာနဲ့ လေ့ကျင့်ခန်းတွေအပြင် MINITAB နဲ့ SAS တို့ကို အသုံးပြုထားတဲ့ ပုံမှန်နည်းလမ်းတွေလည်း ပါပါတယ်။


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

Chapter 12 The Chi-Square DistributionChapter 12 The Chi-Square Distribution

အခန်း ၁၂ ဖြစ်တဲ့ “ခိုင်စကွဲယား ဖြန့်ဝေမှု (The Chi-Square Distribution) နဲ့ ကြိမ်နှုန်းဆိုင်ရာ ခွဲခြမ်းစိတ်ဖြာခြင်း (Analysis of Frequencies)” အကြောင်းကို ဆွေးနွေးပေးပါမယ်။ ဒီအခန်းဟာ ကျွန်တော်တို့ အရင်က လေ့လာခဲ့တဲ့ ကိန်းဂဏာန်း တိုင်းတာမှုတွေ ဒါမှမဟုတ် ဆက်နွယ်မှုတွေနဲ့ မတူဘဲ အရေအတွက် (counts) ဒါမှမဟုတ် ကြိမ်နှုန်း (frequencies)

Chapter 10 Multiple Regression and CorrelationChapter 10 Multiple Regression and Correlation

အခန်း ၁၀ ဖြစ်တဲ့ “မျိုးစုံသုံး ပြန်လည်ဆန်းစစ်ခြင်းနှင့် ဆက်စပ်မှု (Multiple Regression and Correlation)” အကြောင်းကို ဆွေးနွေးပေးပါမယ်။ ဒါဟာ ကျွန်တော်တို့ အရင်ဆွေးနွေးခဲ့တဲ့ အခန်း ၂ က ဖော်ပြချက်ဆိုင်ရာ စာရင်းအင်းပညာနဲ့ အခန်း ၉ က ရိုးရှင်းသော ပြန်လည်ဆန်းစစ်ခြင်း (Simple Linear Regression) တို့ရဲ့ အဆက်ဖြစ်ပါတယ်।မျိုးစုံသုံး

Chapter 13 Nonparametric and DistributionChapter 13 Nonparametric and Distribution

အခန်း ၁၃ ဖြစ်တဲ့ “Nonparametric and Distribution-Free စာရင်းအင်းပညာ” အကြောင်းကို ဆွေးနွေးပေးပါမယ် ။Nonparametric and Distribution-Free စာရင်းအင်းပညာ နိဒါန်း စာရင်းအင်းပညာမှာ ကောက်ချက်ဆွဲခြင်း (inferential statistics) ကို လုပ်တဲ့အခါ အခန်း ၇ ကစပြီး သင်ယူခဲ့ရတဲ့ t-test, F-test လို နည်းလမ်းတွေဟာ “Parametric” နည်းလမ်းတွေ