Chapter 8 Analysis of Variance (ANOVA)

မင်္ဂလာပါ! Chapter 8 ထဲက အချက်အလက်တွေကို အသေးစိတ် ရှင်းပြပေးပါမယ်။

ဒီအခန်းကြီး Chapter 8 က Analysis of Variance (ANOVA) လို့ခေါ်တဲ့ စာရင်းအင်းနည်းပညာအကြောင်းကို အဓိကထား ရှင်းပြထားပါတယ်။ နာမည်အတိုင်းပဲ၊ ဒီနည်းပညာဟာ ဒေတာအစုအဝေးတစ်ခုထဲမှာရှိတဲ့ စုစုပေါင်းပြောင်းလဲမှု (total variation) ကို အမျိုးမျိုးသော အစိတ်အပိုင်းတွေအဖြစ် ပိုင်းခြားပြီး ခွဲခြမ်းစိတ်ဖြာတဲ့ နည်းလမ်းဖြစ်ပါတယ်။ ဒီအစိတ်အပိုင်းတစ်ခုစီတိုင်းမှာတော့ သီးခြားပြောင်းလဲမှုရင်းမြစ် (source of variation) တစ်ခုစီ ရှိနေပါတယ်။ ဒီလို ပိုင်းခြားခွဲခြမ်းစိတ်ဖြာခြင်းအားဖြင့် လူဦးရေရဲ့ ပျံ့နှံ့မှု (variances) တွေနဲ့ ပျမ်းမျှ (means) တွေအကြောင်း ကောက်ချက်ချဖို့၊ ယူဆချက်တွေ စမ်းသပ်ဖို့ အသုံးပြုနိုင်ပါတယ်။ ဒီအခန်းမှာတော့ ပျမ်းမျှတွေရဲ့ ကောက်ချက်ချခြင်း (hypothesis testing of means) ကို အဓိကထားပြီး ပြောပြထားပါတယ်။

Analysis of Variance (ANOVA) ဆိုတာဘာလဲ။

ANOVA ရဲ့ အဓိကရည်ရွယ်ချက်က ဒေတာတွေထဲမှာရှိတဲ့ စုစုပေါင်းပြောင်းလဲမှု (total variation) ကို အစိတ်အပိုင်းနှစ်ခု ဒါမှမဟုတ် နှစ်ခုထက်ပိုပြီး ပိုင်းခြားဖို့ပါပဲ။ ဒီလို ပိုင်းခြားခြင်းအားဖြင့် ပြောင်းလဲမှုရင်းမြစ်တစ်ခုစီရဲ့ စုစုပေါင်းပြောင်းလဲမှုအပေါ် ဘယ်လောက်အထိ အထောက်အကူပြုလဲဆိုတာကို သိရှိနိုင်ပါတယ်။

ဥပမာအားဖြင့်၊ ဆေးသုံးမျိုး A, B, C တို့ရဲ့ အာနိသင်ကို လေ့လာတဲ့အခါ၊ လူနာတွေရဲ့ တုံ့ပြန်မှုတိုင်းတာမှုတွေမှာ ကွဲပြားမှုတွေရှိတာကို တွေ့ရပါတယ်။ ဒီတိုင်းတာမှုတွေ ဘာလို့မတူညီရတာလဲဆိုတဲ့ အကြောင်းရင်းတွေထဲမှာ လူနာတွေရဲ့ မျိုးရိုးဗီဇကွာခြားမှုတွေ၊ အစားအသောက်ပုံစံ ကွာခြားမှုတွေ စသည်ဖြင့် ပါဝင်ပါတယ်။ ဒီပြောင်းလဲမှုတွေကို ခွဲခြမ်းစိတ်ဖြာခြင်းအားဖြင့် ဆေးသုံးမျိုးရဲ့ အာနိသင် တူညီမှုရှိမရှိ ကောက်ချက်ချနိုင်မှာဖြစ်ပါတယ်။

ယူဆချက် စမ်းသပ်ခြင်း (Hypothesis Testing) အဆင့်များ

ANOVA မှာ ယူဆချက် စမ်းသပ်ခြင်း (hypothesis testing) ကို အဆင့် ၁၀ ဆင့်နဲ့ လုပ်ဆောင်ပါတယ်:

ဒေတာဖော်ပြချက် (Description of data)
ယူဆချက်များ (Assumptions) – ဒီဇိုင်းတစ်ခုချင်းစီအတွက် မော်ဒယ်ကိုလည်း ဖော်ပြပါတယ်။
ယူဆချက်များ (Hypotheses) – ဗလာ ယူဆချက် (null hypothesis) နှင့် အခြား ယူဆချက် (alternative hypothesis) ကို ဖော်ပြပါတယ်။
စမ်းသပ်မှု ကိန်းဂဏန်း (Test statistic)
စမ်းသပ်မှု ကိန်းဂဏန်း၏ ပျံ့နှံ့မှု (Distribution of test statistic)
ဆုံးဖြတ်ချက်စည်းမျဉ်း (Decision rule)
စမ်းသပ်မှု ကိန်းဂဏန်း တွက်ချက်ခြင်း (Calculation of test statistic) – တွက်ချက်မှုရလဒ်တွေကို Analysis of Variance (ANOVA) table လို့ခေါ်တဲ့ ဇယားတစ်ခုမှာ အကျဉ်းချုပ် ဖော်ပြပါတယ်။
စာရင်းအင်း ဆုံးဖြတ်ချက် (Statistical decision)
နိဂုံး (Conclusion)
p-value သတ်မှတ်ခြင်း (Determination of p-value)

အဓိက စမ်းသပ်မှု ဒီဇိုင်းများ (Key Experimental Designs)

ဒီအခန်းမှာ အဓိက ဒီဇိုင်း (၂) ခုကို အသေးစိတ် ဆွေးနွေးထားပြီး၊ တခြားဒီဇိုင်းတွေကိုလည်း မိတ်ဆက်ပေးထားပါတယ်။

Completely Randomized Design (One-Way ANOVA)
- ဒါကတော့ ANOVA ရဲ့ အရှင်းဆုံးပုံစံ ပါ။ t-test ကို နမူနာ (၂) ခုအတွက် အသုံးပြုနိုင်သလိုမျိုး၊ ဒီဒီဇိုင်းကိုတော့ နမူနာ (၃) ခု ဒါမှမဟုတ် ဒီထက်ပိုတဲ့ ပျမ်းမျှတွေကို ခြားနားမှုရှိမရှိ စမ်းသပ်ဖို့ အသုံးပြုနိုင်ပါတယ်။
- ဘယ်အချိန်မှာ သုံးသင့်လဲ။ စမ်းသပ်ယူနစ်တွေ (experimental units) က တူညီမှုရှိတယ် (homogeneous) လို့ယူဆတဲ့အခါမျိုးမှာ အသုံးပြုသင့်ပါတယ်။
- မော်ဒယ်: Completely randomized design အတွက် မော်ဒယ်ကို ဒီလိုရေးနိုင်ပါတယ်: xij = μ + τj + eij ဒီနေရာမှာ xij ဆိုတာက j လို့သတ်မှတ်ထားတဲ့ ကုသမှု (treatment) ကနေ ရလာတဲ့ i ခုမြောက် လေ့လာတွေ့ရှိချက်ကို ပြောတာပါ။ μ က စုစုပေါင်းလူဦးရေပျမ်းမျှ (population mean) ကို ကိုယ်စားပြုပြီး τj ကတော့ j ကုသမှုရဲ့ သက်ရောက်မှု (treatment effect) ကို ဆိုလိုပါတယ်။ eij ကတော့ လေ့လာတွေ့ရှိရတဲ့ တန်ဖိုး (observed value) နဲ့ မော်ဒယ်ကနေ ခန့်မှန်းထားတဲ့ တန်ဖိုး (value predicted by the model) အကြား အမှားအယွင်း (error) ကို ကိုယ်စားပြုပါတယ်။
- ယူဆချက်များ (Assumptions):
  - k ခုသော ဒေတာအစုအဝေးတွေဟာ သက်ဆိုင်ရာ လူဦးရေတွေကနေ လွတ်လပ်ပြီး ကျပန်းနမူနာ (independent random samples) များဖြစ်ရမယ်။
  - k ခုသော လူဦးရေတွေဟာ သာမန်ပျံ့နှံ့မှု (normally distributed) ရှိရမယ်။
  - k ခုသော လူဦးရေတွေရဲ့ ပြောင်းလဲမှု (variances) တွေဟာ အားလုံးတူညီရမယ် (equal)။
- ပြောင်းလဲမှု ပိုင်းခြားခြင်း (Partitioning of Variation):
  - Total Sum of Squares (SST): စုစုပေါင်း ပြောင်းလဲမှု။
  - Among-Group Sum of Squares (SSA): ကုသမှုအုပ်စုတွေကြားက ပြောင်းလဲမှု။
  - Within-Group Sum of Squares (SSW): အုပ်စုတစ်ခုစီအတွင်းက ပြောင်းလဲမှု။
  - SST = SSA + SSW လို့ ပိုင်းခြားနိုင်ပါတယ်။
- F-test Statistic (V.R.): စမ်းသပ်မှု ကိန်းဂဏန်းဟာ V.R. (Variance Ratio) ဖြစ်ပြီး အောက်ပါအတိုင်း တွက်ချက်ပါတယ်: V.R. = MSA / MSW (Mean Square Among / Mean Square Within) ဒီကိန်းဂဏန်းဟာ null hypothesis မှန်တဲ့အခါ F distribution ကို လိုက်နာပါတယ်။
- ANOVA Table: တွက်ချက်မှုရလဒ်တွေကို Table 8.2.2 ကဲ့သို့သော ANOVA ဇယားမှာ ဖော်ပြပါတယ်။
- Multiple Comparison Procedures: null hypothesis ကို ပယ်ချပြီးနောက်၊ ဘယ်ပျမ်းမျှတွေက အချင်းချင်း ခြားနားမှုရှိလဲဆိုတာကို ရှာဖွေဖို့ Tukey’s HSD test နဲ့ Bonferroni’s method လိုမျိုး နည်းလမ်းတွေကို အသုံးပြုနိုင်ပါတယ်။
Randomized Complete Block Design
- ဒီဒီဇိုင်းရဲ့ ရည်ရွယ်ချက် က blocks (အုပ်စုခွဲခြင်း) ကြောင့် ဖြစ်ပေါ်လာတဲ့ ပြောင်းလဲမှုတွေကို ဖယ်ရှားပြီး error term ထဲက ပြောင်းလဲမှုတွေကို လျှော့ချဖို့ပါ။ ဒါမှ ကုသမှုပျမ်းမျှတွေဟာ block effect တွေကနေ ကင်းဝေးပြီး ပိုမိုတိကျတဲ့ ကောက်ချက်တွေ ချနိုင်မှာပါ။
- ဘယ်အချိန်မှာ သုံးသင့်လဲ။ စမ်းသပ်ယူနစ်တွေက တူညီမှုမရှိဘူး (not homogeneous) လို့ ယူဆတဲ့အခါ၊ ဒါပေမယ့် အုပ်စုငယ်လေးတွေအဖြစ် homogeneous blocks တွေ ဖန်တီးနိုင်တဲ့အခါမျိုးမှာ ဒီဒီဇိုင်းကို အသုံးပြုပါတယ်။
- မော်ဒယ်: Randomized complete block design အတွက် မော်ဒယ်ကို ဒီလိုရေးနိုင်ပါတယ်: xij = μ + bi + τj + eij ဒီနေရာမှာ bi ဆိုတာက block effect ကို ကိုယ်စားပြုပြီး τj ကတော့ treatment effect ကို ကိုယ်စားပြုပါတယ်။
- ပြောင်းလဲမှု ပိုင်းခြားခြင်း: စုစုပေါင်းပြောင်းလဲမှုကို blocks (SSBl)၊ treatments (SSTr)၊ နဲ့ error (SSE) ဆိုတဲ့ အစိတ်အပိုင်း (၃) ခုအဖြစ် ပိုင်းခြားနိုင်ပါတယ်။
- ANOVA Table: တွက်ချက်မှုရလဒ်တွေကို Table 8.3.2 ကဲ့သို့သော ANOVA ဇယားမှာ ဖော်ပြပါတယ်။
Repeated Measures Design
- ဒီဒီဇိုင်းက Randomized Complete Block Design နဲ့ အလွန်ဆင်တူပါတယ်။ ဒီနေရာမှာတော့ subjects (ဘာသာရပ်များ) တွေကို blocks အဖြစ် သတ်မှတ်ပါတယ်။ ဆိုလိုတာက၊ ဘာသာရပ်တစ်ခုစီကို ကုသမှုအားလုံး သို့မဟုတ် အခြေအနေအားလုံးကို အကြိမ်ကြိမ် တိုင်းတာတာမျိုးပါ။
- မော်ဒယ်: Randomized complete block design ရဲ့ မော်ဒယ်နဲ့ တူညီပါတယ်။
- နှစ်ခု-အချက် (Two-Factor) Repeated Measures: အကယ်၍ ကုသမှုအမျိုးအစားနှစ်မျိုး (treatment conditions) အောက်မှာ အချိန်အလိုက် တိုင်းတာမှုတွေရှိရင် နှစ်ခု-အချက် (two-factor) repeated measures လို့ ခေါ်နိုင်ပါတယ်။
Factorial Experiment
- Factorial experiment မှာဆိုရင် အချက် (factors) တစ်ခုထက်ပိုပြီး လေ့လာနိုင်ရုံသာမက အချက်တွေကြားက အပြန်အလှန်သက်ရောက်မှု (interaction) ကိုပါ လေ့လာနိုင်ပါတယ်။
- Interaction (အပြန်အလှန်သက်ရောက်မှု) သဘောတရား: ဥပမာ၊ ဆေးပမာဏအမျိုးမျိုးနဲ့ အသက်အုပ်စု (လူငယ်/လူကြီး) နှစ်မျိုးရဲ့ တုံ့ပြန်မှုအချိန်အပေါ် သက်ရောက်မှုကို လေ့လာတဲ့အခါ၊ ဆေးပမာဏတစ်ခုရဲ့ အသက်အုပ်စုတစ်ခုစီအပေါ် သက်ရောက်မှုက မတူညီဘူးဆိုရင် ဒါကို interaction လို့ခေါ်ပါတယ်။
- မော်ဒယ်: Two-factor completely randomized fixed-effects factorial model ကို ဒီလိုရေးနိုင်ပါတယ်: xijk = μ + αj + βk + (αβ)jk + eijk ဒီနေရာမှာ αj က Factor A ရဲ့ main effect၊ βk က Factor B ရဲ့ main effect၊ (αβ)jk ကတော့ Factor A နဲ့ Factor B တို့ကြားက interaction effect ကို ကိုယ်စားပြုပါတယ်။ eijk ကတော့ error component ပါ။
- ယူဆချက်များ: Completely randomized design မှာလိုပဲ လွတ်လပ်ပြီး ကျပန်းနမူနာ၊ ပုံမှန်ပျံ့နှံ့မှု၊ တူညီသော variance များ စသည်တို့ကို ယူဆပါတယ်။
- ယူဆချက်များ (Hypotheses): Factorial experiment မှာ ယူဆချက် (၃) ခုကို စမ်းသပ်နိုင်ပါတယ်:
  - Factor A main effect မရှိဘူး။
  - Factor B main effect မရှိဘူး။
  - Interaction effect မရှိဘူး။
- ANOVA Table: တွက်ချက်မှုရလဒ်တွေကို Table 8.5.4 ကဲ့သို့သော ANOVA ဇယားမှာ ဖော်ပြပါတယ်။

ကွန်ပျူတာ အသုံးပြုခြင်း

ANOVA မှာ လိုအပ်တဲ့ တွက်ချက်မှုတွေဟာ ရှုပ်ထွေးပြီး ရှည်လျားပါတယ်။ ဒါကြောင့် ကွန်ပျူတာ (statistical software packages) တွေဟာ ANOVA ခွဲခြမ်းစိတ်ဖြာမှုမှာ အရေးပါတဲ့ အခန်းကဏ္ဍကနေ ပါဝင်ပါတယ်။ ဒီအခန်းမှာ ဖော်ပြထားတဲ့ လေ့ကျင့်ခန်းအားလုံးကို ကွန်ပျူတာနဲ့ ဖြေရှင်းနိုင်ပါတယ်။

Overall, Chapter 8 ဟာ စာရင်းအင်းပညာရှင်တွေ ကျယ်ကျယ်ပြန့်ပြန့် အသုံးပြုကြတဲ့ analysis of variance ဆိုတဲ့ အသုံးဝင်တဲ့ ခွဲခြမ်းစိတ်ဖြာမှု ကိရိယာကို နားလည်စေဖို့ အခြေခံအချက်အလက်တွေကို ပေးထားပါတယ်။ ဒေတာတွေထဲက စုစုပေါင်းပြောင်းလဲမှုကို အမျိုးမျိုးသော ပြောင်းလဲမှုရင်းမြစ်တွေအဖြစ် ဘယ်လိုပိုင်းခြားလဲဆိုတာကို သင်ယူရမှာဖြစ်ပြီး၊ အဲဒီနောက်မှာ ပျမ်းမျှတွေနဲ့ ပျံ့နှံ့မှုတွေအကြောင်း ယူဆချက်တွေကို ဘယ်လို စမ်းသပ်ရမယ်ဆိုတာကိုပါ လေ့လာရမှာဖြစ်ပါတယ်။

Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Chapter 8 Analysis of Variance (ANOVA)

Discover more from naywinaung

Related Post

Bessel’s CorrectionBessel’s Correction

ဒေတာအမျိုးအစားများဒေတာအမျိုးအစားများ

eHealth (Lili model)eHealth (Lili model)