naywinaung Chapter 8 Analysis of Variance (ANOVA)

Chapter 8 Analysis of Variance (ANOVA)

မင်္ဂလာပါ! Chapter 8 ထဲက အချက်အလက်တွေကို အသေးစိတ် ရှင်းပြပေးပါမယ်။

ဒီအခန်းကြီး Chapter 8 က Analysis of Variance (ANOVA) လို့ခေါ်တဲ့ စာရင်းအင်းနည်းပညာအကြောင်းကို အဓိကထား ရှင်းပြထားပါတယ်။ နာမည်အတိုင်းပဲ၊ ဒီနည်းပညာဟာ ဒေတာအစုအဝေးတစ်ခုထဲမှာရှိတဲ့ စုစုပေါင်းပြောင်းလဲမှု (total variation) ကို အမျိုးမျိုးသော အစိတ်အပိုင်းတွေအဖြစ် ပိုင်းခြားပြီး ခွဲခြမ်းစိတ်ဖြာတဲ့ နည်းလမ်းဖြစ်ပါတယ်။ ဒီအစိတ်အပိုင်းတစ်ခုစီတိုင်းမှာတော့ သီးခြားပြောင်းလဲမှုရင်းမြစ် (source of variation) တစ်ခုစီ ရှိနေပါတယ်။ ဒီလို ပိုင်းခြားခွဲခြမ်းစိတ်ဖြာခြင်းအားဖြင့် လူဦးရေရဲ့ ပျံ့နှံ့မှု (variances) တွေနဲ့ ပျမ်းမျှ (means) တွေအကြောင်း ကောက်ချက်ချဖို့၊ ယူဆချက်တွေ စမ်းသပ်ဖို့ အသုံးပြုနိုင်ပါတယ်။ ဒီအခန်းမှာတော့ ပျမ်းမျှတွေရဲ့ ကောက်ချက်ချခြင်း (hypothesis testing of means) ကို အဓိကထားပြီး ပြောပြထားပါတယ်။

Analysis of Variance (ANOVA) ဆိုတာဘာလဲ။

ANOVA ရဲ့ အဓိကရည်ရွယ်ချက်က ဒေတာတွေထဲမှာရှိတဲ့ စုစုပေါင်းပြောင်းလဲမှု (total variation) ကို အစိတ်အပိုင်းနှစ်ခု ဒါမှမဟုတ် နှစ်ခုထက်ပိုပြီး ပိုင်းခြားဖို့ပါပဲ။ ဒီလို ပိုင်းခြားခြင်းအားဖြင့် ပြောင်းလဲမှုရင်းမြစ်တစ်ခုစီရဲ့ စုစုပေါင်းပြောင်းလဲမှုအပေါ် ဘယ်လောက်အထိ အထောက်အကူပြုလဲဆိုတာကို သိရှိနိုင်ပါတယ်။

ဥပမာအားဖြင့်၊ ဆေးသုံးမျိုး A, B, C တို့ရဲ့ အာနိသင်ကို လေ့လာတဲ့အခါ၊ လူနာတွေရဲ့ တုံ့ပြန်မှုတိုင်းတာမှုတွေမှာ ကွဲပြားမှုတွေရှိတာကို တွေ့ရပါတယ်။ ဒီတိုင်းတာမှုတွေ ဘာလို့မတူညီရတာလဲဆိုတဲ့ အကြောင်းရင်းတွေထဲမှာ လူနာတွေရဲ့ မျိုးရိုးဗီဇကွာခြားမှုတွေ၊ အစားအသောက်ပုံစံ ကွာခြားမှုတွေ စသည်ဖြင့် ပါဝင်ပါတယ်။ ဒီပြောင်းလဲမှုတွေကို ခွဲခြမ်းစိတ်ဖြာခြင်းအားဖြင့် ဆေးသုံးမျိုးရဲ့ အာနိသင် တူညီမှုရှိမရှိ ကောက်ချက်ချနိုင်မှာဖြစ်ပါတယ်။

ယူဆချက် စမ်းသပ်ခြင်း (Hypothesis Testing) အဆင့်များ

ANOVA မှာ ယူဆချက် စမ်းသပ်ခြင်း (hypothesis testing) ကို အဆင့် ၁၀ ဆင့်နဲ့ လုပ်ဆောင်ပါတယ်:

  1. ဒေတာဖော်ပြချက် (Description of data)
  2. ယူဆချက်များ (Assumptions) – ဒီဇိုင်းတစ်ခုချင်းစီအတွက် မော်ဒယ်ကိုလည်း ဖော်ပြပါတယ်။
  3. ယူဆချက်များ (Hypotheses) – ဗလာ ယူဆချက် (null hypothesis) နှင့် အခြား ယူဆချက် (alternative hypothesis) ကို ဖော်ပြပါတယ်။
  4. စမ်းသပ်မှု ကိန်းဂဏန်း (Test statistic)
  5. စမ်းသပ်မှု ကိန်းဂဏန်း၏ ပျံ့နှံ့မှု (Distribution of test statistic)
  6. ဆုံးဖြတ်ချက်စည်းမျဉ်း (Decision rule)
  7. စမ်းသပ်မှု ကိန်းဂဏန်း တွက်ချက်ခြင်း (Calculation of test statistic) – တွက်ချက်မှုရလဒ်တွေကို Analysis of Variance (ANOVA) table လို့ခေါ်တဲ့ ဇယားတစ်ခုမှာ အကျဉ်းချုပ် ဖော်ပြပါတယ်။
  8. စာရင်းအင်း ဆုံးဖြတ်ချက် (Statistical decision)
  9. နိဂုံး (Conclusion)
  10. p-value သတ်မှတ်ခြင်း (Determination of p-value)

အဓိက စမ်းသပ်မှု ဒီဇိုင်းများ (Key Experimental Designs)

ဒီအခန်းမှာ အဓိက ဒီဇိုင်း (၂) ခုကို အသေးစိတ် ဆွေးနွေးထားပြီး၊ တခြားဒီဇိုင်းတွေကိုလည်း မိတ်ဆက်ပေးထားပါတယ်။

  • Completely Randomized Design (One-Way ANOVA)
    • ဒါကတော့ ANOVA ရဲ့ အရှင်းဆုံးပုံစံ ပါ။ t-test ကို နမူနာ (၂) ခုအတွက် အသုံးပြုနိုင်သလိုမျိုး၊ ဒီဒီဇိုင်းကိုတော့ နမူနာ (၃) ခု ဒါမှမဟုတ် ဒီထက်ပိုတဲ့ ပျမ်းမျှတွေကို ခြားနားမှုရှိမရှိ စမ်းသပ်ဖို့ အသုံးပြုနိုင်ပါတယ်။
    • ဘယ်အချိန်မှာ သုံးသင့်လဲ။ စမ်းသပ်ယူနစ်တွေ (experimental units) က တူညီမှုရှိတယ် (homogeneous) လို့ယူဆတဲ့အခါမျိုးမှာ အသုံးပြုသင့်ပါတယ်။
    • မော်ဒယ်: Completely randomized design အတွက် မော်ဒယ်ကို ဒီလိုရေးနိုင်ပါတယ်: xij = μ + τj + eij ဒီနေရာမှာ xij ဆိုတာက j လို့သတ်မှတ်ထားတဲ့ ကုသမှု (treatment) ကနေ ရလာတဲ့ i ခုမြောက် လေ့လာတွေ့ရှိချက်ကို ပြောတာပါ။ μ က စုစုပေါင်းလူဦးရေပျမ်းမျှ (population mean) ကို ကိုယ်စားပြုပြီး τj ကတော့ j ကုသမှုရဲ့ သက်ရောက်မှု (treatment effect) ကို ဆိုလိုပါတယ်။ eij ကတော့ လေ့လာတွေ့ရှိရတဲ့ တန်ဖိုး (observed value) နဲ့ မော်ဒယ်ကနေ ခန့်မှန်းထားတဲ့ တန်ဖိုး (value predicted by the model) အကြား အမှားအယွင်း (error) ကို ကိုယ်စားပြုပါတယ်။
    • ယူဆချက်များ (Assumptions):
      • k ခုသော ဒေတာအစုအဝေးတွေဟာ သက်ဆိုင်ရာ လူဦးရေတွေကနေ လွတ်လပ်ပြီး ကျပန်းနမူနာ (independent random samples) များဖြစ်ရမယ်။
      • k ခုသော လူဦးရေတွေဟာ သာမန်ပျံ့နှံ့မှု (normally distributed) ရှိရမယ်။
      • k ခုသော လူဦးရေတွေရဲ့ ပြောင်းလဲမှု (variances) တွေဟာ အားလုံးတူညီရမယ် (equal)
    • ပြောင်းလဲမှု ပိုင်းခြားခြင်း (Partitioning of Variation):
      • Total Sum of Squares (SST): စုစုပေါင်း ပြောင်းလဲမှု။
      • Among-Group Sum of Squares (SSA): ကုသမှုအုပ်စုတွေကြားက ပြောင်းလဲမှု။
      • Within-Group Sum of Squares (SSW): အုပ်စုတစ်ခုစီအတွင်းက ပြောင်းလဲမှု။
      • SST = SSA + SSW လို့ ပိုင်းခြားနိုင်ပါတယ်။
    • F-test Statistic (V.R.): စမ်းသပ်မှု ကိန်းဂဏန်းဟာ V.R. (Variance Ratio) ဖြစ်ပြီး အောက်ပါအတိုင်း တွက်ချက်ပါတယ်: V.R. = MSA / MSW (Mean Square Among / Mean Square Within) ဒီကိန်းဂဏန်းဟာ null hypothesis မှန်တဲ့အခါ F distribution ကို လိုက်နာပါတယ်။
    • ANOVA Table: တွက်ချက်မှုရလဒ်တွေကို Table 8.2.2 ကဲ့သို့သော ANOVA ဇယားမှာ ဖော်ပြပါတယ်။
    • Multiple Comparison Procedures: null hypothesis ကို ပယ်ချပြီးနောက်၊ ဘယ်ပျမ်းမျှတွေက အချင်းချင်း ခြားနားမှုရှိလဲဆိုတာကို ရှာဖွေဖို့ Tukey’s HSD test နဲ့ Bonferroni’s method လိုမျိုး နည်းလမ်းတွေကို အသုံးပြုနိုင်ပါတယ်။
  • Randomized Complete Block Design
    • ဒီဒီဇိုင်းရဲ့ ရည်ရွယ်ချက် က blocks (အုပ်စုခွဲခြင်း) ကြောင့် ဖြစ်ပေါ်လာတဲ့ ပြောင်းလဲမှုတွေကို ဖယ်ရှားပြီး error term ထဲက ပြောင်းလဲမှုတွေကို လျှော့ချဖို့ပါ။ ဒါမှ ကုသမှုပျမ်းမျှတွေဟာ block effect တွေကနေ ကင်းဝေးပြီး ပိုမိုတိကျတဲ့ ကောက်ချက်တွေ ချနိုင်မှာပါ။
    • ဘယ်အချိန်မှာ သုံးသင့်လဲ။ စမ်းသပ်ယူနစ်တွေက တူညီမှုမရှိဘူး (not homogeneous) လို့ ယူဆတဲ့အခါ၊ ဒါပေမယ့် အုပ်စုငယ်လေးတွေအဖြစ် homogeneous blocks တွေ ဖန်တီးနိုင်တဲ့အခါမျိုးမှာ ဒီဒီဇိုင်းကို အသုံးပြုပါတယ်။
    • မော်ဒယ်: Randomized complete block design အတွက် မော်ဒယ်ကို ဒီလိုရေးနိုင်ပါတယ်: xij = μ + bi + τj + eij ဒီနေရာမှာ bi ဆိုတာက block effect ကို ကိုယ်စားပြုပြီး τj ကတော့ treatment effect ကို ကိုယ်စားပြုပါတယ်။
    • ပြောင်းလဲမှု ပိုင်းခြားခြင်း: စုစုပေါင်းပြောင်းလဲမှုကို blocks (SSBl)treatments (SSTr)၊ နဲ့ error (SSE) ဆိုတဲ့ အစိတ်အပိုင်း (၃) ခုအဖြစ် ပိုင်းခြားနိုင်ပါတယ်။
    • ANOVA Table: တွက်ချက်မှုရလဒ်တွေကို Table 8.3.2 ကဲ့သို့သော ANOVA ဇယားမှာ ဖော်ပြပါတယ်။
  • Repeated Measures Design
    • ဒီဒီဇိုင်းက Randomized Complete Block Design နဲ့ အလွန်ဆင်တူပါတယ်။ ဒီနေရာမှာတော့ subjects (ဘာသာရပ်များ) တွေကို blocks အဖြစ် သတ်မှတ်ပါတယ်။ ဆိုလိုတာက၊ ဘာသာရပ်တစ်ခုစီကို ကုသမှုအားလုံး သို့မဟုတ် အခြေအနေအားလုံးကို အကြိမ်ကြိမ် တိုင်းတာတာမျိုးပါ။
    • မော်ဒယ်: Randomized complete block design ရဲ့ မော်ဒယ်နဲ့ တူညီပါတယ်။
    • နှစ်ခု-အချက် (Two-Factor) Repeated Measures: အကယ်၍ ကုသမှုအမျိုးအစားနှစ်မျိုး (treatment conditions) အောက်မှာ အချိန်အလိုက် တိုင်းတာမှုတွေရှိရင် နှစ်ခု-အချက် (two-factor) repeated measures လို့ ခေါ်နိုင်ပါတယ်။
  • Factorial Experiment
    • Factorial experiment မှာဆိုရင် အချက် (factors) တစ်ခုထက်ပိုပြီး လေ့လာနိုင်ရုံသာမက အချက်တွေကြားက အပြန်အလှန်သက်ရောက်မှု (interaction) ကိုပါ လေ့လာနိုင်ပါတယ်။
    • Interaction (အပြန်အလှန်သက်ရောက်မှု) သဘောတရား: ဥပမာ၊ ဆေးပမာဏအမျိုးမျိုးနဲ့ အသက်အုပ်စု (လူငယ်/လူကြီး) နှစ်မျိုးရဲ့ တုံ့ပြန်မှုအချိန်အပေါ် သက်ရောက်မှုကို လေ့လာတဲ့အခါ၊ ဆေးပမာဏတစ်ခုရဲ့ အသက်အုပ်စုတစ်ခုစီအပေါ် သက်ရောက်မှုက မတူညီဘူးဆိုရင် ဒါကို interaction လို့ခေါ်ပါတယ်။
    • မော်ဒယ်: Two-factor completely randomized fixed-effects factorial model ကို ဒီလိုရေးနိုင်ပါတယ်: xijk = μ + αj + βk + (αβ)jk + eijk ဒီနေရာမှာ αj က Factor A ရဲ့ main effectβk က Factor B ရဲ့ main effect(αβ)jk ကတော့ Factor A နဲ့ Factor B တို့ကြားက interaction effect ကို ကိုယ်စားပြုပါတယ်။ eijk ကတော့ error component ပါ။
    • ယူဆချက်များ: Completely randomized design မှာလိုပဲ လွတ်လပ်ပြီး ကျပန်းနမူနာ၊ ပုံမှန်ပျံ့နှံ့မှု၊ တူညီသော variance များ စသည်တို့ကို ယူဆပါတယ်။
    • ယူဆချက်များ (Hypotheses): Factorial experiment မှာ ယူဆချက် (၃) ခုကို စမ်းသပ်နိုင်ပါတယ်:
      • Factor A main effect မရှိဘူး။
      • Factor B main effect မရှိဘူး။
      • Interaction effect မရှိဘူး။
    • ANOVA Table: တွက်ချက်မှုရလဒ်တွေကို Table 8.5.4 ကဲ့သို့သော ANOVA ဇယားမှာ ဖော်ပြပါတယ်။

ကွန်ပျူတာ အသုံးပြုခြင်း

ANOVA မှာ လိုအပ်တဲ့ တွက်ချက်မှုတွေဟာ ရှုပ်ထွေးပြီး ရှည်လျားပါတယ်။ ဒါကြောင့် ကွန်ပျူတာ (statistical software packages) တွေဟာ ANOVA ခွဲခြမ်းစိတ်ဖြာမှုမှာ အရေးပါတဲ့ အခန်းကဏ္ဍကနေ ပါဝင်ပါတယ်။ ဒီအခန်းမှာ ဖော်ပြထားတဲ့ လေ့ကျင့်ခန်းအားလုံးကို ကွန်ပျူတာနဲ့ ဖြေရှင်းနိုင်ပါတယ်။

Overall, Chapter 8 ဟာ စာရင်းအင်းပညာရှင်တွေ ကျယ်ကျယ်ပြန့်ပြန့် အသုံးပြုကြတဲ့ analysis of variance ဆိုတဲ့ အသုံးဝင်တဲ့ ခွဲခြမ်းစိတ်ဖြာမှု ကိရိယာကို နားလည်စေဖို့ အခြေခံအချက်အလက်တွေကို ပေးထားပါတယ်။ ဒေတာတွေထဲက စုစုပေါင်းပြောင်းလဲမှုကို အမျိုးမျိုးသော ပြောင်းလဲမှုရင်းမြစ်တွေအဖြစ် ဘယ်လိုပိုင်းခြားလဲဆိုတာကို သင်ယူရမှာဖြစ်ပြီး၊ အဲဒီနောက်မှာ ပျမ်းမျှတွေနဲ့ ပျံ့နှံ့မှုတွေအကြောင်း ယူဆချက်တွေကို ဘယ်လို စမ်းသပ်ရမယ်ဆိုတာကိုပါ လေ့လာရမှာဖြစ်ပါတယ်။


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Related Post

Descriptive StatisticsDescriptive Statistics

ဖော်ပြချက်ဆိုင်ရာ စာရင်းအင်းပညာ (Descriptive Statistics) နိဒါန်း ကျွန်တော်တို့ဟာ သတင်းအချက်အလက်ခေတ်မှာ နေထိုင်ကြရပြီး၊ ကျန်းမာရေးသိပ္ပံနယ်ပယ်မှာဆိုရင် အချက်အလက် (data) ပုံစံနဲ့ ရောက်ရှိလာတဲ့ ကိန်းဂဏာန်းအချက်အလက်တွေဟာ အလွန်များပြား ရှုပ်ထွေးနိုင်ပါတယ်။ ဒီအချက်အလက်တွေထဲကနေ ဘယ်လို အဓိပ္ပာယ်ရှိတဲ့ သတင်းအချက်အလက် တွေကို ထုတ်ယူမလဲ၊ ဘယ်လို နားလည်အောင် စုစည်းဖော်ပြမလဲဆိုတာက အရေးကြီးတဲ့ အလုပ်ဖြစ်ပါတယ်။ ဖော်ပြချက်ဆိုင်ရာ စာရင်းအင်းပညာ (Descriptive

eHealth (Lili model)eHealth (Lili model)

#Ehealth#Lily_Modelမနေ့က 5Cs model ကိုရေးပြခဲ့ပြီးပါပြီဒီနေ့ပြောပြချင်တာက နာမည်ကြီး Lily Model ဖြစ်ပါတယ်။ ehealthရဲ့ ကနဦးခေါင်းဆောင်တွေထဲက တစ်ဦးအပါအဝင်ဖြစ်တဲ့ Norman က ehealth ဆိုတာ ဘာလဲလို့ရှင်းပြတဲ့အခါမှာ Lily model ကို အသုံးပြုခဲ့ပါတယ်။အဲ့ဒီ Lily Model မှာ အဓိက ပွင့်ချပ်ခြောက်ခု သို့မဟုတ် essential components ခြောက်ခုပါဝင်ပါတယ်။အဲ့ဒါတွေကတော့၁။ traditional

Qualitative Research တစ်ခု ဘယ်လိုရေးသားကြမလဲQualitative Research တစ်ခု ဘယ်လိုရေးသားကြမလဲ

Qualitative Research (အရည်အသွေးအခြေပြု သုတေသန) ဆိုတာ ကိန်းဂဏန်းတွေထက် လူတွေရဲ့ အတွေ့အကြုံ၊ ခံစားချက်နဲ့ အပြုအမူတွေနောက်ကွယ်က “ဘာကြောင့် (Why)” နဲ့ “ဘယ်လို (How)” ဆိုတဲ့ အနက်အဓိပ္ပာယ်တွေကို ဖော်ထုတ်ရတာ ဖြစ်ပါတယ်။အဆင့် (၁) – Research Questions ကို သတ်မှတ်ခြင်းပထမဆုံးအနေနဲ့  ဘာကို သိချင်တာလဲဆိုတာကို တိတိကျကျ သတ်မှတ်ရပါမယ်။ Qualitative