မင်္ဂလာပါ! Chapter 8 ထဲက အချက်အလက်တွေကို အသေးစိတ် ရှင်းပြပေးပါမယ်။
ဒီအခန်းကြီး Chapter 8 က Analysis of Variance (ANOVA) လို့ခေါ်တဲ့ စာရင်းအင်းနည်းပညာအကြောင်းကို အဓိကထား ရှင်းပြထားပါတယ်။ နာမည်အတိုင်းပဲ၊ ဒီနည်းပညာဟာ ဒေတာအစုအဝေးတစ်ခုထဲမှာရှိတဲ့ စုစုပေါင်းပြောင်းလဲမှု (total variation) ကို အမျိုးမျိုးသော အစိတ်အပိုင်းတွေအဖြစ် ပိုင်းခြားပြီး ခွဲခြမ်းစိတ်ဖြာတဲ့ နည်းလမ်းဖြစ်ပါတယ်။ ဒီအစိတ်အပိုင်းတစ်ခုစီတိုင်းမှာတော့ သီးခြားပြောင်းလဲမှုရင်းမြစ် (source of variation) တစ်ခုစီ ရှိနေပါတယ်။ ဒီလို ပိုင်းခြားခွဲခြမ်းစိတ်ဖြာခြင်းအားဖြင့် လူဦးရေရဲ့ ပျံ့နှံ့မှု (variances) တွေနဲ့ ပျမ်းမျှ (means) တွေအကြောင်း ကောက်ချက်ချဖို့၊ ယူဆချက်တွေ စမ်းသပ်ဖို့ အသုံးပြုနိုင်ပါတယ်။ ဒီအခန်းမှာတော့ ပျမ်းမျှတွေရဲ့ ကောက်ချက်ချခြင်း (hypothesis testing of means) ကို အဓိကထားပြီး ပြောပြထားပါတယ်။
Analysis of Variance (ANOVA) ဆိုတာဘာလဲ။
ANOVA ရဲ့ အဓိကရည်ရွယ်ချက်က ဒေတာတွေထဲမှာရှိတဲ့ စုစုပေါင်းပြောင်းလဲမှု (total variation) ကို အစိတ်အပိုင်းနှစ်ခု ဒါမှမဟုတ် နှစ်ခုထက်ပိုပြီး ပိုင်းခြားဖို့ပါပဲ။ ဒီလို ပိုင်းခြားခြင်းအားဖြင့် ပြောင်းလဲမှုရင်းမြစ်တစ်ခုစီရဲ့ စုစုပေါင်းပြောင်းလဲမှုအပေါ် ဘယ်လောက်အထိ အထောက်အကူပြုလဲဆိုတာကို သိရှိနိုင်ပါတယ်။
ဥပမာအားဖြင့်၊ ဆေးသုံးမျိုး A, B, C တို့ရဲ့ အာနိသင်ကို လေ့လာတဲ့အခါ၊ လူနာတွေရဲ့ တုံ့ပြန်မှုတိုင်းတာမှုတွေမှာ ကွဲပြားမှုတွေရှိတာကို တွေ့ရပါတယ်။ ဒီတိုင်းတာမှုတွေ ဘာလို့မတူညီရတာလဲဆိုတဲ့ အကြောင်းရင်းတွေထဲမှာ လူနာတွေရဲ့ မျိုးရိုးဗီဇကွာခြားမှုတွေ၊ အစားအသောက်ပုံစံ ကွာခြားမှုတွေ စသည်ဖြင့် ပါဝင်ပါတယ်။ ဒီပြောင်းလဲမှုတွေကို ခွဲခြမ်းစိတ်ဖြာခြင်းအားဖြင့် ဆေးသုံးမျိုးရဲ့ အာနိသင် တူညီမှုရှိမရှိ ကောက်ချက်ချနိုင်မှာဖြစ်ပါတယ်။
ယူဆချက် စမ်းသပ်ခြင်း (Hypothesis Testing) အဆင့်များ
ANOVA မှာ ယူဆချက် စမ်းသပ်ခြင်း (hypothesis testing) ကို အဆင့် ၁၀ ဆင့်နဲ့ လုပ်ဆောင်ပါတယ်:
- ဒေတာဖော်ပြချက် (Description of data)
- ယူဆချက်များ (Assumptions) – ဒီဇိုင်းတစ်ခုချင်းစီအတွက် မော်ဒယ်ကိုလည်း ဖော်ပြပါတယ်။
- ယူဆချက်များ (Hypotheses) – ဗလာ ယူဆချက် (null hypothesis) နှင့် အခြား ယူဆချက် (alternative hypothesis) ကို ဖော်ပြပါတယ်။
- စမ်းသပ်မှု ကိန်းဂဏန်း (Test statistic)
- စမ်းသပ်မှု ကိန်းဂဏန်း၏ ပျံ့နှံ့မှု (Distribution of test statistic)
- ဆုံးဖြတ်ချက်စည်းမျဉ်း (Decision rule)
- စမ်းသပ်မှု ကိန်းဂဏန်း တွက်ချက်ခြင်း (Calculation of test statistic) – တွက်ချက်မှုရလဒ်တွေကို Analysis of Variance (ANOVA) table လို့ခေါ်တဲ့ ဇယားတစ်ခုမှာ အကျဉ်းချုပ် ဖော်ပြပါတယ်။
- စာရင်းအင်း ဆုံးဖြတ်ချက် (Statistical decision)
- နိဂုံး (Conclusion)
- p-value သတ်မှတ်ခြင်း (Determination of p-value)
အဓိက စမ်းသပ်မှု ဒီဇိုင်းများ (Key Experimental Designs)
ဒီအခန်းမှာ အဓိက ဒီဇိုင်း (၂) ခုကို အသေးစိတ် ဆွေးနွေးထားပြီး၊ တခြားဒီဇိုင်းတွေကိုလည်း မိတ်ဆက်ပေးထားပါတယ်။
- Completely Randomized Design (One-Way ANOVA)
- ဒါကတော့ ANOVA ရဲ့ အရှင်းဆုံးပုံစံ ပါ။ t-test ကို နမူနာ (၂) ခုအတွက် အသုံးပြုနိုင်သလိုမျိုး၊ ဒီဒီဇိုင်းကိုတော့ နမူနာ (၃) ခု ဒါမှမဟုတ် ဒီထက်ပိုတဲ့ ပျမ်းမျှတွေကို ခြားနားမှုရှိမရှိ စမ်းသပ်ဖို့ အသုံးပြုနိုင်ပါတယ်။
- ဘယ်အချိန်မှာ သုံးသင့်လဲ။ စမ်းသပ်ယူနစ်တွေ (experimental units) က တူညီမှုရှိတယ် (homogeneous) လို့ယူဆတဲ့အခါမျိုးမှာ အသုံးပြုသင့်ပါတယ်။
- မော်ဒယ်: Completely randomized design အတွက် မော်ဒယ်ကို ဒီလိုရေးနိုင်ပါတယ်:
xij = μ + τj + eijဒီနေရာမှာxijဆိုတာကjလို့သတ်မှတ်ထားတဲ့ ကုသမှု (treatment) ကနေ ရလာတဲ့iခုမြောက် လေ့လာတွေ့ရှိချက်ကို ပြောတာပါ။μက စုစုပေါင်းလူဦးရေပျမ်းမျှ (population mean) ကို ကိုယ်စားပြုပြီးτjကတော့jကုသမှုရဲ့ သက်ရောက်မှု (treatment effect) ကို ဆိုလိုပါတယ်။eijကတော့ လေ့လာတွေ့ရှိရတဲ့ တန်ဖိုး (observed value) နဲ့ မော်ဒယ်ကနေ ခန့်မှန်းထားတဲ့ တန်ဖိုး (value predicted by the model) အကြား အမှားအယွင်း (error) ကို ကိုယ်စားပြုပါတယ်။ - ယူဆချက်များ (Assumptions):
kခုသော ဒေတာအစုအဝေးတွေဟာ သက်ဆိုင်ရာ လူဦးရေတွေကနေ လွတ်လပ်ပြီး ကျပန်းနမူနာ (independent random samples) များဖြစ်ရမယ်။kခုသော လူဦးရေတွေဟာ သာမန်ပျံ့နှံ့မှု (normally distributed) ရှိရမယ်။kခုသော လူဦးရေတွေရဲ့ ပြောင်းလဲမှု (variances) တွေဟာ အားလုံးတူညီရမယ် (equal)။
- ပြောင်းလဲမှု ပိုင်းခြားခြင်း (Partitioning of Variation):
- Total Sum of Squares (SST): စုစုပေါင်း ပြောင်းလဲမှု။
- Among-Group Sum of Squares (SSA): ကုသမှုအုပ်စုတွေကြားက ပြောင်းလဲမှု။
- Within-Group Sum of Squares (SSW): အုပ်စုတစ်ခုစီအတွင်းက ပြောင်းလဲမှု။
SST = SSA + SSWလို့ ပိုင်းခြားနိုင်ပါတယ်။
- F-test Statistic (V.R.): စမ်းသပ်မှု ကိန်းဂဏန်းဟာ V.R. (Variance Ratio) ဖြစ်ပြီး အောက်ပါအတိုင်း တွက်ချက်ပါတယ်:
V.R. = MSA / MSW(Mean Square Among / Mean Square Within) ဒီကိန်းဂဏန်းဟာ null hypothesis မှန်တဲ့အခါ F distribution ကို လိုက်နာပါတယ်။ - ANOVA Table: တွက်ချက်မှုရလဒ်တွေကို Table 8.2.2 ကဲ့သို့သော ANOVA ဇယားမှာ ဖော်ပြပါတယ်။
- Multiple Comparison Procedures: null hypothesis ကို ပယ်ချပြီးနောက်၊ ဘယ်ပျမ်းမျှတွေက အချင်းချင်း ခြားနားမှုရှိလဲဆိုတာကို ရှာဖွေဖို့ Tukey’s HSD test နဲ့ Bonferroni’s method လိုမျိုး နည်းလမ်းတွေကို အသုံးပြုနိုင်ပါတယ်။
- Randomized Complete Block Design
- ဒီဒီဇိုင်းရဲ့ ရည်ရွယ်ချက် က blocks (အုပ်စုခွဲခြင်း) ကြောင့် ဖြစ်ပေါ်လာတဲ့ ပြောင်းလဲမှုတွေကို ဖယ်ရှားပြီး error term ထဲက ပြောင်းလဲမှုတွေကို လျှော့ချဖို့ပါ။ ဒါမှ ကုသမှုပျမ်းမျှတွေဟာ block effect တွေကနေ ကင်းဝေးပြီး ပိုမိုတိကျတဲ့ ကောက်ချက်တွေ ချနိုင်မှာပါ။
- ဘယ်အချိန်မှာ သုံးသင့်လဲ။ စမ်းသပ်ယူနစ်တွေက တူညီမှုမရှိဘူး (not homogeneous) လို့ ယူဆတဲ့အခါ၊ ဒါပေမယ့် အုပ်စုငယ်လေးတွေအဖြစ် homogeneous blocks တွေ ဖန်တီးနိုင်တဲ့အခါမျိုးမှာ ဒီဒီဇိုင်းကို အသုံးပြုပါတယ်။
- မော်ဒယ်: Randomized complete block design အတွက် မော်ဒယ်ကို ဒီလိုရေးနိုင်ပါတယ်:
xij = μ + bi + τj + eijဒီနေရာမှာbiဆိုတာက block effect ကို ကိုယ်စားပြုပြီးτjကတော့ treatment effect ကို ကိုယ်စားပြုပါတယ်။ - ပြောင်းလဲမှု ပိုင်းခြားခြင်း: စုစုပေါင်းပြောင်းလဲမှုကို blocks (SSBl)၊ treatments (SSTr)၊ နဲ့ error (SSE) ဆိုတဲ့ အစိတ်အပိုင်း (၃) ခုအဖြစ် ပိုင်းခြားနိုင်ပါတယ်။
- ANOVA Table: တွက်ချက်မှုရလဒ်တွေကို Table 8.3.2 ကဲ့သို့သော ANOVA ဇယားမှာ ဖော်ပြပါတယ်။
- Repeated Measures Design
- ဒီဒီဇိုင်းက Randomized Complete Block Design နဲ့ အလွန်ဆင်တူပါတယ်။ ဒီနေရာမှာတော့ subjects (ဘာသာရပ်များ) တွေကို blocks အဖြစ် သတ်မှတ်ပါတယ်။ ဆိုလိုတာက၊ ဘာသာရပ်တစ်ခုစီကို ကုသမှုအားလုံး သို့မဟုတ် အခြေအနေအားလုံးကို အကြိမ်ကြိမ် တိုင်းတာတာမျိုးပါ။
- မော်ဒယ်: Randomized complete block design ရဲ့ မော်ဒယ်နဲ့ တူညီပါတယ်။
- နှစ်ခု-အချက် (Two-Factor) Repeated Measures: အကယ်၍ ကုသမှုအမျိုးအစားနှစ်မျိုး (treatment conditions) အောက်မှာ အချိန်အလိုက် တိုင်းတာမှုတွေရှိရင် နှစ်ခု-အချက် (two-factor) repeated measures လို့ ခေါ်နိုင်ပါတယ်။
- Factorial Experiment
- Factorial experiment မှာဆိုရင် အချက် (factors) တစ်ခုထက်ပိုပြီး လေ့လာနိုင်ရုံသာမက အချက်တွေကြားက အပြန်အလှန်သက်ရောက်မှု (interaction) ကိုပါ လေ့လာနိုင်ပါတယ်။
- Interaction (အပြန်အလှန်သက်ရောက်မှု) သဘောတရား: ဥပမာ၊ ဆေးပမာဏအမျိုးမျိုးနဲ့ အသက်အုပ်စု (လူငယ်/လူကြီး) နှစ်မျိုးရဲ့ တုံ့ပြန်မှုအချိန်အပေါ် သက်ရောက်မှုကို လေ့လာတဲ့အခါ၊ ဆေးပမာဏတစ်ခုရဲ့ အသက်အုပ်စုတစ်ခုစီအပေါ် သက်ရောက်မှုက မတူညီဘူးဆိုရင် ဒါကို interaction လို့ခေါ်ပါတယ်။
- မော်ဒယ်: Two-factor completely randomized fixed-effects factorial model ကို ဒီလိုရေးနိုင်ပါတယ်:
xijk = μ + αj + βk + (αβ)jk + eijkဒီနေရာမှာαjက Factor A ရဲ့ main effect၊βkက Factor B ရဲ့ main effect၊(αβ)jkကတော့ Factor A နဲ့ Factor B တို့ကြားက interaction effect ကို ကိုယ်စားပြုပါတယ်။eijkကတော့ error component ပါ။ - ယူဆချက်များ: Completely randomized design မှာလိုပဲ လွတ်လပ်ပြီး ကျပန်းနမူနာ၊ ပုံမှန်ပျံ့နှံ့မှု၊ တူညီသော variance များ စသည်တို့ကို ယူဆပါတယ်။
- ယူဆချက်များ (Hypotheses): Factorial experiment မှာ ယူဆချက် (၃) ခုကို စမ်းသပ်နိုင်ပါတယ်:
- Factor A main effect မရှိဘူး။
- Factor B main effect မရှိဘူး။
- Interaction effect မရှိဘူး။
- ANOVA Table: တွက်ချက်မှုရလဒ်တွေကို Table 8.5.4 ကဲ့သို့သော ANOVA ဇယားမှာ ဖော်ပြပါတယ်။
ကွန်ပျူတာ အသုံးပြုခြင်း
ANOVA မှာ လိုအပ်တဲ့ တွက်ချက်မှုတွေဟာ ရှုပ်ထွေးပြီး ရှည်လျားပါတယ်။ ဒါကြောင့် ကွန်ပျူတာ (statistical software packages) တွေဟာ ANOVA ခွဲခြမ်းစိတ်ဖြာမှုမှာ အရေးပါတဲ့ အခန်းကဏ္ဍကနေ ပါဝင်ပါတယ်။ ဒီအခန်းမှာ ဖော်ပြထားတဲ့ လေ့ကျင့်ခန်းအားလုံးကို ကွန်ပျူတာနဲ့ ဖြေရှင်းနိုင်ပါတယ်။
Overall, Chapter 8 ဟာ စာရင်းအင်းပညာရှင်တွေ ကျယ်ကျယ်ပြန့်ပြန့် အသုံးပြုကြတဲ့ analysis of variance ဆိုတဲ့ အသုံးဝင်တဲ့ ခွဲခြမ်းစိတ်ဖြာမှု ကိရိယာကို နားလည်စေဖို့ အခြေခံအချက်အလက်တွေကို ပေးထားပါတယ်။ ဒေတာတွေထဲက စုစုပေါင်းပြောင်းလဲမှုကို အမျိုးမျိုးသော ပြောင်းလဲမှုရင်းမြစ်တွေအဖြစ် ဘယ်လိုပိုင်းခြားလဲဆိုတာကို သင်ယူရမှာဖြစ်ပြီး၊ အဲဒီနောက်မှာ ပျမ်းမျှတွေနဲ့ ပျံ့နှံ့မှုတွေအကြောင်း ယူဆချက်တွေကို ဘယ်လို စမ်းသပ်ရမယ်ဆိုတာကိုပါ လေ့လာရမှာဖြစ်ပါတယ်။
Discover more from naywinaung
Subscribe to get the latest posts sent to your email.