Biostatistics: A Foundation for Analysis in the Health Sciences စာအုပ်ရဲ့ Chapter 2, “ဖော်ပြစာရင်းအင်းပညာ (DESCRIPTIVE STATISTICS)” အကြောင်းကို အသေးစိတ် ဆွေးနွေးပေးပါမယ်။
ဒီအခန်းရဲ့ အဓိက ရည်ရွယ်ချက်ကတော့ အချက်အလက်တွေကို စနစ်တကျ စုစည်းဖို့နဲ့ အနှစ်ချုပ် ဖော်ပြဖို့ အတွက် လိုအပ်တဲ့ အခြေခံနည်းလမ်းတွေနဲ့ တိုင်းတာမှုတွေကို မိတ်ဆက်ပေးတာ ဖြစ်ပါတယ်။ အချက်အလက်တွေက များပြားရှုပ်ထွေးတတ်တာမို့ ရိုးရှင်းစွာ နားလည်နိုင်အောင် ဇယားတွေ၊ ဂရပ်ဖစ်တွေနဲ့ အခြေခံစာရင်းအင်းတွက်ချက်မှုတွေကို ဘယ်လိုအသုံးပြုရမယ်ဆိုတာ ဒီအခန်းမှာ သင်ကြားပေးပါတယ်။ ဒါမှသာ ကျန်းမာရေးသိပ္ပံပညာရှင်တွေအနေနဲ့ သူတို့ကြုံတွေ့ရမယ့် အချက်အလက်တွေကို ကောင်းကောင်းကိုင်တွယ်နိုင်မှာပါ။
Chapter 2 မှာ အဓိက ဆွေးနွေးထားတဲ့ အကြောင်းအရာတွေကို အောက်ပါအတိုင်း ခွဲခြားပြပါမယ်ရှင်:
၁။ အချက်အလက်များအား စုစည်းခြင်းနှင့် ပြသခြင်း (Organization and Display of Data)
အချက်အလက်တွေက များလာတဲ့အခါ နားလည်ရလွယ်ကူအောင် စနစ်တကျ စုစည်းဖို့ လိုအပ်ပါတယ်။
•အစဉ်လိုက် စီစဉ်ထားသော အစီအစဉ် (The Ordered Array):
◦ဒါက အချက်အလက်တွေကို အသေးဆုံးတန်ဖိုးကနေ အကြီးဆုံးတန်ဖိုးအထိ အစဉ်လိုက် စီစဉ်ထားတဲ့ စာရင်း ဖြစ်ပါတယ်။
◦အချက်အလက်အရေအတွက်များရင် ကွန်ပျူတာသုံးတာ အကောင်းဆုံးပါ။
•အုပ်စုဖွဲ့ထားသော အချက်အလက်များ- ကြိမ်နှုန်း ဖြန့်ဝေမှု (Grouped Data: The Frequency Distribution):
◦အချက်အလက်တွေကို သတ်မှတ်ထားတဲ့ အုပ်စု (class intervals) တွေအဖြစ် ခွဲပြီး အဲဒီအုပ်စုတစ်ခုစီမှာ ပါဝင်တဲ့ အချက်အလက်အရေအတွက်ကို ကြိမ်နှုန်း (frequency) အဖြစ် ဖော်ပြတာပါ။
◦ဆက်စပ် ကြိမ်နှုန်း (Relative Frequency): အုပ်စုတစ်ခုချင်းစီရဲ့ ကြိမ်နှုန်းကို စုစုပေါင်း အချက်အလက်အရေအတွက်နဲ့ စားပြီး ရာခိုင်နှုန်း ဒါမှမဟုတ် အချိုးနဲ့ ဖော်ပြတာပါ။
◦စုစည်း ကြိမ်နှုန်း (Cumulative Frequency): အုပ်စုတစ်ခုအထိ စုဆောင်းထားတဲ့ ကြိမ်နှုန်းတွေရဲ့ ပေါင်းလဒ်ပါ။
◦စုစည်း ဆက်စပ် ကြိမ်နှုန်း (Cumulative Relative Frequency): အုပ်စုတစ်ခုအထိ စုဆောင်းထားတဲ့ ဆက်စပ်ကြိမ်နှုန်းတွေရဲ့ ပေါင်းလဒ်ပါ။
•ဂရပ်ဖစ်ဖြင့် ပြသမှုများ (Graphical Displays):
◦လှိုင်းပုံးပုံ (Histogram): ကြိမ်နှုန်းဖြန့်ဝေမှုကို ဘား (bar) ပုံစံနဲ့ ပြသတာပါ။
◦ကြိမ်နှုန်း ဂဏန်းပေါင်း (Frequency Polygon): အုပ်စုတစ်ခုချင်းစီရဲ့ အလယ်မှတ်တွေကို အစက်ချပြီး လိုင်းတွေနဲ့ ဆက်သွယ်ဖော်ပြတဲ့ ဂရပ်ပါ။
◦ပင်စည်-ရွက် ပြသမှု (Stem-and-Leaf Display): အချက်အလက်တွေကို ပင်စည် (stem) နဲ့ အရွက် (leaf) အဖြစ် ခွဲပြီး ပြသတာပါ။ ဒါက အချက်အလက်ဖြန့်ဝေပုံကို အမြန်ကြည့်ရှုနိုင်ပြီး မူရင်းတန်ဖိုးတွေကိုလည်း မြင်နိုင်စေပါတယ်။
၂။ အချက်အလက်များအား အနှစ်ချုပ်ဖော်ပြခြင်း- ဖော်ပြစာရင်းအင်း တိုင်းတာမှုများ (Summarizing Data: Descriptive Measures)
အချက်အလက်အများကြီးကို နားလည်လွယ်အောင် နည်းနည်းပဲကျန်အောင် အနှစ်ချုပ်ဖို့အတွက် ဒီတိုင်းတာမှုတွေကို အသုံးပြုပါတယ်။
•ဗဟိုပြု တိမ်းညွတ်မှု တိုင်းတာမှုများ (Measures of Central Tendency):
◦ဒါတွေက အချက်အလက်အစုံတစ်ခုလုံးကို ကိုယ်စားပြုနိုင်တဲ့ ပျမ်းမျှတန်ဖိုး (average value) ကို ဖော်ပြပါတယ်။
◦ပျမ်းမျှ (Mean): အချက်အလက်အားလုံးရဲ့ ပေါင်းလဒ်ကို အချက်အလက်အရေအတွက်နဲ့ စားတာပါ။ (Population Mean: $\mu$, Sample Mean: $\bar{x}$).
◦အလယ်လတ်တန်ဖိုး (Median): အချက်အလက်တွေကို အစဉ်လိုက် စီစဉ်ပြီးတဲ့အခါ အလယ်မှာရှိတဲ့ တန်ဖိုးပါ။
◦အများဆုံးဖြစ်သော တန်ဖိုး (Mode): အချက်အလက်တွေထဲမှာ အကြိမ်ရေအများဆုံး ထပ်ခါတလဲလဲ ပေါ်လာတဲ့ တန်ဖိုးပါ။
•ပြန့်နှံ့မှု တိုင်းတာမှုများ (Measures of Dispersion):
◦ဒါတွေက အချက်အလက်တွေ ဘယ်လောက်အထိ ပျံ့နှံ့နေလဲ (spread out) ဒါမှမဟုတ် ကွဲပြားနေလဲ (variability) ဆိုတာကို ဖော်ပြပါတယ်။
◦အတိုင်းအတာ (Range): အချက်အလက်အစုံထဲက အကြီးဆုံးတန်ဖိုးနဲ့ အသေးဆုံးတန်ဖိုးကြားက ခြားနားချက်ပါ။
◦ပြန့်နှံ့မှု (Variance): အချက်အလက်တွေက ပျမ်းမျှတန်ဖိုးနဲ့ ဘယ်လောက် ကွာဝေးနေလဲဆိုတာကို ပြသတဲ့ ပျမ်းမျှ वर्गित انحراف (average squared deviation) ပါ။ (Sample Variance: $s^2$, Population Variance: $\sigma^2$). Sample variance တွက်ရာမှာ $n-1$ (degrees of freedom) နဲ့စားရတဲ့ အကြောင်းကိုလည်း ဖော်ပြထားပါတယ်။
◦စံသွေဖည်မှု (Standard Deviation): ပြန့်နှံ့မှု (variance) ရဲ့ square root ဖြစ်ပါတယ်။ ဒါက မူရင်းတိုင်းတာမှု ယူနစ်အတိုင်း ပြန်ဖြစ်သွားတာမို့ နားလည်ရပိုလွယ်ပါတယ်။
◦ပြောင်းလဲမှု ကိန်းသေ (Coefficient of Variation): တိုင်းတာမှုယူနစ် မတူညီတဲ့ အချက်အလက်အစုံနှစ်ခုရဲ့ ပြန့်နှံ့မှုကို နှိုင်းယှဉ်ရာမှာ အသုံးပြုပါတယ်။
•အခြား ဆက်စပ်အယူအဆများ:
◦မညီမျှခြင်း (Skewness): အချက်အလက်ဖြန့်ဝေပုံက ဘယ်ဘက်ကို ဒါမှမဟုတ် ညာဘက်ကို ဘယ်လောက် လှဲကျနေလဲ (asymmetry) ဆိုတာကို ဖော်ပြပါတယ်။
◦ကောက်ကြောင်းညီမျှခြင်း (Kurtosis): ဖြန့်ဝေပုံရဲ့ အမြင့်ဆုံးထိပ်ပိုင်း (peakedness) ဒါမှမဟုတ် အမြီးပိုင်း (tail-heaviness) ရဲ့ အနေအထားကို ဖော်ပြပါတယ်။
၃။ အခြေခံ ဝေါဟာရများ ပြန်လည်သုံးသပ်ခြင်း
•စာရင်းအင်းဂဏန်း (Statistic): နမူနာ (sample) အချက်အလက်တွေကနေ တွက်ချက်ရရှိတဲ့ ဖော်ပြချက်တစ်ခုပါ။
•တိုင်းတာချက် (Parameter): လူဦးရေ (population) အချက်အလက်တွေကနေ တွက်ချက်ရရှိတဲ့ ဖော်ပြချက်တစ်ခုပါ။
၄။ ကွန်ပျူတာ၏ အခန်းကဏ္ဍ (Role of Computers)
အချက်အလက်အများကြီးကို စာရင်းအင်းတိုင်းတာမှုတွေ တွက်ချက်ဖို့နဲ့ ဖြန့်ဝေမှုဇယားတွေ၊ ဂရပ်ဖစ်တွေ ဆွဲဖို့အတွက် ကွန်ပျူတာဆော့ဖ်ဝဲလ်တွေ (ဥပမာ- MINITAB, SPSS, SAS®) ကို အသုံးပြုတာက အလွန်အရေးကြီးကြောင်း ဒီအခန်းမှာ အလေးပေးဖော်ပြထားပါတယ်။
ခြုံပြောရရင်တော့ Chapter 2 ဟာ အချက်အလက်တွေကို စုစည်းပုံ၊ အနှစ်ချုပ်ဖော်ပြပုံနဲ့ သူတို့ရဲ့ ဗဟိုပြု တိမ်းညွတ်မှုနဲ့ ပြန့်နှံ့မှုကို ဘယ်လိုတိုင်းတာမလဲ ဆိုတာကို အခြေခံကျကျ သင်ကြားပေးတဲ့ အခန်းတစ်ခန်း ဖြစ်ပါတယ်။ ဒီအခြေခံအုတ်မြစ်တွေက နောက်အခန်းတွေမှာ လေ့လာရမယ့် စာရင်းအင်းအနုမာန (statistical inference) အတွက် အလွန်အရေးကြီးပါတယ်။