Z score

Z-score
Z-score ဆိုတာဟာ ကျွန်တော်တို့မှာရှိတဲ့ အချက်အလက် (data point) တစ်ခုက သူ့ရဲ့ ပျမ်းမျှ (mean) ကနေ ဘယ်လောက် အကွာအဝေးမှာ ရှိနေလဲဆိုတာကို စံသွေဖည်မှု (standard deviation) ရဲ့ အရေအတွက်နဲ့ တိုင်းတာဖော်ပြပေးတဲ့ တန်ဖိုးတစ်ခု ဖြစ်ပါတယ်။ တစ်နည်းအားဖြင့် ပြောရရင်၊ အချက်အလက်တစ်ခုရဲ့ “စံပြုနေရာ” (standardized position) ကို ပြောပြတာလို့လည်း ဆိုနိုင်ပါတယ်။

Z-score ကို ဘာကြောင့် အသုံးပြုကြသလဲ

Z-score ရဲ့ အဓိက အသုံးဝင်ပုံကတော့ မတူညီတဲ့ အတိုင်းအတာတွေ (different scales) နဲ့ တိုင်းတာထားတဲ့ အချက်အလက်တွေကို အဓိပ္ပါယ်ရှိရှိ နှိုင်းယှဉ်နိုင်ဖို့အတွက် ပါ။
ဥပမာ- ကျောင်းသားတစ်ယောက်က သင်္ချာမှာ ၈၀ မှတ်ရပြီး မြန်မာစာမှာ ၇၀ မှတ်ရတယ်ဆိုပါစို့။ ဘယ်ဘာသာမှာ ပိုတော်လဲဆိုတာကို တိုက်ရိုက်ပြောဖို့ ခက်ပါတယ်၊ ဘာလို့လဲဆိုတော့ သင်္ချာပျမ်းမျှနဲ့ မြန်မာစာပျမ်းမျှ၊ စံသွေဖည်မှုတွေက မတူနိုင်လို့ပါ။ ဒီလိုအချိန်မှာ Z-score ကို အသုံးပြုပြီး သူရတဲ့ အမှတ်က သူ့ဘာသာရပ်ရဲ့ ပျမ်းမျှထက် စံသွေဖည်မှု ဘယ်နှစ်ခု ပိုနေလဲ (သို့) နည်းနေလဲ ဆိုတာကို တွက်ချက်လိုက်ရင် ဘယ်ဘာသာမှာ သူက ပိုထူးချွန်လဲဆိုတာကို ရှင်းရှင်းလင်းလင်း သိနိုင်ပါတယ်။ Z-score တွေဟာ စာရင်းအင်းနည်းအရ ကောက်ချက်ဆွဲခြင်း (statistical inference) အတွက် အလွန်အရေးကြီးတဲ့ ကိရိယာတွေထဲက တစ်ခုပါ။

Z-score တွက်ချက်နည်း

Z-score ကို တွက်ချက်ဖို့အတွက် အခြေခံအားဖြင့် အောက်ပါ formula တွေကို အသုံးပြုပါတယ်:
• အချက်အလက်တစ်ခုချင်းစီကို နှိုင်းယှဉ်လိုသည့်အခါ: [z=\frac{X-\mu}{\sigma} \label{6} ]
    ◦ X = ကျွန်တော်တို့ စိတ်ဝင်စားတဲ့ တိုင်းတာထားတဲ့ တန်ဖိုး (Experimental Value)
    ◦ μ = အချက်အလက်တွေရဲ့ ပျမ်းမျှ (Mean)
    ◦ σ = စံသွေဖည်မှု (Standard Deviation) (Standard Deviation ဆိုတာက အချက်အလက်တွေဟာ ပျမ်းမျှကနေ ဘယ်လောက် ပျံ့နှံ့နေလဲဆိုတာကို ပြပါတယ်)
• လူဦးရေစု (population) အကြောင်း ကောက်ချက်ဆွဲလိုသည့်အခါ (Inferential Statistics) :
    ◦ နမူနာအရေအတွက် (sample size) ကိုပါ ထည့်သွင်းစဉ်းစားရပါတယ်: [z_{o b s}=\frac{X-\mu}{\frac{\sigma}{\sqrt{n}}} \label{7} ]
    ◦ ဒီမှာ n က နမူနာအရေအတွက် (Sample Number) ပါ။

Z-score အသုံးပြုရန် လိုအပ်ချက်များ

Z-score တွေကို အသုံးပြုတဲ့အခါ သတိထားရမယ့် အချက်အချို့ ရှိပါတယ်:
• အချက်အလက်အရေအတွက်များပြားဖို့ (large amount of data) လိုအပ်ပါတယ်။
• အချက်အလက်တွေက လွတ်လပ်ပြီး ကျပန်း (independent, random) ဖြစ်ဖို့ လိုအပ်ပါတယ်။
• အချက်အလက်တွေရဲ့ ပျံ့နှံ့မှု (sampling distribution) ဟာ Normal Distribution (ပုံမှန်ပျံ့နှံ့မှု) ဖြစ်နေတယ်လို့ ယူဆနိုင်မှ Z-score က အဓိပ္ပါယ်ရှိပါတယ်။ (Central Limit Theorem အရ နမူနာအရေအတွက်များလာရင် sampling distribution က normal distribution ကို ချဉ်းကပ်လာပါတယ်)။

Z-score နှင့် P-value တို့၏ ဆက်စပ်မှု

Z-score ဟာ p-value ကို တွက်ချက်ရာမှာ အလွန်အရေးပါတဲ့ အခန်းကဏ္ဍကနေ ပါဝင်ပါတယ်။
• Z-score ကို တွက်ချက်ပြီးတဲ့နောက်မှာ Standard Normal Table (စံပုံမှန်ဇယား) ကို အသုံးပြုပြီး သက်ဆိုင်ရာ p-value ကို ရှာဖွေနိုင်ပါတယ်။
• ဒီ p-value က ကျွန်တော်တို့ရဲ့ “null hypothesis” (သုညအဆို) (ဥပမာ- အုပ်စုတွေကြားမှာ ကွာခြားမှုမရှိဘူးဆိုတဲ့ အယူအဆ) မှန်နေတယ်ဆိုရင်၊ ကျွန်တော်တို့ လေ့လာတွေ့ရှိထားတဲ့ ရလဒ်မျိုး (သို့မဟုတ် ပိုဆိုးတဲ့ ရလဒ်မျိုး) ရရှိဖို့ ဘယ်လောက်ဖြစ်နိုင်ခြေရှိလဲဆိုတာကို ပြောပြတဲ့ တန်ဖိုးပါ။
• အကယ်၍ p-value ဟာ 0.05 (သို့မဟုတ် ကြိုတင်သတ်မှတ်ထားတဲ့ significance level) ထက်နည်းရင်၊ ရလဒ်က စာရင်းအင်းအရ သိသာထင်ရှားပါတယ် (statistically significant) လို့ ယူဆပြီး null hypothesis ကို ပယ်ချပါတယ်။ ဆိုလိုတာက အုပ်စုတွေကြားမှာ သိသာတဲ့ ကွာခြားမှု ရှိတယ်လို့ ကောက်ချက်ချနိုင်တာပေါ့။

လက်တွေ့ဥပမာ

“Headache-b-gone” ဆေးဝါးကုမ္ပဏီတစ်ခုမှာ ကလေးခေါင်းကိုက်ဆေးရဲ့ ပျမ်းမျှ acetaminophen အလေးချိန်က 80 mg ရှိသင့်တယ် လို့ စံသတ်မှတ်ထားပါတယ်။
• အရည်အသွေး ထိန်းချုပ်ရေး အင်ဂျင်နီယာတစ်ဦးက ကျပန်းနမူနာ ၅၀ ခု (n=50) ကို စစ်ဆေးကြည့်တဲ့အခါ ပျမ်းမျှအလေးချိန် 79.95 mg (X=79.95) ရှိပြီး စံသွေဖည်မှု 0.18 (σ=0.18) ရှိတာကို တွေ့ရပါတယ်။
• ဒီတော့ null hypothesis (Ho) က ဆေးပျမ်းမျှအလေးချိန်ဟာ 80 mg (Ho=80 mg) ဖြစ်ပါတယ်။
• alternative hypothesis (Ha) ကတော့ 80 mg ထက် နည်းပါတယ် (Ha < 80 mg)။
• Z-score ကို တွက်ချက်ကြည့်ရအောင်: [z_{o b s}=\frac{79.95-80}{\frac{.18}{\sqrt{50}}}=-1.96 \nonumber ]
    ◦ ဒီ z_obs တန်ဖိုး -1.96 ကို Standard Normal Table မှာ ကြည့်လိုက်တဲ့အခါ p-value 0.025 ကို ရပါတယ်။
• သတ်မှတ်ထားတဲ့ significance level (α) က 0.05 ဖြစ်တဲ့အတွက်၊ ရရှိတဲ့ p-value (0.025) ဟာ significance level (0.05) ထက် နည်းပါးနေတာကို တွေ့ရပါတယ်။
• ဒါကြောင့် null hypothesis ကို ပယ်ချပြီး ဆေးရဲ့ပျမ်းမျှအလေးချိန်ဟာ စံချိန်မမီဘူး လို့ ကောက်ချက်ချနိုင်ပါတယ်။


Z-score ကို ရေငုပ်သမားတစ်ဦးရဲ့ ရေအနက်တိုင်းတာမှု နဲ့ တင်စားလို့ရပါတယ်။ ပင်လယ်ကြမ်းပြင်ကနေ ရေမျက်နှာပြင်ဆီကို ပြန်တက်လာတဲ့ ရေငုပ်သမားရဲ့ အနက်ကို တိုင်းတာတာလို့ မြင်ကြည့်ပါ။
• ရေမျက်နှာပြင် ဟာ ပျမ်းမျှ (mean) ပါ။
• ရေငုပ်ကြိုးပေါ်က အမှတ်အသားလေးတွေ ကတော့ စံသွေဖည်မှု (standard deviation) တွေပါ။
• Z-score ကတော့ ရေငုပ်သမားတစ်ဦးဟာ ရေမျက်နှာပြင် (ပျမ်းမျှ) ကနေ ရေငုပ်ကြိုးပေါ်က အမှတ်အသား ဘယ်နှစ်ခုအကွာမှာ ရှိနေလဲ ဆိုတာကို ပြောပြတာနဲ့ တူပါတယ်။
• Z-score (ဥပမာ +2) ဆိုရင် သူက ပျမ်းမျှအထက်မှာ စံသွေဖည်မှု ၂ ခု အကွာမှာ ရှိနေတာကို ပြသပြီး၊ Z-score (ဥပမာ -1.5) ဆိုရင် ပျမ်းမျှအောက်မှာ စံသွေဖည်မှု ၁.၅ ခု အကွာမှာ ရှိနေတာကို ပြသပါတယ်။ ဒါက ရေငုပ်သမားတစ်ဦးချင်းစီရဲ့ ရေအနက် (သို့) ရေမျက်နှာပြင်ကနေ တိကျတဲ့ ခြားနားမှု (relative position) ကို ရှင်းရှင်းလင်းလင်း သိစေပါတယ်။

နပေတိုး


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

Systematic Random SamplingSystematic Random Sampling

Systematic Random Sampling Systematic Random Sampling ဆိုတာ Population တစ်ခုလုံးကို စနစ်တကျနဲ့ ကျပန်းရွေးချယ်တဲ့ နည်းလမ်းတစ်ခုဖြစ်ပါတယ်။ Simple Random Sampling နဲ့မတူတာက ဒီနည်းလမ်းမှာ ပထမဦးဆုံး Sample ကို ကျပန်းရွေးချယ်ပြီး ကျန်တဲ့ Sample တွေကို ပုံသေ Interval (ကြားကာလ) တစ်ခုနဲ့ ရွေးချယ်သွားတာပါ။ Systematic

EstimationEstimation

Estimation Estimation ဆိုတာဟာ ကျွန်တော်တို့မှာရှိတဲ့ အချက်အလက် (data) နမူနာ (sample) တစ်ခုကို အခြေခံပြီး၊ အဲဒီအချက်အလက်တွေ ရယူထားတဲ့ ပိုကြီးတဲ့ အုပ်စု (population) တစ်ခုလုံးရဲ့ အားနည်းချက် (characteristics) တွေအကြောင်း ကောက်ချက်ဆွဲတာ ဒါမှမဟုတ် ခန့်မှန်းတာကို ဆိုလိုပါတယ်။ ဒီနည်းလမ်းဟာ စာရင်းအင်းပညာ (statistics) ရဲ့ အရေးကြီးတဲ့ အစိတ်အပိုင်းတစ်ခုဖြစ်ပြီး Inferential

QQ Plot ဆိုတာ ဘာလဲ?QQ Plot ဆိုတာ ဘာလဲ?

QQ plot ဆိုတာ ဒေတာ (အထူးသဖြင့် regression လုပ်ပြီးထွက်လာတဲ့ residual တွေ) က ပုံမှန်ဖြန့်ကျက်မှု (Normal Distribution) ရှိလား၊ မရှိဘူးလားဆိုတာကို မျက်စိနဲ့မြင်အောင် စစ်ဆေးတဲ့ နည်းလမ်းတစ်ခုဖြစ်ပါတယ်။ဘာလို့ ဒီကောင်ကို သုံးတာလဲ?linear regression လုပ်တယ်ဆိုတာ အိမ်တစ်လုံးရဲ့ အကျယ်အဝန်းကိုကြည့်ပြီး ဈေးနှုန်းခန့်မှန်းတာမျိုးပေါ့။ အဲဒီမှာ သင်္ချာနည်းကျ ယူဆချက်တစ်ခုက “ငါ့ရဲ့ ခန့်မှန်းချက်