Hypothesis ယူဆချက်ဆိုတာ ဘာလဲ?
“ယူဆချက်” (Hypothesis) ဆိုတာကို ရိုးရိုးရှင်းရှင်း ပြောရရင် ဒေတာတွေနဲ့ စမ်းသပ်ကြည့်လို့ရတဲ့ ခန့်မှန်းချက်တစ်ခုပါပဲ။ ဥပမာ၊ မင်းတစ်ခုခုကို ယူဆထားတယ်၊ အဲဒါကို ဒေတာနဲ့ သက်သေပြပြီး မှန်၊ မမှန် ဆုံးဖြတ်တာပေါ့။ ဒါက လူတစ်စုလုံး (population) ရဲ့ သဘာဝတစ်ခုခုနဲ့ ပတ်သက်တဲ့ ခန့်မှန်းချက်ဖြစ်ပြီး နမူနာ (sample) နဲ့ တိုက်ဆိုင်စစ်ဆေးတာမဟုတ်ပါဘူး။
စာရင်းအင်းပညာမှာ ဒီယူဆချက်ကို စမ်းသပ်ဖို့ နည်းလမ်းတစ်ခုရှိပါတယ်၊ အဲဒါကို ယူဆချက်စမ်းသပ်ခြင်း (Hypothesis Testing) လို့ခေါ်ပါတယ်။ ဒေတာက မင်းယူဆထားတာကို ပယ်ချဖို့ လုံလောက်တဲ့ သက်သေပေးနိုင်လား၊ မပေးနိုင်ဘူးလား ဆိုတာကို ဆုံးဖြတ်တာပေါ့။
နော်လ်ယူဆချက် (H₀) နဲ့ အခြားရွေးချယ်စရာ ယူဆချက် (H₁/Hₐ)
ဒီစမ်းသပ်မှုမှာ ယူဆချက်နှစ်မျိုးရှိတယ်၊ နော်လ်ယူဆချက် (Null Hypothesis) နဲ့ အခြားရွေးချယ်စရာ ယူဆချက် (Alternative Hypothesis)။
နော်လ်ယူဆချက် (H₀): ဒါက ပုံမှန်အနေနဲ့ ယူဆထားတဲ့ အခြေအနေပဲ။ ဥပမာ၊ “ဘာမှ ထူးခြားမှုမရှိဘူး” လို့ ဆိုတာမျိုး။ ဒါကို မမှန်ဘူးလို့ သက်သေမပြမချင်း မှန်တယ်လို့ ယူဆထားရတယ်။
ဥပမာ: ကျောင်းသား ၄ ယောက် စာမေးပွဲမှာ အမှတ်တူရတာ မတော်တဆပဲ ဖြစ်နိုင်တယ်။
ဒါမှမဟုတ်: စက်ရုံကထုတ်တဲ့ ကုန်ပစ္စည်းတွေရဲ့ ပျမ်းမျှအလေးချိန်က 80 mg ပဲ (H₀ = 80 mg)။
အခြားရွေးချယ်စရာ ယူဆချက် (H₁/Hₐ): ဒါက နော်လ်ယူဆချက်ရဲ့ ဆန့်ကျင်ဘက်ပဲ။ နော်လ်က မမှန်ဘူးလို့ သက်သေပြလိုက်ရင် ဒီဟာက မှန်တယ်လို့ ဆိုလိုတာပေါ့။ ဒါက တစ်ဖက်သတ် (တစ်ဖက်လှည့်) ဒါမှမဟုတ် နှစ်ဖက်စလုံး (နှစ်ဖက်လှည့်) ဖြစ်နိုင်တယ်။
ဥပမာ: ကျောင်းသား ၄ ယောက် အမှတ်တူရတာမှာ တစ်ခုခုအကြောင်းရင်းရှိတယ်။
ဒါမှမဟုတ်: စက်ရုံက ကုန်ပစ္စည်းတွေရဲ့ ပျမ်းမျှအလေးချိန်က 80 mg နဲ့ မတူဘူး (Hₐ ≠ 80 mg)။
ယူဆချက်စမ်းသပ်ဖို့ ဘယ်လိုလုပ်မလဲ?
ဒီစမ်းသပ်မှုကို လုပ်တဲ့အခါ အဆင့်တွေရှိပါတယ်။ ရိုးရိုးရှင်းရှင်း ပြောရရင်:
ဘယ်လိုယူဆချက်ကို စမ်းသပ်မလဲ အရင်သတ်မှတ်ရပါ မယ်။
ဘယ်လိုကိန်းဂဏန်းနည်းနဲ့ စမ်းသပ်မလဲ၊ ဘယ်ကိန်းဂဏန်းကို သုံးမလဲ (test statistic) ဆိုတာ ရွေးရပါ မယ်။
နော်လ်ယူဆချက်အောက်မှာ ဒီကိန်းဂဏန်းရဲ့ ဖြန့်ဝေပုံ (distribution) ကို တွက်ရပါမယ်။
“အရေးပါမှုအဆင့်” (significance level, α) ဆိုတာကို ရွေးရမယ်။ ဒါက မှားယွင်းတဲ့ အဖြေထွက်နိုင်တဲ့ ဖြစ်နိုင်ခြေ (false positive) ကို ဆိုလိုတာ။ ပုံမှန်အားဖြင့် 5% (0.05) ဒါမှမဟုတ် 1% (0.01) ကို သုံးပါတယ်။
ဒေတာကနေ test statistic ရဲ့ တန်ဖိုးကို တွက်ရပါမယ်။
နောက်ဆုံး၊ နော်လ်ယူဆချက်ကို ပယ်ချမလား၊ လက်ခံမလား ဆုံးဖြတ်ရပါမယ်။
P-တန်ဖိုး ဆိုတာဘာလဲ?
P-တန်ဖိုး (P-value) ဆိုတာ နော်လ်ယူဆချက်ကို မှန်တယ်လို့ ယူဆရင်၊ မင်းရထားတဲ့ ဒေတာရလဒ်ထက် ပိုပြီး ပြင်းထန်တဲ့ ရလဒ်တစ်ခုရဖို့ ဖြစ်နိုင်ခြေကို ပြောတာပါပဲ။
P-တန်ဖိုး နည်းရင် အခြားရွေးချယ်စရာ ယူဆချက်ကို ထောက်ခံတဲ့ သက်သေ ပိုခိုင်လာတယ်။
ပုံမှန်အားဖြင့် P-တန်ဖိုးက 0.05 ဒါမှမဟုတ် ဒီထက်နည်းရင် “ကိန်းဂဏန်းအရ သိသာတယ်” (statistically significant) လို့ယူဆပြီး နော်လ်ယူဆချက်ကို ပယ်ချတယ်။
ဒါပေမယ့် သတိထားရမယ်! P-တန်ဖိုးက နော်လ်ယူဆချက်မှန်နိုင်ခြေ၊ ဒါမှမဟုတ် အခြားယူဆချက်မှန်နိုင်ခြေကို တိုက်ရိုက်မပြောပါဘူး။
ဘယ်လိုအမှားတွေ ဖြစ်နိုင်လဲ?
ဒီလိုစမ်းသပ်တဲ့အခါ အမှားတွေ ဖြစ်တတ်တယ်။ အဓိက အမှားနှစ်မျိုးရှိပါတယ်:
အမျိုးအစား I အမှား (Type I Error): နော်လ်ယူဆချက်က မှန်နေပေမယ့် မမှန်ဘူးလို့ ပယ်ချလိုက်တာ။ ဒါကို “မှားယွင်းတဲ့ အပေါင်းလက္ခဏာ” (false positive) လို့ခေါ်တယ်။ ဒီအမှားဖြစ်နိုင်ခြေကို အရေးပါမှုအဆင့် (α) နဲ့ သတ်မှတ်ထားတယ်။ ဥပမာ၊ α=0.05 ဆိုရင် 5% အမှားဖြစ်နိုင်တယ်။
အမျိုးအစား II အမှား (Type II Error): အခြားရွေးချယ်စရာ ယူဆချက်က မှန်နေပေမယ့် နော်လ်ယူဆချက်ကို မပယ်ချဘဲ ထားလိုက်တာ β । ဒါကို “မှားယွင်းတဲ့ အနှုတ်လက္ခဏာ” (false negative) လို့ခေါ်တယ်။
စွမ်းရည် (Power): ဒါက စမ်းသပ်မှုတစ်ခုရဲ့ အင်အားပဲ။ အခြားရွေးချယ်စရာ ယူဆချက်က မှန်တယ်ဆိုရင် နော်လ်ယူဆချက်ကို မှန်မှန်ကန်ကန် ပယ်ချနိုင်တဲ့ ဖြစ်နိုင်ခြေကို ဆိုလိုတယ် (1-β)။ ဥပမာ၊ β=0.20 ဆိုရင် power က 80% ပေါ့။
ဒီဟာက ဘာကြောင့် အရေးကြီးတာလဲ?
ယူဆချက်စမ်းသပ်တာက ဒေတာတွေကို ခွဲခြမ်းစိတ်ဖြာရာမှာ အရမ်းအသုံးဝင်တယ်။ သိပ္ပံနည်းကျ သီအိုရီမရှိရင်တောင် ဒေတာကနေ ကောက်ချက်တွေကို တရားဝင်ဆွဲထုတ်လို့ရတယ်။ ဒါကို နမူနာဒေတာကနေ လူတစ်စုလုံးရဲ့ သဘာဝကို ခန့်မှန်းဖို့ (inferential statistics) သုံးပါတယ်။
ဒါပေမယ့် သတိထားရမယ့်အချက်တွေလည်း ရှိပါတယ်:
နမူနာအရွယ်အစား: စမ်းသပ်မှုမလုပ်ခင် နမူနာအရွယ်အစားကို သေချာရွေးရမယ်။ နမူနာသေးလွန်းရင် ရလဒ်တွေက မတိကျဘဲ မဖြေရှင်းနိုင်တဲ့ အဖြေတွေ ထွက်လာနိုင်ပါတယ်।
ဝေဖန်မှုတွေ: ဒီစမ်းသပ်မှုကို လူတွေ နားလည်မှုလွဲတာ၊ အလွန်အကျွံသုံးတာ၊ မမှန်ကန်စွာ သုံးတာတွေ ရှိတတ်ပါတယ်။ နော်လ်ယူဆချက်ကို ပယ်ချလိုက်လို့ သုတေသနရဲ့ ယူဆချက်ကို အမြဲထောက်ခံတယ်လို့ မဆိုလိုပါဘူး။
ကိန်းဂဏန်းနဲ့ လက်တွေ့ဘဝ: ကိန်းဂဏန်းအရ သိသာတယ်ဆိုတာ လက်တွေ့မှာ သိသာတယ်လို့ မဆိုလိုပါဘူး။ ဥပမာ၊ P-တန်ဖိုး 0.04 နဲ့ 0.06 ဆိုရင် 0.04 က ကိန်းဂဏန်းအရ ပိုသိသာပေမယ့် လက်တွေ့အကျိုးသက်ရောက်မှုက သိပ်ကွာနိုင်ပါတယ်။
ဆက်စပ်မှုနဲ့ အကြောင်းရင်း: ဆက်စပ်မှု (correlation) ရှိတယ်ဆိုတာ အကြောင်းရင်း (causation) ရှိတယ်လို့ မဆိုလိုပါဘူး။
တရားရုံးနဲ့ နှိုင်းယှဉ်ကြည့်ရအောင်
ဒီယူဆချက်စမ်းသပ်တာကို တရားရုံးမှာ ရာဇဝတ်မှုစစ်ဆေးတာနဲ့ နှိုင်းယှဉ်လို့ရပါတယ်။
နော်လ်ယူဆချက် (H₀): “တရားခံက အပြစ်မရှိဘူး” လို့ ယူဆထားတာပဲ။ ဒါက ပုံမှန်ယူဆချက်။
အခြားရွေးချယ်စရာ ယူဆချက် (H₁): “တရားခံက အပြစ်ရှိတယ်” လို့ တရားလိုဘက်က သက်သေပြချင်တာပေါ့။
အမျိုးအစား I အမှား: အပြစ်မရှိတဲ့သူကို အပြစ်ပေးလိုက်တာ။ ဒါက မှားယွင်းတဲ့ အပေါင်းလက္ခဏာ (false positive) ပေါ့။ တရားရုံးက ဒီလိုမဖြစ်အောင် အရမ်းဂရုစိုက်တယ်။
အမျိုးအစား II အမှား: အပြစ်ရှိတဲ့သူကို လွှတ်ပေးလိုက်တာ�। ဒါက မှားယွင်းတဲ့ အနှုတ်လက္ခဏာ (false negative)။ Type I Error ကို ရှောင်ဖို့ ကြိုးစားရင် Type II Error ဖြစ်နိုင်ခြေ ပိုများလာနိုင်တယ်။
တရားရုံးမှာ တရားလိုဘက်က လုံလောက်တဲ့ သက်သေမပြမချင်း တရားခံကို အပြစ်မရှိဘူးလို့ ယူဆသလိုပဲ၊ ဒီစမ်းသပ်မှုမှာလည်း P-တန်ဖိုးက အရေးပါမှုအဆင့်ထက် နည်းမှသာ နော်လ်ယူဆချက်ကို ပယ်ချပြီး အခြားရွေးချယ်စရာ ယူဆချက်ကို လက်ခံတာပေါ့။
Discover more from naywinaung
Subscribe to get the latest posts sent to your email.