Hypothesis ယူဆချက်ဆိုတာ ဘာလဲ?

Hypothesis ယူဆချက်ဆိုတာ ဘာလဲ?
“ယူဆချက်” (Hypothesis) ဆိုတာကို ရိုးရိုးရှင်းရှင်း ပြောရရင် ဒေတာတွေနဲ့ စမ်းသပ်ကြည့်လို့ရတဲ့ ခန့်မှန်းချက်တစ်ခုပါပဲ။ ဥပမာ၊ မင်းတစ်ခုခုကို ယူဆထားတယ်၊ အဲဒါကို ဒေတာနဲ့ သက်သေပြပြီး မှန်၊ မမှန် ဆုံးဖြတ်တာပေါ့။ ဒါက လူတစ်စုလုံး (population) ရဲ့ သဘာဝတစ်ခုခုနဲ့ ပတ်သက်တဲ့ ခန့်မှန်းချက်ဖြစ်ပြီး နမူနာ (sample) နဲ့ တိုက်ဆိုင်စစ်ဆေးတာမဟုတ်ပါဘူး။

စာရင်းအင်းပညာမှာ ဒီယူဆချက်ကို စမ်းသပ်ဖို့ နည်းလမ်းတစ်ခုရှိပါတယ်၊ အဲဒါကို ယူဆချက်စမ်းသပ်ခြင်း (Hypothesis Testing) လို့ခေါ်ပါတယ်။ ဒေတာက မင်းယူဆထားတာကို ပယ်ချဖို့ လုံလောက်တဲ့ သက်သေပေးနိုင်လား၊ မပေးနိုင်ဘူးလား ဆိုတာကို ဆုံးဖြတ်တာပေါ့။

နော်လ်ယူဆချက် (H₀) နဲ့ အခြားရွေးချယ်စရာ ယူဆချက် (H₁/Hₐ)
ဒီစမ်းသပ်မှုမှာ ယူဆချက်နှစ်မျိုးရှိတယ်၊ နော်လ်ယူဆချက် (Null Hypothesis) နဲ့ အခြားရွေးချယ်စရာ ယူဆချက် (Alternative Hypothesis)။

နော်လ်ယူဆချက် (H₀): ဒါက ပုံမှန်အနေနဲ့ ယူဆထားတဲ့ အခြေအနေပဲ။ ဥပမာ၊ “ဘာမှ ထူးခြားမှုမရှိဘူး” လို့ ဆိုတာမျိုး။ ဒါကို မမှန်ဘူးလို့ သက်သေမပြမချင်း မှန်တယ်လို့ ယူဆထားရတယ်။
ဥပမာ: ကျောင်းသား ၄ ယောက် စာမေးပွဲမှာ အမှတ်တူရတာ မတော်တဆပဲ ဖြစ်နိုင်တယ်။
ဒါမှမဟုတ်: စက်ရုံကထုတ်တဲ့ ကုန်ပစ္စည်းတွေရဲ့ ပျမ်းမျှအလေးချိန်က 80 mg ပဲ (H₀ = 80 mg)။

အခြားရွေးချယ်စရာ ယူဆချက် (H₁/Hₐ): ဒါက နော်လ်ယူဆချက်ရဲ့ ဆန့်ကျင်ဘက်ပဲ။ နော်လ်က မမှန်ဘူးလို့ သက်သေပြလိုက်ရင် ဒီဟာက မှန်တယ်လို့ ဆိုလိုတာပေါ့။ ဒါက တစ်ဖက်သတ် (တစ်ဖက်လှည့်) ဒါမှမဟုတ် နှစ်ဖက်စလုံး (နှစ်ဖက်လှည့်) ဖြစ်နိုင်တယ်။
ဥပမာ: ကျောင်းသား ၄ ယောက် အမှတ်တူရတာမှာ တစ်ခုခုအကြောင်းရင်းရှိတယ်။
ဒါမှမဟုတ်: စက်ရုံက ကုန်ပစ္စည်းတွေရဲ့ ပျမ်းမျှအလေးချိန်က 80 mg နဲ့ မတူဘူး (Hₐ ≠ 80 mg)။

ယူဆချက်စမ်းသပ်ဖို့ ဘယ်လိုလုပ်မလဲ?
ဒီစမ်းသပ်မှုကို လုပ်တဲ့အခါ အဆင့်တွေရှိပါတယ်။ ရိုးရိုးရှင်းရှင်း ပြောရရင်:
ဘယ်လိုယူဆချက်ကို စမ်းသပ်မလဲ အရင်သတ်မှတ်ရပါ မယ်။
ဘယ်လိုကိန်းဂဏန်းနည်းနဲ့ စမ်းသပ်မလဲ၊ ဘယ်ကိန်းဂဏန်းကို သုံးမလဲ (test statistic) ဆိုတာ ရွေးရပါ မယ်။
နော်လ်ယူဆချက်အောက်မှာ ဒီကိန်းဂဏန်းရဲ့ ဖြန့်ဝေပုံ (distribution) ကို တွက်ရပါမယ်။
“အရေးပါမှုအဆင့်” (significance level, α) ဆိုတာကို ရွေးရမယ်။ ဒါက မှားယွင်းတဲ့ အဖြေထွက်နိုင်တဲ့ ဖြစ်နိုင်ခြေ (false positive) ကို ဆိုလိုတာ။ ပုံမှန်အားဖြင့် 5% (0.05) ဒါမှမဟုတ် 1% (0.01) ကို သုံးပါတယ်။
ဒေတာကနေ test statistic ရဲ့ တန်ဖိုးကို တွက်ရပါမယ်။
နောက်ဆုံး၊ နော်လ်ယူဆချက်ကို ပယ်ချမလား၊ လက်ခံမလား ဆုံးဖြတ်ရပါမယ်။

P-တန်ဖိုး ဆိုတာဘာလဲ?
P-တန်ဖိုး (P-value) ဆိုတာ နော်လ်ယူဆချက်ကို မှန်တယ်လို့ ယူဆရင်၊ မင်းရထားတဲ့ ဒေတာရလဒ်ထက် ပိုပြီး ပြင်းထန်တဲ့ ရလဒ်တစ်ခုရဖို့ ဖြစ်နိုင်ခြေကို ပြောတာပါပဲ။
P-တန်ဖိုး နည်းရင် အခြားရွေးချယ်စရာ ယူဆချက်ကို ထောက်ခံတဲ့ သက်သေ ပိုခိုင်လာတယ်။
ပုံမှန်အားဖြင့် P-တန်ဖိုးက 0.05 ဒါမှမဟုတ် ဒီထက်နည်းရင် “ကိန်းဂဏန်းအရ သိသာတယ်” (statistically significant) လို့ယူဆပြီး နော်လ်ယူဆချက်ကို ပယ်ချတယ်။
ဒါပေမယ့် သတိထားရမယ်! P-တန်ဖိုးက နော်လ်ယူဆချက်မှန်နိုင်ခြေ၊ ဒါမှမဟုတ် အခြားယူဆချက်မှန်နိုင်ခြေကို တိုက်ရိုက်မပြောပါဘူး။

ဘယ်လိုအမှားတွေ ဖြစ်နိုင်လဲ?
ဒီလိုစမ်းသပ်တဲ့အခါ အမှားတွေ ဖြစ်တတ်တယ်။ အဓိက အမှားနှစ်မျိုးရှိပါတယ်:

အမျိုးအစား I အမှား (Type I Error): နော်လ်ယူဆချက်က မှန်နေပေမယ့် မမှန်ဘူးလို့ ပယ်ချလိုက်တာ။ ဒါကို “မှားယွင်းတဲ့ အပေါင်းလက္ခဏာ” (false positive) လို့ခေါ်တယ်။ ဒီအမှားဖြစ်နိုင်ခြေကို အရေးပါမှုအဆင့် (α) နဲ့ သတ်မှတ်ထားတယ်။ ဥပမာ၊ α=0.05 ဆိုရင် 5% အမှားဖြစ်နိုင်တယ်။

အမျိုးအစား II အမှား (Type II Error): အခြားရွေးချယ်စရာ ယူဆချက်က မှန်နေပေမယ့် နော်လ်ယူဆချက်ကို မပယ်ချဘဲ ထားလိုက်တာ β । ဒါကို “မှားယွင်းတဲ့ အနှုတ်လက္ခဏာ” (false negative) လို့ခေါ်တယ်။

စွမ်းရည် (Power): ဒါက စမ်းသပ်မှုတစ်ခုရဲ့ အင်အားပဲ။ အခြားရွေးချယ်စရာ ယူဆချက်က မှန်တယ်ဆိုရင် နော်လ်ယူဆချက်ကို မှန်မှန်ကန်ကန် ပယ်ချနိုင်တဲ့ ဖြစ်နိုင်ခြေကို ဆိုလိုတယ် (1-β)။ ဥပမာ၊ β=0.20 ဆိုရင် power က 80% ပေါ့။

ဒီဟာက ဘာကြောင့် အရေးကြီးတာလဲ?
ယူဆချက်စမ်းသပ်တာက ဒေတာတွေကို ခွဲခြမ်းစိတ်ဖြာရာမှာ အရမ်းအသုံးဝင်တယ်။ သိပ္ပံနည်းကျ သီအိုရီမရှိရင်တောင် ဒေတာကနေ ကောက်ချက်တွေကို တရားဝင်ဆွဲထုတ်လို့ရတယ်။ ဒါကို နမူနာဒေတာကနေ လူတစ်စုလုံးရဲ့ သဘာဝကို ခန့်မှန်းဖို့ (inferential statistics) သုံးပါတယ်။
ဒါပေမယ့် သတိထားရမယ့်အချက်တွေလည်း ရှိပါတယ်:

နမူနာအရွယ်အစား: စမ်းသပ်မှုမလုပ်ခင် နမူနာအရွယ်အစားကို သေချာရွေးရမယ်။ နမူနာသေးလွန်းရင် ရလဒ်တွေက မတိကျဘဲ မဖြေရှင်းနိုင်တဲ့ အဖြေတွေ ထွက်လာနိုင်ပါတယ်।

ဝေဖန်မှုတွေ: ဒီစမ်းသပ်မှုကို လူတွေ နားလည်မှုလွဲတာ၊ အလွန်အကျွံသုံးတာ၊ မမှန်ကန်စွာ သုံးတာတွေ ရှိတတ်ပါတယ်။ နော်လ်ယူဆချက်ကို ပယ်ချလိုက်လို့ သုတေသနရဲ့ ယူဆချက်ကို အမြဲထောက်ခံတယ်လို့ မဆိုလိုပါဘူး။

ကိန်းဂဏန်းနဲ့ လက်တွေ့ဘဝ: ကိန်းဂဏန်းအရ သိသာတယ်ဆိုတာ လက်တွေ့မှာ သိသာတယ်လို့ မဆိုလိုပါဘူး။ ဥပမာ၊ P-တန်ဖိုး 0.04 နဲ့ 0.06 ဆိုရင် 0.04 က ကိန်းဂဏန်းအရ ပိုသိသာပေမယ့် လက်တွေ့အကျိုးသက်ရောက်မှုက သိပ်ကွာနိုင်ပါတယ်။

ဆက်စပ်မှုနဲ့ အကြောင်းရင်း: ဆက်စပ်မှု (correlation) ရှိတယ်ဆိုတာ အကြောင်းရင်း (causation) ရှိတယ်လို့ မဆိုလိုပါဘူး။

တရားရုံးနဲ့ နှိုင်းယှဉ်ကြည့်ရအောင်
ဒီယူဆချက်စမ်းသပ်တာကို တရားရုံးမှာ ရာဇဝတ်မှုစစ်ဆေးတာနဲ့ နှိုင်းယှဉ်လို့ရပါတယ်။
နော်လ်ယူဆချက် (H₀): “တရားခံက အပြစ်မရှိဘူး” လို့ ယူဆထားတာပဲ။ ဒါက ပုံမှန်ယူဆချက်။
အခြားရွေးချယ်စရာ ယူဆချက် (H₁): “တရားခံက အပြစ်ရှိတယ်” လို့ တရားလိုဘက်က သက်သေပြချင်တာပေါ့။
အမျိုးအစား I အမှား: အပြစ်မရှိတဲ့သူကို အပြစ်ပေးလိုက်တာ။ ဒါက မှားယွင်းတဲ့ အပေါင်းလက္ခဏာ (false positive) ပေါ့။ တရားရုံးက ဒီလိုမဖြစ်အောင် အရမ်းဂရုစိုက်တယ်။
အမျိုးအစား II အမှား: အပြစ်ရှိတဲ့သူကို လွှတ်ပေးလိုက်တာ�। ဒါက မှားယွင်းတဲ့ အနှုတ်လက္ခဏာ (false negative)။ Type I Error ကို ရှောင်ဖို့ ကြိုးစားရင် Type II Error ဖြစ်နိုင်ခြေ ပိုများလာနိုင်တယ်။
တရားရုံးမှာ တရားလိုဘက်က လုံလောက်တဲ့ သက်သေမပြမချင်း တရားခံကို အပြစ်မရှိဘူးလို့ ယူဆသလိုပဲ၊ ဒီစမ်းသပ်မှုမှာလည်း P-တန်ဖိုးက အရေးပါမှုအဆင့်ထက် နည်းမှသာ နော်လ်ယူဆချက်ကို ပယ်ချပြီး အခြားရွေးချယ်စရာ ယူဆချက်ကို လက်ခံတာပေါ့။

Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Hypothesis ယူဆချက်ဆိုတာ ဘာလဲ?

Discover more from naywinaung

Leave a Reply Cancel reply

Related Post

t testt test

Stratified Random SamplingStratified Random Sampling

QQ Plot ဆိုတာ ဘာလဲ?QQ Plot ဆိုတာ ဘာလဲ?