naywinaung Research Methodology Hypothesis  ယူဆချက်ဆိုတာ ဘာလဲ?

Hypothesis  ယူဆချက်ဆိုတာ ဘာလဲ?

Hypothesis  ယူဆချက်ဆိုတာ ဘာလဲ?
“ယူဆချက်” (Hypothesis) ဆိုတာကို ရိုးရိုးရှင်းရှင်း ပြောရရင် ဒေတာတွေနဲ့ စမ်းသပ်ကြည့်လို့ရတဲ့ ခန့်မှန်းချက်တစ်ခုပါပဲ။ ဥပမာ၊ မင်းတစ်ခုခုကို ယူဆထားတယ်၊ အဲဒါကို ဒေတာနဲ့ သက်သေပြပြီး မှန်၊ မမှန် ဆုံးဖြတ်တာပေါ့။ ဒါက လူတစ်စုလုံး (population) ရဲ့ သဘာဝတစ်ခုခုနဲ့ ပတ်သက်တဲ့ ခန့်မှန်းချက်ဖြစ်ပြီး နမူနာ (sample) နဲ့ တိုက်ဆိုင်စစ်ဆေးတာမဟုတ်ပါဘူး။

စာရင်းအင်းပညာမှာ ဒီယူဆချက်ကို စမ်းသပ်ဖို့ နည်းလမ်းတစ်ခုရှိပါတယ်၊ အဲဒါကို ယူဆချက်စမ်းသပ်ခြင်း (Hypothesis Testing) လို့ခေါ်ပါတယ်။ ဒေတာက မင်းယူဆထားတာကို ပယ်ချဖို့ လုံလောက်တဲ့ သက်သေပေးနိုင်လား၊ မပေးနိုင်ဘူးလား ဆိုတာကို ဆုံးဖြတ်တာပေါ့။

နော်လ်ယူဆချက် (H₀) နဲ့ အခြားရွေးချယ်စရာ ယူဆချက် (H₁/Hₐ)
ဒီစမ်းသပ်မှုမှာ ယူဆချက်နှစ်မျိုးရှိတယ်၊ နော်လ်ယူဆချက် (Null Hypothesis) နဲ့ အခြားရွေးချယ်စရာ ယူဆချက် (Alternative Hypothesis)။

နော်လ်ယူဆချက် (H₀): ဒါက ပုံမှန်အနေနဲ့ ယူဆထားတဲ့ အခြေအနေပဲ။ ဥပမာ၊ “ဘာမှ ထူးခြားမှုမရှိဘူး” လို့ ဆိုတာမျိုး။ ဒါကို မမှန်ဘူးလို့ သက်သေမပြမချင်း မှန်တယ်လို့ ယူဆထားရတယ်။
ဥပမာ: ကျောင်းသား ၄ ယောက် စာမေးပွဲမှာ အမှတ်တူရတာ မတော်တဆပဲ ဖြစ်နိုင်တယ်။
ဒါမှမဟုတ်: စက်ရုံကထုတ်တဲ့ ကုန်ပစ္စည်းတွေရဲ့ ပျမ်းမျှအလေးချိန်က 80 mg ပဲ (H₀ = 80 mg)။

အခြားရွေးချယ်စရာ ယူဆချက် (H₁/Hₐ): ဒါက နော်လ်ယူဆချက်ရဲ့ ဆန့်ကျင်ဘက်ပဲ။ နော်လ်က မမှန်ဘူးလို့ သက်သေပြလိုက်ရင် ဒီဟာက မှန်တယ်လို့ ဆိုလိုတာပေါ့။ ဒါက တစ်ဖက်သတ် (တစ်ဖက်လှည့်) ဒါမှမဟုတ် နှစ်ဖက်စလုံး (နှစ်ဖက်လှည့်) ဖြစ်နိုင်တယ်။
ဥပမာ: ကျောင်းသား ၄ ယောက် အမှတ်တူရတာမှာ တစ်ခုခုအကြောင်းရင်းရှိတယ်။
ဒါမှမဟုတ်: စက်ရုံက ကုန်ပစ္စည်းတွေရဲ့ ပျမ်းမျှအလေးချိန်က 80 mg နဲ့ မတူဘူး (Hₐ ≠ 80 mg)။

ယူဆချက်စမ်းသပ်ဖို့ ဘယ်လိုလုပ်မလဲ?
ဒီစမ်းသပ်မှုကို လုပ်တဲ့အခါ အဆင့်တွေရှိပါတယ်။ ရိုးရိုးရှင်းရှင်း ပြောရရင်:
ဘယ်လိုယူဆချက်ကို စမ်းသပ်မလဲ အရင်သတ်မှတ်ရပါ မယ်။
ဘယ်လိုကိန်းဂဏန်းနည်းနဲ့ စမ်းသပ်မလဲ၊ ဘယ်ကိန်းဂဏန်းကို သုံးမလဲ (test statistic) ဆိုတာ ရွေးရပါ မယ်။
နော်လ်ယူဆချက်အောက်မှာ ဒီကိန်းဂဏန်းရဲ့ ဖြန့်ဝေပုံ (distribution) ကို တွက်ရပါမယ်။
“အရေးပါမှုအဆင့်” (significance level, α) ဆိုတာကို ရွေးရမယ်။ ဒါက မှားယွင်းတဲ့ အဖြေထွက်နိုင်တဲ့ ဖြစ်နိုင်ခြေ (false positive) ကို ဆိုလိုတာ။ ပုံမှန်အားဖြင့် 5% (0.05) ဒါမှမဟုတ် 1% (0.01) ကို သုံးပါတယ်။
ဒေတာကနေ test statistic ရဲ့ တန်ဖိုးကို တွက်ရပါမယ်။
နောက်ဆုံး၊ နော်လ်ယူဆချက်ကို ပယ်ချမလား၊ လက်ခံမလား ဆုံးဖြတ်ရပါမယ်။

P-တန်ဖိုး ဆိုတာဘာလဲ?
P-တန်ဖိုး (P-value) ဆိုတာ နော်လ်ယူဆချက်ကို မှန်တယ်လို့ ယူဆရင်၊ မင်းရထားတဲ့ ဒေတာရလဒ်ထက် ပိုပြီး ပြင်းထန်တဲ့ ရလဒ်တစ်ခုရဖို့ ဖြစ်နိုင်ခြေကို ပြောတာပါပဲ။
P-တန်ဖိုး နည်းရင် အခြားရွေးချယ်စရာ ယူဆချက်ကို ထောက်ခံတဲ့ သက်သေ ပိုခိုင်လာတယ်။
ပုံမှန်အားဖြင့် P-တန်ဖိုးက 0.05 ဒါမှမဟုတ် ဒီထက်နည်းရင် “ကိန်းဂဏန်းအရ သိသာတယ်” (statistically significant) လို့ယူဆပြီး နော်လ်ယူဆချက်ကို ပယ်ချတယ်။
ဒါပေမယ့် သတိထားရမယ်! P-တန်ဖိုးက နော်လ်ယူဆချက်မှန်နိုင်ခြေ၊ ဒါမှမဟုတ် အခြားယူဆချက်မှန်နိုင်ခြေကို တိုက်ရိုက်မပြောပါဘူး။

ဘယ်လိုအမှားတွေ ဖြစ်နိုင်လဲ?
ဒီလိုစမ်းသပ်တဲ့အခါ အမှားတွေ ဖြစ်တတ်တယ်။ အဓိက အမှားနှစ်မျိုးရှိပါတယ်:

အမျိုးအစား I အမှား (Type I Error): နော်လ်ယူဆချက်က မှန်နေပေမယ့် မမှန်ဘူးလို့ ပယ်ချလိုက်တာ။ ဒါကို “မှားယွင်းတဲ့ အပေါင်းလက္ခဏာ” (false positive) လို့ခေါ်တယ်။ ဒီအမှားဖြစ်နိုင်ခြေကို အရေးပါမှုအဆင့် (α) နဲ့ သတ်မှတ်ထားတယ်။ ဥပမာ၊ α=0.05 ဆိုရင် 5% အမှားဖြစ်နိုင်တယ်။

အမျိုးအစား II အမှား (Type II Error): အခြားရွေးချယ်စရာ ယူဆချက်က မှန်နေပေမယ့် နော်လ်ယူဆချက်ကို မပယ်ချဘဲ ထားလိုက်တာ β । ဒါကို “မှားယွင်းတဲ့ အနှုတ်လက္ခဏာ” (false negative) လို့ခေါ်တယ်။

စွမ်းရည် (Power): ဒါက စမ်းသပ်မှုတစ်ခုရဲ့ အင်အားပဲ။ အခြားရွေးချယ်စရာ ယူဆချက်က မှန်တယ်ဆိုရင် နော်လ်ယူဆချက်ကို မှန်မှန်ကန်ကန် ပယ်ချနိုင်တဲ့ ဖြစ်နိုင်ခြေကို ဆိုလိုတယ် (1-β)။ ဥပမာ၊ β=0.20 ဆိုရင် power က 80% ပေါ့။

ဒီဟာက ဘာကြောင့် အရေးကြီးတာလဲ?
ယူဆချက်စမ်းသပ်တာက ဒေတာတွေကို ခွဲခြမ်းစိတ်ဖြာရာမှာ အရမ်းအသုံးဝင်တယ်။ သိပ္ပံနည်းကျ သီအိုရီမရှိရင်တောင် ဒေတာကနေ ကောက်ချက်တွေကို တရားဝင်ဆွဲထုတ်လို့ရတယ်။ ဒါကို နမူနာဒေတာကနေ လူတစ်စုလုံးရဲ့ သဘာဝကို ခန့်မှန်းဖို့ (inferential statistics) သုံးပါတယ်။
ဒါပေမယ့် သတိထားရမယ့်အချက်တွေလည်း ရှိပါတယ်:

နမူနာအရွယ်အစား: စမ်းသပ်မှုမလုပ်ခင် နမူနာအရွယ်အစားကို သေချာရွေးရမယ်။ နမူနာသေးလွန်းရင် ရလဒ်တွေက မတိကျဘဲ မဖြေရှင်းနိုင်တဲ့ အဖြေတွေ ထွက်လာနိုင်ပါတယ်।

ဝေဖန်မှုတွေ: ဒီစမ်းသပ်မှုကို လူတွေ နားလည်မှုလွဲတာ၊ အလွန်အကျွံသုံးတာ၊ မမှန်ကန်စွာ သုံးတာတွေ ရှိတတ်ပါတယ်။ နော်လ်ယူဆချက်ကို ပယ်ချလိုက်လို့ သုတေသနရဲ့ ယူဆချက်ကို အမြဲထောက်ခံတယ်လို့ မဆိုလိုပါဘူး။

ကိန်းဂဏန်းနဲ့ လက်တွေ့ဘဝ: ကိန်းဂဏန်းအရ သိသာတယ်ဆိုတာ လက်တွေ့မှာ သိသာတယ်လို့ မဆိုလိုပါဘူး။ ဥပမာ၊ P-တန်ဖိုး 0.04 နဲ့ 0.06 ဆိုရင် 0.04 က ကိန်းဂဏန်းအရ ပိုသိသာပေမယ့် လက်တွေ့အကျိုးသက်ရောက်မှုက သိပ်ကွာနိုင်ပါတယ်။

ဆက်စပ်မှုနဲ့ အကြောင်းရင်း: ဆက်စပ်မှု (correlation) ရှိတယ်ဆိုတာ အကြောင်းရင်း (causation) ရှိတယ်လို့ မဆိုလိုပါဘူး။

တရားရုံးနဲ့ နှိုင်းယှဉ်ကြည့်ရအောင်
ဒီယူဆချက်စမ်းသပ်တာကို တရားရုံးမှာ ရာဇဝတ်မှုစစ်ဆေးတာနဲ့ နှိုင်းယှဉ်လို့ရပါတယ်။
နော်လ်ယူဆချက် (H₀): “တရားခံက အပြစ်မရှိဘူး” လို့ ယူဆထားတာပဲ။ ဒါက ပုံမှန်ယူဆချက်။
အခြားရွေးချယ်စရာ ယူဆချက် (H₁): “တရားခံက အပြစ်ရှိတယ်” လို့ တရားလိုဘက်က သက်သေပြချင်တာပေါ့။
အမျိုးအစား I အမှား: အပြစ်မရှိတဲ့သူကို အပြစ်ပေးလိုက်တာ။ ဒါက မှားယွင်းတဲ့ အပေါင်းလက္ခဏာ (false positive) ပေါ့။ တရားရုံးက ဒီလိုမဖြစ်အောင် အရမ်းဂရုစိုက်တယ်။
အမျိုးအစား II အမှား: အပြစ်ရှိတဲ့သူကို လွှတ်ပေးလိုက်တာ�। ဒါက မှားယွင်းတဲ့ အနှုတ်လက္ခဏာ (false negative)။ Type I Error ကို ရှောင်ဖို့ ကြိုးစားရင် Type II Error ဖြစ်နိုင်ခြေ ပိုများလာနိုင်တယ်။
တရားရုံးမှာ တရားလိုဘက်က လုံလောက်တဲ့ သက်သေမပြမချင်း တရားခံကို အပြစ်မရှိဘူးလို့ ယူဆသလိုပဲ၊ ဒီစမ်းသပ်မှုမှာလည်း P-တန်ဖိုးက အရေးပါမှုအဆင့်ထက် နည်းမှသာ နော်လ်ယူဆချက်ကို ပယ်ချပြီး အခြားရွေးချယ်စရာ ယူဆချက်ကို လက်ခံတာပေါ့။


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

Quota SamplingQuota Sampling

Quota Sampling ဆိုတာက Population ရဲ့ အချိုးအစားအတိုင်း Sample ကို ရွေးချယ်တဲ့ နည်းလမ်းဖြစ်ပါတယ်။  မြို့တစ်မြို့က လူတွေရဲ့ အမြင်တွေကို စစ်တမ်းကောက်ချင်တယ်ဆိုရင် အဲ့ဒီမြို့မှာ အမျိုးသား ဘယ်နှစ်ယောက်ရှိလဲ၊ အမျိုးသမီး ဘယ်နှစ်ယောက်ရှိလဲ၊ အသက်အရွယ် ဘယ်လောက်ရှိတဲ့သူတွေ ဘယ်လောက်ရှိလဲဆိုတာကို သိထားရပါမယ်။ ပြီးတော့ Sample ထဲမှာလည်း အဲ့ဒီအချိုးအစားအတိုင်း လူတွေကို ထည့်ရပါမယ်။ အဲ့ဒါ

Cluster SamplingCluster Sampling

Cluster SamplingCluster Sampling ဆိုတာ လူအုပ်စုအကြီးကြီးကို လေ့လာချင်တဲ့အခါ သုံးတဲ့နည်းဖြစ်ပါတယ်။ ဒါပေမဲ့ လူတွေကို တစ်ယောက်ချင်းစီ မရွေးထုတ်ဘဲ အုပ်စုလိုက် ရွေးထုတ်တာကို Cluster Sampling လို့ခေါ်ပါတယ်။ အဲ့ဒီမှာ Cluster ဆိုတာက သဘာဝအလျောက် ဖြစ်နေတဲ့ အုပ်စုတွေကို ပြောတာ။ ဥပမာ… ကျောင်းတွေဆို အတန်းတွေက Cluster တွေပါပဲ။ ရွာတွေဆိုရင် အိမ်ထောင်စုတွေက

Simple Random SamplingSimple Random Sampling

Simple Random Sampling“Simple Random Sampling” ဆိုတာကို အလွယ်ကူဆုံး နားလည်အောင် ပြောရရင် “မဲနှိုက်တာ” နဲ့ အတူတူပါပဲ။ လူအများကြီးထဲကမှ လူအနည်းငယ်ကို ရွေးတဲ့အခါမှာ ဘယ်သူ့ကိုမဆို ပါဝင်ခွင့် အခွင့်အရေး တန်းတူပေးပြီး ကံစမ်းမဲနှိုက်သလိုမျိုး ရွေးချယ်တဲ့ နည်းလမ်းဖြစ်ပါတယ်။SRS ရဲ့ အဓိကအချက်တွေကတော့၁။ အားလုံးမှာ အခွင့်အရေး တန်းတူရှိတယ် (Equal Chance)လူဦးရေ (Population)