naywinaung Research Methodology Hypothesis  ယူဆချက်ဆိုတာ ဘာလဲ?

Hypothesis  ယူဆချက်ဆိုတာ ဘာလဲ?

Hypothesis  ယူဆချက်ဆိုတာ ဘာလဲ?
“ယူဆချက်” (Hypothesis) ဆိုတာကို ရိုးရိုးရှင်းရှင်း ပြောရရင် ဒေတာတွေနဲ့ စမ်းသပ်ကြည့်လို့ရတဲ့ ခန့်မှန်းချက်တစ်ခုပါပဲ။ ဥပမာ၊ မင်းတစ်ခုခုကို ယူဆထားတယ်၊ အဲဒါကို ဒေတာနဲ့ သက်သေပြပြီး မှန်၊ မမှန် ဆုံးဖြတ်တာပေါ့။ ဒါက လူတစ်စုလုံး (population) ရဲ့ သဘာဝတစ်ခုခုနဲ့ ပတ်သက်တဲ့ ခန့်မှန်းချက်ဖြစ်ပြီး နမူနာ (sample) နဲ့ တိုက်ဆိုင်စစ်ဆေးတာမဟုတ်ပါဘူး။

စာရင်းအင်းပညာမှာ ဒီယူဆချက်ကို စမ်းသပ်ဖို့ နည်းလမ်းတစ်ခုရှိပါတယ်၊ အဲဒါကို ယူဆချက်စမ်းသပ်ခြင်း (Hypothesis Testing) လို့ခေါ်ပါတယ်။ ဒေတာက မင်းယူဆထားတာကို ပယ်ချဖို့ လုံလောက်တဲ့ သက်သေပေးနိုင်လား၊ မပေးနိုင်ဘူးလား ဆိုတာကို ဆုံးဖြတ်တာပေါ့။

နော်လ်ယူဆချက် (H₀) နဲ့ အခြားရွေးချယ်စရာ ယူဆချက် (H₁/Hₐ)
ဒီစမ်းသပ်မှုမှာ ယူဆချက်နှစ်မျိုးရှိတယ်၊ နော်လ်ယူဆချက် (Null Hypothesis) နဲ့ အခြားရွေးချယ်စရာ ယူဆချက် (Alternative Hypothesis)။

နော်လ်ယူဆချက် (H₀): ဒါက ပုံမှန်အနေနဲ့ ယူဆထားတဲ့ အခြေအနေပဲ။ ဥပမာ၊ “ဘာမှ ထူးခြားမှုမရှိဘူး” လို့ ဆိုတာမျိုး။ ဒါကို မမှန်ဘူးလို့ သက်သေမပြမချင်း မှန်တယ်လို့ ယူဆထားရတယ်။
ဥပမာ: ကျောင်းသား ၄ ယောက် စာမေးပွဲမှာ အမှတ်တူရတာ မတော်တဆပဲ ဖြစ်နိုင်တယ်။
ဒါမှမဟုတ်: စက်ရုံကထုတ်တဲ့ ကုန်ပစ္စည်းတွေရဲ့ ပျမ်းမျှအလေးချိန်က 80 mg ပဲ (H₀ = 80 mg)။

အခြားရွေးချယ်စရာ ယူဆချက် (H₁/Hₐ): ဒါက နော်လ်ယူဆချက်ရဲ့ ဆန့်ကျင်ဘက်ပဲ။ နော်လ်က မမှန်ဘူးလို့ သက်သေပြလိုက်ရင် ဒီဟာက မှန်တယ်လို့ ဆိုလိုတာပေါ့။ ဒါက တစ်ဖက်သတ် (တစ်ဖက်လှည့်) ဒါမှမဟုတ် နှစ်ဖက်စလုံး (နှစ်ဖက်လှည့်) ဖြစ်နိုင်တယ်။
ဥပမာ: ကျောင်းသား ၄ ယောက် အမှတ်တူရတာမှာ တစ်ခုခုအကြောင်းရင်းရှိတယ်။
ဒါမှမဟုတ်: စက်ရုံက ကုန်ပစ္စည်းတွေရဲ့ ပျမ်းမျှအလေးချိန်က 80 mg နဲ့ မတူဘူး (Hₐ ≠ 80 mg)။

ယူဆချက်စမ်းသပ်ဖို့ ဘယ်လိုလုပ်မလဲ?
ဒီစမ်းသပ်မှုကို လုပ်တဲ့အခါ အဆင့်တွေရှိပါတယ်။ ရိုးရိုးရှင်းရှင်း ပြောရရင်:
ဘယ်လိုယူဆချက်ကို စမ်းသပ်မလဲ အရင်သတ်မှတ်ရပါ မယ်။
ဘယ်လိုကိန်းဂဏန်းနည်းနဲ့ စမ်းသပ်မလဲ၊ ဘယ်ကိန်းဂဏန်းကို သုံးမလဲ (test statistic) ဆိုတာ ရွေးရပါ မယ်။
နော်လ်ယူဆချက်အောက်မှာ ဒီကိန်းဂဏန်းရဲ့ ဖြန့်ဝေပုံ (distribution) ကို တွက်ရပါမယ်။
“အရေးပါမှုအဆင့်” (significance level, α) ဆိုတာကို ရွေးရမယ်။ ဒါက မှားယွင်းတဲ့ အဖြေထွက်နိုင်တဲ့ ဖြစ်နိုင်ခြေ (false positive) ကို ဆိုလိုတာ။ ပုံမှန်အားဖြင့် 5% (0.05) ဒါမှမဟုတ် 1% (0.01) ကို သုံးပါတယ်။
ဒေတာကနေ test statistic ရဲ့ တန်ဖိုးကို တွက်ရပါမယ်။
နောက်ဆုံး၊ နော်လ်ယူဆချက်ကို ပယ်ချမလား၊ လက်ခံမလား ဆုံးဖြတ်ရပါမယ်။

P-တန်ဖိုး ဆိုတာဘာလဲ?
P-တန်ဖိုး (P-value) ဆိုတာ နော်လ်ယူဆချက်ကို မှန်တယ်လို့ ယူဆရင်၊ မင်းရထားတဲ့ ဒေတာရလဒ်ထက် ပိုပြီး ပြင်းထန်တဲ့ ရလဒ်တစ်ခုရဖို့ ဖြစ်နိုင်ခြေကို ပြောတာပါပဲ။
P-တန်ဖိုး နည်းရင် အခြားရွေးချယ်စရာ ယူဆချက်ကို ထောက်ခံတဲ့ သက်သေ ပိုခိုင်လာတယ်။
ပုံမှန်အားဖြင့် P-တန်ဖိုးက 0.05 ဒါမှမဟုတ် ဒီထက်နည်းရင် “ကိန်းဂဏန်းအရ သိသာတယ်” (statistically significant) လို့ယူဆပြီး နော်လ်ယူဆချက်ကို ပယ်ချတယ်။
ဒါပေမယ့် သတိထားရမယ်! P-တန်ဖိုးက နော်လ်ယူဆချက်မှန်နိုင်ခြေ၊ ဒါမှမဟုတ် အခြားယူဆချက်မှန်နိုင်ခြေကို တိုက်ရိုက်မပြောပါဘူး။

ဘယ်လိုအမှားတွေ ဖြစ်နိုင်လဲ?
ဒီလိုစမ်းသပ်တဲ့အခါ အမှားတွေ ဖြစ်တတ်တယ်။ အဓိက အမှားနှစ်မျိုးရှိပါတယ်:

အမျိုးအစား I အမှား (Type I Error): နော်လ်ယူဆချက်က မှန်နေပေမယ့် မမှန်ဘူးလို့ ပယ်ချလိုက်တာ။ ဒါကို “မှားယွင်းတဲ့ အပေါင်းလက္ခဏာ” (false positive) လို့ခေါ်တယ်။ ဒီအမှားဖြစ်နိုင်ခြေကို အရေးပါမှုအဆင့် (α) နဲ့ သတ်မှတ်ထားတယ်။ ဥပမာ၊ α=0.05 ဆိုရင် 5% အမှားဖြစ်နိုင်တယ်။

အမျိုးအစား II အမှား (Type II Error): အခြားရွေးချယ်စရာ ယူဆချက်က မှန်နေပေမယ့် နော်လ်ယူဆချက်ကို မပယ်ချဘဲ ထားလိုက်တာ β । ဒါကို “မှားယွင်းတဲ့ အနှုတ်လက္ခဏာ” (false negative) လို့ခေါ်တယ်။

စွမ်းရည် (Power): ဒါက စမ်းသပ်မှုတစ်ခုရဲ့ အင်အားပဲ။ အခြားရွေးချယ်စရာ ယူဆချက်က မှန်တယ်ဆိုရင် နော်လ်ယူဆချက်ကို မှန်မှန်ကန်ကန် ပယ်ချနိုင်တဲ့ ဖြစ်နိုင်ခြေကို ဆိုလိုတယ် (1-β)။ ဥပမာ၊ β=0.20 ဆိုရင် power က 80% ပေါ့။

ဒီဟာက ဘာကြောင့် အရေးကြီးတာလဲ?
ယူဆချက်စမ်းသပ်တာက ဒေတာတွေကို ခွဲခြမ်းစိတ်ဖြာရာမှာ အရမ်းအသုံးဝင်တယ်။ သိပ္ပံနည်းကျ သီအိုရီမရှိရင်တောင် ဒေတာကနေ ကောက်ချက်တွေကို တရားဝင်ဆွဲထုတ်လို့ရတယ်။ ဒါကို နမူနာဒေတာကနေ လူတစ်စုလုံးရဲ့ သဘာဝကို ခန့်မှန်းဖို့ (inferential statistics) သုံးပါတယ်။
ဒါပေမယ့် သတိထားရမယ့်အချက်တွေလည်း ရှိပါတယ်:

နမူနာအရွယ်အစား: စမ်းသပ်မှုမလုပ်ခင် နမူနာအရွယ်အစားကို သေချာရွေးရမယ်။ နမူနာသေးလွန်းရင် ရလဒ်တွေက မတိကျဘဲ မဖြေရှင်းနိုင်တဲ့ အဖြေတွေ ထွက်လာနိုင်ပါတယ်।

ဝေဖန်မှုတွေ: ဒီစမ်းသပ်မှုကို လူတွေ နားလည်မှုလွဲတာ၊ အလွန်အကျွံသုံးတာ၊ မမှန်ကန်စွာ သုံးတာတွေ ရှိတတ်ပါတယ်။ နော်လ်ယူဆချက်ကို ပယ်ချလိုက်လို့ သုတေသနရဲ့ ယူဆချက်ကို အမြဲထောက်ခံတယ်လို့ မဆိုလိုပါဘူး။

ကိန်းဂဏန်းနဲ့ လက်တွေ့ဘဝ: ကိန်းဂဏန်းအရ သိသာတယ်ဆိုတာ လက်တွေ့မှာ သိသာတယ်လို့ မဆိုလိုပါဘူး။ ဥပမာ၊ P-တန်ဖိုး 0.04 နဲ့ 0.06 ဆိုရင် 0.04 က ကိန်းဂဏန်းအရ ပိုသိသာပေမယ့် လက်တွေ့အကျိုးသက်ရောက်မှုက သိပ်ကွာနိုင်ပါတယ်။

ဆက်စပ်မှုနဲ့ အကြောင်းရင်း: ဆက်စပ်မှု (correlation) ရှိတယ်ဆိုတာ အကြောင်းရင်း (causation) ရှိတယ်လို့ မဆိုလိုပါဘူး။

တရားရုံးနဲ့ နှိုင်းယှဉ်ကြည့်ရအောင်
ဒီယူဆချက်စမ်းသပ်တာကို တရားရုံးမှာ ရာဇဝတ်မှုစစ်ဆေးတာနဲ့ နှိုင်းယှဉ်လို့ရပါတယ်။
နော်လ်ယူဆချက် (H₀): “တရားခံက အပြစ်မရှိဘူး” လို့ ယူဆထားတာပဲ။ ဒါက ပုံမှန်ယူဆချက်။
အခြားရွေးချယ်စရာ ယူဆချက် (H₁): “တရားခံက အပြစ်ရှိတယ်” လို့ တရားလိုဘက်က သက်သေပြချင်တာပေါ့။
အမျိုးအစား I အမှား: အပြစ်မရှိတဲ့သူကို အပြစ်ပေးလိုက်တာ။ ဒါက မှားယွင်းတဲ့ အပေါင်းလက္ခဏာ (false positive) ပေါ့။ တရားရုံးက ဒီလိုမဖြစ်အောင် အရမ်းဂရုစိုက်တယ်။
အမျိုးအစား II အမှား: အပြစ်ရှိတဲ့သူကို လွှတ်ပေးလိုက်တာ�। ဒါက မှားယွင်းတဲ့ အနှုတ်လက္ခဏာ (false negative)။ Type I Error ကို ရှောင်ဖို့ ကြိုးစားရင် Type II Error ဖြစ်နိုင်ခြေ ပိုများလာနိုင်တယ်။
တရားရုံးမှာ တရားလိုဘက်က လုံလောက်တဲ့ သက်သေမပြမချင်း တရားခံကို အပြစ်မရှိဘူးလို့ ယူဆသလိုပဲ၊ ဒီစမ်းသပ်မှုမှာလည်း P-တန်ဖိုးက အရေးပါမှုအဆင့်ထက် နည်းမှသာ နော်လ်ယူဆချက်ကို ပယ်ချပြီး အခြားရွေးချယ်စရာ ယူဆချက်ကို လက်ခံတာပေါ့။


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

EstimationEstimation

Estimation Estimation ဆိုတာဟာ ကျွန်တော်တို့မှာရှိတဲ့ အချက်အလက် (data) နမူနာ (sample) တစ်ခုကို အခြေခံပြီး၊ အဲဒီအချက်အလက်တွေ ရယူထားတဲ့ ပိုကြီးတဲ့ အုပ်စု (population) တစ်ခုလုံးရဲ့ အားနည်းချက် (characteristics) တွေအကြောင်း ကောက်ချက်ဆွဲတာ ဒါမှမဟုတ် ခန့်မှန်းတာကို ဆိုလိုပါတယ်။ ဒီနည်းလမ်းဟာ စာရင်းအင်းပညာ (statistics) ရဲ့ အရေးကြီးတဲ့ အစိတ်အပိုင်းတစ်ခုဖြစ်ပြီး Inferential

Student’s t -test နှင့် pair t-testStudent’s t -test နှင့် pair t-test

Student’s t -test နှင့် pair t-testStudent’s t-test (တစ်ခုတည်းသော လူဦးရေပျမ်းမျှအတွက်) ပထမဆုံးအနေနဲ့ တစ်ခုတည်းသော လူဦးရေပျမ်းမျှ (single population mean) အတွက် t-test အကြောင်း ပြောပြချင်ပါတယ်။ ဒီ test ကို ဘယ်အချိန်မှာ သုံးရသလဲဆိုတော့၊ ကျွန်တော်တို့ ဆန်းစစ်ချင်တဲ့ data ဟာ ပုံမှန်ဖြန့်ကျက်မှု (normally

Z scoreZ score

Z-score Z-score ဆိုတာဟာ ကျွန်တော်တို့မှာရှိတဲ့ အချက်အလက် (data point) တစ်ခုက သူ့ရဲ့ ပျမ်းမျှ (mean) ကနေ ဘယ်လောက် အကွာအဝေးမှာ ရှိနေလဲဆိုတာကို စံသွေဖည်မှု (standard deviation) ရဲ့ အရေအတွက်နဲ့ တိုင်းတာဖော်ပြပေးတဲ့ တန်ဖိုးတစ်ခု ဖြစ်ပါတယ်။ တစ်နည်းအားဖြင့် ပြောရရင်၊ အချက်အလက်တစ်ခုရဲ့ “စံပြုနေရာ” (standardized position) ကို