Degree of freedom

degree of freedom အကြောင်း နားလည်သလောက်

ကျွန်တော်လေးစားရတဲ့ ဆရာတွေက လာမေးထားတော့ နားလည်သလောက်လေး ပြန်ရေးပြတာပါ။ မှားချင်လည်း မှားနိုင်ပါတယ်။ ကျွန်တော်က လေ့လာနေဆဲပါ။ တကယ်လို့ ကျွန်တော် မှတ်ထားတာလေးတွေ မှန်နေရင်လည်း ဝမ်းသာရမှာ ဖြစ်သလို၊ မှားနေခဲ့ရင်လည်း ပြင်ဆင်ပေးခဲ့ကြပါခဗျ။ ပြန်ဖတ်ရမှာပေါ့။ ကျွန်တော်အတွက် ဘာဖြစ်ဖြစ် အကျိုးရှိပါတယ်။

စာရင်းအင်းပညာ မှာ degree of freedom ဆိုတာကို တွက်ချက်ကြရမှာဖြစ်ပါတယ်။ df ဆိုတာ အချက်အလက်တွေရဲ့ လွတ်လပ်မှုကို တိုင်းတာတဲ့ အယူအဆ တစ်ခု ဖြစ်ပါတယ်။ သုတေသီတစ်ယောက်အနေနဲ့ အချက်အလက်တွေ ခွဲခြမ်း စိတ်ဖြာရင် ဒါက မရှိမဖြစ်ပါ၊ df က ရလဒ်တွေရဲ့ ယုံကြည်ရမှုကို ဆုံးဖြတ်ပေးပါတယ်။

Degree of freedom ဆိုတာ ဘာလဲ၊ ဘယ်လို တွက်ရလဲ ဆိုရင်၊ (data set) အချက်အလက်အစုတစ်ခု မှာ လွတ်လပ်စွာ ပြောင်းလဲနိုင်တဲ့ တန်ဖိုး တွေရဲ့ အရေအတွက်ကို ဆိုလိုပါတယ်။ အချက်အလက်တွေကို (analyze) ခွဲခြမ်းစိတ်ဖြာရင် တချို့ တန်ဖိုးတွေဟာ အခြားတန်ဖိုးတွေရဲ့ ချုပ်ချယ်မှုကို ခံရတတ်ပါတယ်။ ဥပမာပြောရရင်၊ အချက်အလက် n ခု ရှိတဲ့ နမူနာတစ်ခုရဲ့ ပျမ်းမျှတန်ဖိုး(Mean)ကို တွက်ရင်၊ တန်ဖိုး n-1 ခု ကို လွတ်လပ်စွာ ရွေးနိုင်တယ်၊ ဒါပေမဲ့ နောက်ဆုံး တန်ဖိုးတစ်ခုကိုတော့ မရွေးရဘူး။ ပျမ်းမျှမပြောင်းအောင် အလိုအလျောက် ဆုံးဖြတ် ချက်ချခြင်းဖြစ်ပါတယ်။ ဒါကြောင့် degree of freedom ကို df = n – 1 လို့ တွက်ပါတယ်။

ဒီ တွက်ချက်မှုကိုလုပ်ရတဲ့ အကြောင်းရင်းကတော့ ရလဒ်တွေရဲ့ ဘက်လိုက်မှုကို ရှောင်ဖို့ဖြစ်ပါတယ်။ မတွက်ရင် ရလဒ်တွေက အချက်အလက်တွေရဲ့ လွတ်လပ်မှုကို လျစ်လျူရှုပြီး အလွန်အကျွံတိကျဟန်ဆောင်နိုင်ပါတယ်။ ဥပမာ၊ လူ အရေအတွက် နည်းတဲ့ နမူနာတစ်ခုမှာ degree of freedom နည်းရင် ရလဒ်တွေမှားယွင်းမှုများနိုင်ပါတယ်။ သုတေသနမှာ ဒီ အယူအဆက ရလဒ်တွေရဲ့ ယုံကြည်ရမှုကို မြှင့်ပေးပါတယ်၊ hypothesis testing နဲ့ confidence interval တွေကို ပိုပြီး တိကျစေပါတယ်။

Statistical test တွေ မှာ degree of freedom က distribution တွေ ရဲ့ ပုံသဏ္ဌာန်ကို ဆုံးဖြတ်ပေးပါတယ်။ ဥပမာ၊ t-distribution မှာ degree of freedom နည်းရင် ရလဒ်တွေရဲ့ မသေချာမှု အပိုင်းက ကျယ်ပါတယ်။ ဒီ အချက်က ရလဒ်တွေ ကို လက်ခံ/လက်မခံ ဆုံးဖြတ်ရာမှာ အရေးပါပါတယ်။

နောက်တစ်ခု က ဘက်လိုက်မှု ရှောင်တာပါ။ နမူနာ အချက်အလက်တွေ ကနေ လူဦးရေ တစ်ခုလုံးကို ခန့်မှန်းရင် degree of freedom မတွက်တဲ့အခါ ရလဒ်တွေက အလွန်အကျွံ တိကျဟန်ဆောင်နိုင်ပါတယ်။ ဥပမာ၊ ဆေးပညာ သုတေသနမှာ ဆေးအသစ်တစ်မျိုးရဲ့ ထိရောက်မှုကို စမ်းရင် degree of freedom နည်းရင် ရလဒ်တွေက မှား ယွင်းမှု များနိုင်ပါတယ်။

နောက်တစ်ချက်က df က statistical power မြှင့်ပေးပါတယ်။ နမူနာ အရွယ်အစားကြီးရင် degree of freedom များတယ်၊ ရလဒ်တွေ ယုံကြည်ရမှု ပိုလာပါတယ်။ သုတေသီတွေက ဒီ အချက်ကို သုံးပြီး နမူနာ အရွယ်အစားကို ကြိုတင် ဆုံးဖြတ်နိုင်ပါတယ်။

df (degree of freedom) နဲ့ precision နဲ့ critical value တွေဟာ ဆက်စပ်နေပါတယ်။

Precision ဆိုတာက တွက်ထားတဲ့အဖြေ (ဥပမာ ပျမ်းမျှ၊ ကွဲပြားမှု စတာ) ဘယ်လောက် ယုံကြည်ရလဲ၊ အမှန်တကယ် တန်ဖိုးနဲ့ ဘယ်လောက် နီးစပ်နိုင်လဲ ဆိုတာပါ။ df က ဒီ တိကျမှုကို တိုက်ရိုက် ထိန်းပေး နိုင်ပါတယ်။ df များရင် (နမူနာ အရေအတွက် များရင်) လွတ်လပ်တဲ့အချက်အလက်များပါတယ်။ ဒါကြောင့် အချက်အလက်တွေရဲ့ သတင်းအချက်အလက် ပိုများပါတယ်။ တွက်ထားတဲ့ ပျမ်းမျှ ဒါမှမဟုတ် ကွဲပြားမှု စတာတွေက ပိုတိကျလာပါတယ်။ Standard error သေးလာပါတယ်၊ confidence interval ကျဉ်းလာပါတယ်။ ရလဒ်က ယုံကြည်ရမှု ပိုလာပါတယ်။ df နည်းရင် (နမူနာ နည်းရင်) လွတ်လပ်တဲ့ အချက် နည်းပါတယ်။ ဒါကြောင့် ရလဒ်က မသေချာမှု ပိုလာပါတယ်။ Standard error ကြီးလာပါတယ်၊ confidence interval ကျယ်လာပါတယ်။ precision နည်းသွားပါတယ်။

ဥပမာ ပြောရရင်၊ လူ ၁၀ ယောက်ရဲ့ အလေးချိန်ပျမ်းမျှ တွက်ရင် df = 9 ပဲ။ လူ ၁၀၀ ယောက် ဆို df = 99 ဖြစ်သွားပါတယ်။ df ၉၉ ဆို ပျမ်းမျှတန်ဖိုးက အမှန်တကယ် လူဦးရေပျမ်းမျှနဲ့ ပိုနီးစပ်ပါတယ်၊ အမှား အလားအလာ နည်းပါတယ်။ ဒါကြောင့် df က precision ရဲ့ အဓိက အချက်တစ်ခု လို့ဆိုလိုကြတာပါ။

Critical value ဆိုတာကတော့ hypothesis testing မှာ test statistic (ဥပမာ t တန်ဖိုး၊ chi-square တန်ဖိုး) က ဘယ်လောက်ကြီးရင် null hypothesis ကို ပယ်ချရမလဲ ဆိုတဲ့ အတိုင်းအတာကို ပြောတာပါ။ df က ဒီ critical value ကို တိုက်ရိုက် ဆုံးဖြတ်ပေးပါတယ်၊ distribution ရဲ့ ပုံစံကို df က ပြောင်းပေးလို့ ပါ။

t-test မှာ df နည်းရင် t-distribution က အမြီးပိုင်း (tail) ကျယ်ပါတယ်၊ ပိုပြီး leptokurtic ဖြစ်ပါတယ် (အစွန်း တန်ဖိုးတွေ ပိုများတယ်) ။ ဒါကြောင့် critical value က ပိုကြီးပါတယ် (ဥပမာ df=5 ဆို two-tailed α=0.05 မှာ critical t ≈ ±2.57၊ df=30 ဆို ±2.04 ပဲ ဖြစ်သွားပါတယ်) ။ df များလာ ရင် t-distribution က normal distribution နဲ့ ပိုနီးလာပါတယ်၊ critical value က သေးလာပါတယ်။
Chi-square test မှာတော့ df များလာ ရင် chi-square distribution ရဲ့ mean က df နဲ့ ညီပါတယ်၊ variance က 2×df ဖြစ်ပါတယ်။ ဒါကြောင့် distribution က ပိုကျယ်လာပါတယ်၊ critical value က ပိုကြီး လာပါတယ် (ဥပမာ df=1 ဆို α=0.05 မှာ critical value ≈ 3.84၊ df=10 ဆို ≈ 18.31 ဖြစ် သွား တယ်) ။ ဆိုလိုတာက တူညီတဲ့ ကွဲပြားမှု ပမာဏမှာ df များရင် ပိုကြီးတဲ့ chi-square တန်ဖိုး လိုအပ်လာပါတယ်။ ဒါပေမဲ့ စမ်းသပ်မှု ရလဒ်ကို ရှာနေတာမို့ အဖြေဟာ ပိုပြီးတိကျလာမှာ ဖြစ်ပါတယ်။

Chi-square test မှာ degree of freedom ကို df = (r – 1) × (c – 1) လို့ တွက်ပါတယ်၊ r က ဇယား ရဲ့ အတန်း အရေအတွက်၊ c က အတိုင် အရေအတွက်ဖြစ်ပါတယ်။ ဒီ df ကို သုံး ပြီး chi-square distribution ဇယားကနေ critical value ရှာပါတယ်၊ ရလဒ် တန်ဖိုးကြီး ရင် null hypothesis ကို ပယ်ချပါတယ်။ ဥပမာ၊ ကျားမ ခွဲခြား မှု နဲ့ အလုပ် အမျိုးအစား ဆက်စပ်မှုစစ်ရင် 2×3 ဇယား ဆို df = (2-1)×(3-1) = 2 ပါ။ ဒီ နည်းက ရလဒ်တွေကို မှန်ကန် စွာ အဓိပ္ပာယ်ဖွင့်နိုင်ဖို့ အတွက် ကူညီပေးပါတယ်။

t-test မှာ နမူနာတစ်ခု အတွက် df = n – 1 ပါ၊ n က နမူနာ အရေအတွက်။ နမူနာနှစ်ခု အတွက် independent t-test မှာ df = n₁ + n₂ – 2 ပါ။ ဒီ df ကို သုံး ပြီး t-distribution ကနေ critical value ရှာပါတယ်၊ ပျမ်းမျှတန်ဖိုး တွေ ကွဲလွဲမှု ရှိ/မရှိ ဆုံးဖြတ်ပါတယ်။ ဥပမာ၊ ဆေး နှစ်မျိုး ရဲ့ ထိရောက်မှု ကို နှိုင်းရင် သုံးပါတယ်။

ANOVA ဆိုတာ အုပ်စု များစွာရဲ့ ပျမ်းမျှ တန်ဖိုးတွေကိုနှိုင်း ရတဲ့ နည်းဖြစ်တဲ့အတွက် ဒီမှာ degree of freedom ကို ခွဲ တွက်ရပါတယ်၊ between-groups df = k – 1၊ k က အုပ်စု အရေအတွက်၊ within-groups df = N – k၊ N က စုစု ပေါင်း နမူနာ အရေအတွက်၊ total df = N – 1 ပါပဲ။ ဒီ df တွေ ကို သုံး ပြီး F-statistic တွက်ပါတယ်၊ အုပ်စုတွေမှာ ကွဲလွဲမှု ရှိ/မရှိ စစ်ဆေးပါတယ်။ ဥပမာ၊ ကျောင်းသား အုပ်စုတွေရဲ့ စာမေးပွဲရမှတ်တွေကို နှိုင်းရင် သုံးပါတယ်။

F-test မှာ မတူတဲ့ အုပ်စုနှစ်ခုရဲ့ variance တွေကို နှိုင်းပါတယ်။ အဲ့ဒါကြောင့် df ကို numerator df = n₁ – 1 နဲ့ denominator df = n₂ – 1 လို့ ခွဲ တွက်ပါတယ်။ F-distribution ကနေ critical value ရှာပါတယ်၊ variance တွေ တူ/မတူ ဆုံးဖြတ်ပါတယ်။ ဥပမာ၊ စက်ရုံ နှစ်ခု ရဲ့ ထုတ်ကုန် အရည်အသွေး ကွဲလွဲမှုကို စစ်ရင် သုံးပါတယ်။

Regression analysis မှာ linear regression ဆို df = n – p – 1 ဖြစ်ပါတယ်၊ p က predictor variable တွေ ရဲ့ အရေအတွက်ပါ။ ဒီ df ကို သုံး ပြီး model ရဲ့ ကိုက်ညီမှုကို စစ်ပါတယ်။ ဥပမာ၊ လခတွေ နဲ့ ပညာအရည်အချင်းတွေ ဆက်စပ်မှုကို ခွဲခြမ်းရင် သုံးပါတယ်။

တိုတိုပြောရရင် degree of freedom က အချက်အလက်တွေရဲ့ လွတ်လပ်မှုကိုတိုင်းပြီး ရလဒ်တွေရဲ့ ယုံကြည်ရမှု ကို မြှင့်ပေးပါတယ်။ အမျိုးမျိုးသော test တွေမှာ တွက်ပုံ ကွဲပြားပေမဲ့ ရည်ရွယ်ချက်က တူညီပါတယ်၊ ရလဒ်တွေ ကို မှန်ကန်စွာ အဓိပ္ပာယ် ဖွင့်နိုင်ဖို့ပါ။ သုတေသီတစ်ယောက်အနေနဲ့ ဒီအယူအဆကို နားလည်ရင် သုတေသန ရလဒ်တွေရဲ့ အရည်အသွေးကို မြှင့်နိုင်ပါတယ်။

နပေတိုး

မှားရင် ပြင်ပေးခဲ့ကြပါခဗျ။ စိတ်သဘောရိုးနဲ့ ပြောတာပါ။

Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Discover more from naywinaung

Leave a Reply Cancel reply

Related Post

ငွေပေးချေပုံစံ (Payment Models)ငွေပေးချေပုံစံ (Payment Models)

Qualitative Research တစ်ခု ဘယ်လိုရေးသားကြမလဲQualitative Research တစ်ခု ဘယ်လိုရေးသားကြမလဲ

Quota SamplingQuota Sampling