naywinaung blog,statistics Degree of freedom

Degree of freedom

degree of freedom အကြောင်း နားလည်သလောက်

ကျွန်တော်လေးစားရတဲ့ ဆရာတွေက လာမေးထားတော့ နားလည်သလောက်လေး ပြန်ရေးပြတာပါ။ မှားချင်လည်း မှားနိုင်ပါတယ်။ ကျွန်တော်က လေ့လာနေဆဲပါ။ တကယ်လို့ ကျွန်တော် မှတ်ထားတာလေးတွေ မှန်နေရင်လည်း ဝမ်းသာရမှာ ဖြစ်သလို၊ မှားနေခဲ့ရင်လည်း ပြင်ဆင်ပေးခဲ့ကြပါခဗျ။ ပြန်ဖတ်ရမှာပေါ့။ ကျွန်တော်အတွက် ဘာဖြစ်ဖြစ် အကျိုးရှိပါတယ်။

စာရင်းအင်းပညာ မှာ degree of freedom ဆိုတာကို တွက်ချက်ကြရမှာဖြစ်ပါတယ်။ df ဆိုတာ အချက်အလက်တွေရဲ့ လွတ်လပ်မှုကို တိုင်းတာတဲ့ အယူအဆ တစ်ခု ဖြစ်ပါတယ်။ သုတေသီတစ်ယောက်အနေနဲ့ အချက်အလက်တွေ ခွဲခြမ်း စိတ်ဖြာရင် ဒါက မရှိမဖြစ်ပါ၊ df က ရလဒ်တွေရဲ့ ယုံကြည်ရမှုကို ဆုံးဖြတ်ပေးပါတယ်။

Degree of freedom ဆိုတာ ဘာလဲ၊ ဘယ်လို တွက်ရလဲ ဆိုရင်၊ (data set) အချက်အလက်အစုတစ်ခု မှာ လွတ်လပ်စွာ ပြောင်းလဲနိုင်တဲ့ တန်ဖိုး တွေရဲ့ အရေအတွက်ကို ဆိုလိုပါတယ်။ အချက်အလက်တွေကို (analyze) ခွဲခြမ်းစိတ်ဖြာရင် တချို့ တန်ဖိုးတွေဟာ အခြားတန်ဖိုးတွေရဲ့  ချုပ်ချယ်မှုကို ခံရတတ်ပါတယ်။ ဥပမာပြောရရင်၊ အချက်အလက် n ခု ရှိတဲ့ နမူနာတစ်ခုရဲ့ ပျမ်းမျှတန်ဖိုး(Mean)ကို တွက်ရင်၊ တန်ဖိုး n-1 ခု ကို လွတ်လပ်စွာ ရွေးနိုင်တယ်၊ ဒါပေမဲ့ နောက်ဆုံး တန်ဖိုးတစ်ခုကိုတော့ မရွေးရဘူး။ ပျမ်းမျှမပြောင်းအောင် အလိုအလျောက် ဆုံးဖြတ် ချက်ချခြင်းဖြစ်ပါတယ်။ ဒါကြောင့် degree of freedom ကို df = n – 1 လို့ တွက်ပါတယ်။

ဒီ တွက်ချက်မှုကိုလုပ်ရတဲ့ အကြောင်းရင်းကတော့ ရလဒ်တွေရဲ့ ဘက်လိုက်မှုကို ရှောင်ဖို့ဖြစ်ပါတယ်။ မတွက်ရင် ရလဒ်တွေက အချက်အလက်တွေရဲ့ လွတ်လပ်မှုကို လျစ်လျူရှုပြီး အလွန်အကျွံတိကျဟန်ဆောင်နိုင်ပါတယ်။ ဥပမာ၊ လူ အရေအတွက် နည်းတဲ့ နမူနာတစ်ခုမှာ degree of freedom နည်းရင် ရလဒ်တွေမှားယွင်းမှုများနိုင်ပါတယ်။ သုတေသနမှာ ဒီ အယူအဆက ရလဒ်တွေရဲ့ ယုံကြည်ရမှုကို မြှင့်ပေးပါတယ်၊ hypothesis testing နဲ့ confidence interval တွေကို ပိုပြီး တိကျစေပါတယ်။

Statistical test တွေ မှာ degree of freedom က distribution တွေ ရဲ့ ပုံသဏ္ဌာန်ကို ဆုံးဖြတ်ပေးပါတယ်။ ဥပမာ၊ t-distribution မှာ degree of freedom နည်းရင် ရလဒ်တွေရဲ့ မသေချာမှု အပိုင်းက ကျယ်ပါတယ်။ ဒီ အချက်က ရလဒ်တွေ ကို လက်ခံ/လက်မခံ ဆုံးဖြတ်ရာမှာ အရေးပါပါတယ်။

နောက်တစ်ခု က ဘက်လိုက်မှု ရှောင်တာပါ။ နမူနာ အချက်အလက်တွေ ကနေ လူဦးရေ တစ်ခုလုံးကို ခန့်မှန်းရင် degree of freedom မတွက်တဲ့အခါ ရလဒ်တွေက အလွန်အကျွံ တိကျဟန်ဆောင်နိုင်ပါတယ်။ ဥပမာ၊ ဆေးပညာ သုတေသနမှာ ဆေးအသစ်တစ်မျိုးရဲ့ ထိရောက်မှုကို စမ်းရင် degree of freedom နည်းရင် ရလဒ်တွေက မှား ယွင်းမှု များနိုင်ပါတယ်။

နောက်တစ်ချက်က df က statistical power မြှင့်ပေးပါတယ်။ နမူနာ အရွယ်အစားကြီးရင် degree of freedom များတယ်၊ ရလဒ်တွေ ယုံကြည်ရမှု ပိုလာပါတယ်။ သုတေသီတွေက ဒီ အချက်ကို သုံးပြီး နမူနာ အရွယ်အစားကို ကြိုတင် ဆုံးဖြတ်နိုင်ပါတယ်။

df (degree of freedom) နဲ့ precision နဲ့ critical value တွေဟာ ဆက်စပ်နေပါတယ်။

Precision ဆိုတာက တွက်ထားတဲ့အဖြေ (ဥပမာ ပျမ်းမျှ၊ ကွဲပြားမှု စတာ) ဘယ်လောက် ယုံကြည်ရလဲ၊ အမှန်တကယ် တန်ဖိုးနဲ့ ဘယ်လောက် နီးစပ်နိုင်လဲ ဆိုတာပါ။ df က ဒီ တိကျမှုကို တိုက်ရိုက် ထိန်းပေး နိုင်ပါတယ်။ df များရင် (နမူနာ အရေအတွက် များရင်) လွတ်လပ်တဲ့အချက်အလက်များပါတယ်။ ဒါကြောင့် အချက်အလက်တွေရဲ့ သတင်းအချက်အလက် ပိုများပါတယ်။ တွက်ထားတဲ့ ပျမ်းမျှ ဒါမှမဟုတ် ကွဲပြားမှု စတာတွေက ပိုတိကျလာပါတယ်။ Standard error သေးလာပါတယ်၊ confidence interval ကျဉ်းလာပါတယ်။ ရလဒ်က ယုံကြည်ရမှု ပိုလာပါတယ်။ df နည်းရင် (နမူနာ နည်းရင်) လွတ်လပ်တဲ့ အချက် နည်းပါတယ်။ ဒါကြောင့် ရလဒ်က မသေချာမှု ပိုလာပါတယ်။ Standard error ကြီးလာပါတယ်၊ confidence interval ကျယ်လာပါတယ်။ precision နည်းသွားပါတယ်။

ဥပမာ ပြောရရင်၊ လူ ၁၀ ယောက်ရဲ့ အလေးချိန်ပျမ်းမျှ တွက်ရင် df = 9 ပဲ။ လူ ၁၀၀ ယောက် ဆို df = 99 ဖြစ်သွားပါတယ်။ df ၉၉ ဆို ပျမ်းမျှတန်ဖိုးက အမှန်တကယ် လူဦးရေပျမ်းမျှနဲ့ ပိုနီးစပ်ပါတယ်၊ အမှား အလားအလာ နည်းပါတယ်။ ဒါကြောင့် df က precision ရဲ့ အဓိက အချက်တစ်ခု လို့ဆိုလိုကြတာပါ။

Critical value ဆိုတာကတော့ hypothesis testing မှာ test statistic (ဥပမာ t တန်ဖိုး၊ chi-square တန်ဖိုး) က ဘယ်လောက်ကြီးရင် null hypothesis ကို ပယ်ချရမလဲ ဆိုတဲ့ အတိုင်းအတာကို ပြောတာပါ။ df က ဒီ critical value ကို တိုက်ရိုက် ဆုံးဖြတ်ပေးပါတယ်၊ distribution ရဲ့ ပုံစံကို df က ပြောင်းပေးလို့ ပါ။

t-test မှာ df နည်းရင် t-distribution က အမြီးပိုင်း (tail) ကျယ်ပါတယ်၊ ပိုပြီး leptokurtic ဖြစ်ပါတယ် (အစွန်း တန်ဖိုးတွေ ပိုများတယ်) ။ ဒါကြောင့် critical value က ပိုကြီးပါတယ် (ဥပမာ df=5 ဆို two-tailed α=0.05 မှာ critical t ≈ ±2.57၊ df=30 ဆို ±2.04 ပဲ ဖြစ်သွားပါတယ်) ။ df များလာ ရင် t-distribution က normal distribution နဲ့ ပိုနီးလာပါတယ်၊ critical value က သေးလာပါတယ်။
Chi-square test မှာတော့ df များလာ ရင် chi-square distribution ရဲ့ mean က df နဲ့ ညီပါတယ်၊ variance က 2×df ဖြစ်ပါတယ်။ ဒါကြောင့် distribution က ပိုကျယ်လာပါတယ်၊ critical value က ပိုကြီး လာပါတယ် (ဥပမာ df=1 ဆို α=0.05 မှာ critical value ≈ 3.84၊ df=10 ဆို ≈ 18.31 ဖြစ် သွား တယ်) ။ ဆိုလိုတာက တူညီတဲ့ ကွဲပြားမှု ပမာဏမှာ df များရင် ပိုကြီးတဲ့ chi-square တန်ဖိုး လိုအပ်လာပါတယ်။ ဒါပေမဲ့ စမ်းသပ်မှု ရလဒ်ကို ရှာနေတာမို့ အဖြေဟာ ပိုပြီးတိကျလာမှာ ဖြစ်ပါတယ်။

Chi-square test မှာ degree of freedom ကို df = (r – 1) × (c – 1) လို့ တွက်ပါတယ်၊ r က ဇယား ရဲ့ အတန်း အရေအတွက်၊ c က အတိုင် အရေအတွက်ဖြစ်ပါတယ်။ ဒီ df ကို သုံး ပြီး chi-square distribution ဇယားကနေ critical value ရှာပါတယ်၊ ရလဒ် တန်ဖိုးကြီး ရင် null hypothesis ကို ပယ်ချပါတယ်။ ဥပမာ၊ ကျားမ ခွဲခြား မှု နဲ့ အလုပ် အမျိုးအစား ဆက်စပ်မှုစစ်ရင် 2×3 ဇယား ဆို df = (2-1)×(3-1) = 2 ပါ။ ဒီ နည်းက ရလဒ်တွေကို မှန်ကန် စွာ အဓိပ္ပာယ်ဖွင့်နိုင်ဖို့ အတွက် ကူညီပေးပါတယ်။

t-test မှာ နမူနာတစ်ခု အတွက် df = n – 1 ပါ၊ n က နမူနာ အရေအတွက်။ နမူနာနှစ်ခု အတွက် independent t-test မှာ df = n₁ + n₂ – 2 ပါ။ ဒီ df ကို သုံး ပြီး t-distribution ကနေ critical value ရှာပါတယ်၊ ပျမ်းမျှတန်ဖိုး တွေ ကွဲလွဲမှု ရှိ/မရှိ ဆုံးဖြတ်ပါတယ်။ ဥပမာ၊ ဆေး နှစ်မျိုး ရဲ့ ထိရောက်မှု ကို နှိုင်းရင် သုံးပါတယ်။

ANOVA ဆိုတာ အုပ်စု များစွာရဲ့ ပျမ်းမျှ တန်ဖိုးတွေကိုနှိုင်း ရတဲ့ နည်းဖြစ်တဲ့အတွက် ဒီမှာ degree of freedom ကို ခွဲ တွက်ရပါတယ်၊ between-groups df = k – 1၊ k က အုပ်စု အရေအတွက်၊ within-groups df = N – k၊ N က စုစု ပေါင်း နမူနာ အရေအတွက်၊ total df = N – 1 ပါပဲ။ ဒီ df တွေ ကို သုံး ပြီး F-statistic တွက်ပါတယ်၊ အုပ်စုတွေမှာ ကွဲလွဲမှု ရှိ/မရှိ စစ်ဆေးပါတယ်။ ဥပမာ၊ ကျောင်းသား အုပ်စုတွေရဲ့ စာမေးပွဲရမှတ်တွေကို နှိုင်းရင် သုံးပါတယ်။

F-test မှာ မတူတဲ့ အုပ်စုနှစ်ခုရဲ့ variance တွေကို နှိုင်းပါတယ်။ အဲ့ဒါကြောင့် df ကို numerator df = n₁ – 1 နဲ့ denominator df = n₂ – 1 လို့ ခွဲ တွက်ပါတယ်။ F-distribution ကနေ critical value ရှာပါတယ်၊ variance တွေ တူ/မတူ ဆုံးဖြတ်ပါတယ်။ ဥပမာ၊ စက်ရုံ နှစ်ခု ရဲ့ ထုတ်ကုန် အရည်အသွေး ကွဲလွဲမှုကို စစ်ရင် သုံးပါတယ်။

Regression analysis မှာ linear regression ဆို df = n – p – 1 ဖြစ်ပါတယ်၊ p က predictor variable တွေ ရဲ့ အရေအတွက်ပါ။ ဒီ df ကို သုံး ပြီး model ရဲ့ ကိုက်ညီမှုကို စစ်ပါတယ်။ ဥပမာ၊ လခတွေ နဲ့ ပညာအရည်အချင်းတွေ ဆက်စပ်မှုကို ခွဲခြမ်းရင် သုံးပါတယ်။

တိုတိုပြောရရင် degree of freedom က အချက်အလက်တွေရဲ့ လွတ်လပ်မှုကိုတိုင်းပြီး ရလဒ်တွေရဲ့ ယုံကြည်ရမှု ကို မြှင့်ပေးပါတယ်။ အမျိုးမျိုးသော test တွေမှာ တွက်ပုံ ကွဲပြားပေမဲ့ ရည်ရွယ်ချက်က တူညီပါတယ်၊ ရလဒ်တွေ ကို မှန်ကန်စွာ အဓိပ္ပာယ် ဖွင့်နိုင်ဖို့ပါ။ သုတေသီတစ်ယောက်အနေနဲ့ ဒီအယူအဆကို နားလည်ရင် သုတေသန ရလဒ်တွေရဲ့ အရည်အသွေးကို မြှင့်နိုင်ပါတယ်။

နပေတိုး

မှားရင် ပြင်ပေးခဲ့ကြပါခဗျ။ စိတ်သဘောရိုးနဲ့ ပြောတာပါ။


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

Six_SigmaSix_Sigma

#Six_Sigmaဒီတစ်ခါ ညွှန်းချင်တဲ့စာအုပ်ကတော့ “Lean Six Sigma for the Healthcare Practice: A Pocket Guide” ဖြစ်ပြီး၊ Dr. Roderick A. Munro က ၂၀၀၉ ခုနှစ်မှာ ရေးသားထုတ်ဝေခဲ့တာပါ။ စာအုပ်ရဲ့ အဓိကရည်ရွယ်ချက်ကတော့ ကျန်းမာရေးစောင့်ရှောက်မှု လုပ်ငန်းစဉ်တွေကို စဉ်ဆက်မပြတ် တိုးတက်စေဖို့ (continual improvement) ပဲ

Cluster SamplingCluster Sampling

Cluster SamplingCluster Sampling ဆိုတာ လူအုပ်စုအကြီးကြီးကို လေ့လာချင်တဲ့အခါ သုံးတဲ့နည်းဖြစ်ပါတယ်။ ဒါပေမဲ့ လူတွေကို တစ်ယောက်ချင်းစီ မရွေးထုတ်ဘဲ အုပ်စုလိုက် ရွေးထုတ်တာကို Cluster Sampling လို့ခေါ်ပါတယ်။ အဲ့ဒီမှာ Cluster ဆိုတာက သဘာဝအလျောက် ဖြစ်နေတဲ့ အုပ်စုတွေကို ပြောတာ။ ဥပမာ… ကျောင်းတွေဆို အတန်းတွေက Cluster တွေပါပဲ။ ရွာတွေဆိုရင် အိမ်ထောင်စုတွေက

Resilient , Renovation and Reactivation of hospital after disasterResilient , Renovation and Reactivation of hospital after disaster

Resilient , Renovation and Reactivation of hospital after disaster ဒီအကြောင်းအရာဟာ ဆေးရုံတွေကို ဘေးအန္တရာယ်ခံနိုင်ရည်ရှိအောင် ပြန်လည်တည်ဆောက်တာ၊ ပြုပြင်တာနဲ့ ပြန်လည်လှုပ်ရှားတာဖြစ်တဲ့အတွက် ကမ္ဘာ့ကျန်းမာရေးအဖွဲ့အစည်း (WHO) နဲ့ နိုင်ငံတကာအဖွဲ့အစည်းတွေရဲ့ လမ်းညွှန်ချက်တွေ၊ သီအိုရီတွေအပေါ် အခြေခံပြီး ရိုးရိုးရှင်းရှင်းပဲ ရှင်းပြချင်ပါတယ်။Resilience (ခိုင်ခံ့မှု)ပထမဆုံးအနေနဲ့ Resilience (ခိုင်ခံ့မှု) အကြောင်း ပြန်ကြည့်ရအောင်။ ဒါက