naywinaung blog,statistics Degree of freedom

Degree of freedom

degree of freedom အကြောင်း နားလည်သလောက်

ကျွန်တော်လေးစားရတဲ့ ဆရာတွေက လာမေးထားတော့ နားလည်သလောက်လေး ပြန်ရေးပြတာပါ။ မှားချင်လည်း မှားနိုင်ပါတယ်။ ကျွန်တော်က လေ့လာနေဆဲပါ။ တကယ်လို့ ကျွန်တော် မှတ်ထားတာလေးတွေ မှန်နေရင်လည်း ဝမ်းသာရမှာ ဖြစ်သလို၊ မှားနေခဲ့ရင်လည်း ပြင်ဆင်ပေးခဲ့ကြပါခဗျ။ ပြန်ဖတ်ရမှာပေါ့။ ကျွန်တော်အတွက် ဘာဖြစ်ဖြစ် အကျိုးရှိပါတယ်။

စာရင်းအင်းပညာ မှာ degree of freedom ဆိုတာကို တွက်ချက်ကြရမှာဖြစ်ပါတယ်။ df ဆိုတာ အချက်အလက်တွေရဲ့ လွတ်လပ်မှုကို တိုင်းတာတဲ့ အယူအဆ တစ်ခု ဖြစ်ပါတယ်။ သုတေသီတစ်ယောက်အနေနဲ့ အချက်အလက်တွေ ခွဲခြမ်း စိတ်ဖြာရင် ဒါက မရှိမဖြစ်ပါ၊ df က ရလဒ်တွေရဲ့ ယုံကြည်ရမှုကို ဆုံးဖြတ်ပေးပါတယ်။

Degree of freedom ဆိုတာ ဘာလဲ၊ ဘယ်လို တွက်ရလဲ ဆိုရင်၊ (data set) အချက်အလက်အစုတစ်ခု မှာ လွတ်လပ်စွာ ပြောင်းလဲနိုင်တဲ့ တန်ဖိုး တွေရဲ့ အရေအတွက်ကို ဆိုလိုပါတယ်။ အချက်အလက်တွေကို (analyze) ခွဲခြမ်းစိတ်ဖြာရင် တချို့ တန်ဖိုးတွေဟာ အခြားတန်ဖိုးတွေရဲ့  ချုပ်ချယ်မှုကို ခံရတတ်ပါတယ်။ ဥပမာပြောရရင်၊ အချက်အလက် n ခု ရှိတဲ့ နမူနာတစ်ခုရဲ့ ပျမ်းမျှတန်ဖိုး(Mean)ကို တွက်ရင်၊ တန်ဖိုး n-1 ခု ကို လွတ်လပ်စွာ ရွေးနိုင်တယ်၊ ဒါပေမဲ့ နောက်ဆုံး တန်ဖိုးတစ်ခုကိုတော့ မရွေးရဘူး။ ပျမ်းမျှမပြောင်းအောင် အလိုအလျောက် ဆုံးဖြတ် ချက်ချခြင်းဖြစ်ပါတယ်။ ဒါကြောင့် degree of freedom ကို df = n – 1 လို့ တွက်ပါတယ်။

ဒီ တွက်ချက်မှုကိုလုပ်ရတဲ့ အကြောင်းရင်းကတော့ ရလဒ်တွေရဲ့ ဘက်လိုက်မှုကို ရှောင်ဖို့ဖြစ်ပါတယ်။ မတွက်ရင် ရလဒ်တွေက အချက်အလက်တွေရဲ့ လွတ်လပ်မှုကို လျစ်လျူရှုပြီး အလွန်အကျွံတိကျဟန်ဆောင်နိုင်ပါတယ်။ ဥပမာ၊ လူ အရေအတွက် နည်းတဲ့ နမူနာတစ်ခုမှာ degree of freedom နည်းရင် ရလဒ်တွေမှားယွင်းမှုများနိုင်ပါတယ်။ သုတေသနမှာ ဒီ အယူအဆက ရလဒ်တွေရဲ့ ယုံကြည်ရမှုကို မြှင့်ပေးပါတယ်၊ hypothesis testing နဲ့ confidence interval တွေကို ပိုပြီး တိကျစေပါတယ်။

Statistical test တွေ မှာ degree of freedom က distribution တွေ ရဲ့ ပုံသဏ္ဌာန်ကို ဆုံးဖြတ်ပေးပါတယ်။ ဥပမာ၊ t-distribution မှာ degree of freedom နည်းရင် ရလဒ်တွေရဲ့ မသေချာမှု အပိုင်းက ကျယ်ပါတယ်။ ဒီ အချက်က ရလဒ်တွေ ကို လက်ခံ/လက်မခံ ဆုံးဖြတ်ရာမှာ အရေးပါပါတယ်။

နောက်တစ်ခု က ဘက်လိုက်မှု ရှောင်တာပါ။ နမူနာ အချက်အလက်တွေ ကနေ လူဦးရေ တစ်ခုလုံးကို ခန့်မှန်းရင် degree of freedom မတွက်တဲ့အခါ ရလဒ်တွေက အလွန်အကျွံ တိကျဟန်ဆောင်နိုင်ပါတယ်။ ဥပမာ၊ ဆေးပညာ သုတေသနမှာ ဆေးအသစ်တစ်မျိုးရဲ့ ထိရောက်မှုကို စမ်းရင် degree of freedom နည်းရင် ရလဒ်တွေက မှား ယွင်းမှု များနိုင်ပါတယ်။

နောက်တစ်ချက်က df က statistical power မြှင့်ပေးပါတယ်။ နမူနာ အရွယ်အစားကြီးရင် degree of freedom များတယ်၊ ရလဒ်တွေ ယုံကြည်ရမှု ပိုလာပါတယ်။ သုတေသီတွေက ဒီ အချက်ကို သုံးပြီး နမူနာ အရွယ်အစားကို ကြိုတင် ဆုံးဖြတ်နိုင်ပါတယ်။

df (degree of freedom) နဲ့ precision နဲ့ critical value တွေဟာ ဆက်စပ်နေပါတယ်။

Precision ဆိုတာက တွက်ထားတဲ့အဖြေ (ဥပမာ ပျမ်းမျှ၊ ကွဲပြားမှု စတာ) ဘယ်လောက် ယုံကြည်ရလဲ၊ အမှန်တကယ် တန်ဖိုးနဲ့ ဘယ်လောက် နီးစပ်နိုင်လဲ ဆိုတာပါ။ df က ဒီ တိကျမှုကို တိုက်ရိုက် ထိန်းပေး နိုင်ပါတယ်။ df များရင် (နမူနာ အရေအတွက် များရင်) လွတ်လပ်တဲ့အချက်အလက်များပါတယ်။ ဒါကြောင့် အချက်အလက်တွေရဲ့ သတင်းအချက်အလက် ပိုများပါတယ်။ တွက်ထားတဲ့ ပျမ်းမျှ ဒါမှမဟုတ် ကွဲပြားမှု စတာတွေက ပိုတိကျလာပါတယ်။ Standard error သေးလာပါတယ်၊ confidence interval ကျဉ်းလာပါတယ်။ ရလဒ်က ယုံကြည်ရမှု ပိုလာပါတယ်။ df နည်းရင် (နမူနာ နည်းရင်) လွတ်လပ်တဲ့ အချက် နည်းပါတယ်။ ဒါကြောင့် ရလဒ်က မသေချာမှု ပိုလာပါတယ်။ Standard error ကြီးလာပါတယ်၊ confidence interval ကျယ်လာပါတယ်။ precision နည်းသွားပါတယ်။

ဥပမာ ပြောရရင်၊ လူ ၁၀ ယောက်ရဲ့ အလေးချိန်ပျမ်းမျှ တွက်ရင် df = 9 ပဲ။ လူ ၁၀၀ ယောက် ဆို df = 99 ဖြစ်သွားပါတယ်။ df ၉၉ ဆို ပျမ်းမျှတန်ဖိုးက အမှန်တကယ် လူဦးရေပျမ်းမျှနဲ့ ပိုနီးစပ်ပါတယ်၊ အမှား အလားအလာ နည်းပါတယ်။ ဒါကြောင့် df က precision ရဲ့ အဓိက အချက်တစ်ခု လို့ဆိုလိုကြတာပါ။

Critical value ဆိုတာကတော့ hypothesis testing မှာ test statistic (ဥပမာ t တန်ဖိုး၊ chi-square တန်ဖိုး) က ဘယ်လောက်ကြီးရင် null hypothesis ကို ပယ်ချရမလဲ ဆိုတဲ့ အတိုင်းအတာကို ပြောတာပါ။ df က ဒီ critical value ကို တိုက်ရိုက် ဆုံးဖြတ်ပေးပါတယ်၊ distribution ရဲ့ ပုံစံကို df က ပြောင်းပေးလို့ ပါ။

t-test မှာ df နည်းရင် t-distribution က အမြီးပိုင်း (tail) ကျယ်ပါတယ်၊ ပိုပြီး leptokurtic ဖြစ်ပါတယ် (အစွန်း တန်ဖိုးတွေ ပိုများတယ်) ။ ဒါကြောင့် critical value က ပိုကြီးပါတယ် (ဥပမာ df=5 ဆို two-tailed α=0.05 မှာ critical t ≈ ±2.57၊ df=30 ဆို ±2.04 ပဲ ဖြစ်သွားပါတယ်) ။ df များလာ ရင် t-distribution က normal distribution နဲ့ ပိုနီးလာပါတယ်၊ critical value က သေးလာပါတယ်။
Chi-square test မှာတော့ df များလာ ရင် chi-square distribution ရဲ့ mean က df နဲ့ ညီပါတယ်၊ variance က 2×df ဖြစ်ပါတယ်။ ဒါကြောင့် distribution က ပိုကျယ်လာပါတယ်၊ critical value က ပိုကြီး လာပါတယ် (ဥပမာ df=1 ဆို α=0.05 မှာ critical value ≈ 3.84၊ df=10 ဆို ≈ 18.31 ဖြစ် သွား တယ်) ။ ဆိုလိုတာက တူညီတဲ့ ကွဲပြားမှု ပမာဏမှာ df များရင် ပိုကြီးတဲ့ chi-square တန်ဖိုး လိုအပ်လာပါတယ်။ ဒါပေမဲ့ စမ်းသပ်မှု ရလဒ်ကို ရှာနေတာမို့ အဖြေဟာ ပိုပြီးတိကျလာမှာ ဖြစ်ပါတယ်။

Chi-square test မှာ degree of freedom ကို df = (r – 1) × (c – 1) လို့ တွက်ပါတယ်၊ r က ဇယား ရဲ့ အတန်း အရေအတွက်၊ c က အတိုင် အရေအတွက်ဖြစ်ပါတယ်။ ဒီ df ကို သုံး ပြီး chi-square distribution ဇယားကနေ critical value ရှာပါတယ်၊ ရလဒ် တန်ဖိုးကြီး ရင် null hypothesis ကို ပယ်ချပါတယ်။ ဥပမာ၊ ကျားမ ခွဲခြား မှု နဲ့ အလုပ် အမျိုးအစား ဆက်စပ်မှုစစ်ရင် 2×3 ဇယား ဆို df = (2-1)×(3-1) = 2 ပါ။ ဒီ နည်းက ရလဒ်တွေကို မှန်ကန် စွာ အဓိပ္ပာယ်ဖွင့်နိုင်ဖို့ အတွက် ကူညီပေးပါတယ်။

t-test မှာ နမူနာတစ်ခု အတွက် df = n – 1 ပါ၊ n က နမူနာ အရေအတွက်။ နမူနာနှစ်ခု အတွက် independent t-test မှာ df = n₁ + n₂ – 2 ပါ။ ဒီ df ကို သုံး ပြီး t-distribution ကနေ critical value ရှာပါတယ်၊ ပျမ်းမျှတန်ဖိုး တွေ ကွဲလွဲမှု ရှိ/မရှိ ဆုံးဖြတ်ပါတယ်။ ဥပမာ၊ ဆေး နှစ်မျိုး ရဲ့ ထိရောက်မှု ကို နှိုင်းရင် သုံးပါတယ်။

ANOVA ဆိုတာ အုပ်စု များစွာရဲ့ ပျမ်းမျှ တန်ဖိုးတွေကိုနှိုင်း ရတဲ့ နည်းဖြစ်တဲ့အတွက် ဒီမှာ degree of freedom ကို ခွဲ တွက်ရပါတယ်၊ between-groups df = k – 1၊ k က အုပ်စု အရေအတွက်၊ within-groups df = N – k၊ N က စုစု ပေါင်း နမူနာ အရေအတွက်၊ total df = N – 1 ပါပဲ။ ဒီ df တွေ ကို သုံး ပြီး F-statistic တွက်ပါတယ်၊ အုပ်စုတွေမှာ ကွဲလွဲမှု ရှိ/မရှိ စစ်ဆေးပါတယ်။ ဥပမာ၊ ကျောင်းသား အုပ်စုတွေရဲ့ စာမေးပွဲရမှတ်တွေကို နှိုင်းရင် သုံးပါတယ်။

F-test မှာ မတူတဲ့ အုပ်စုနှစ်ခုရဲ့ variance တွေကို နှိုင်းပါတယ်။ အဲ့ဒါကြောင့် df ကို numerator df = n₁ – 1 နဲ့ denominator df = n₂ – 1 လို့ ခွဲ တွက်ပါတယ်။ F-distribution ကနေ critical value ရှာပါတယ်၊ variance တွေ တူ/မတူ ဆုံးဖြတ်ပါတယ်။ ဥပမာ၊ စက်ရုံ နှစ်ခု ရဲ့ ထုတ်ကုန် အရည်အသွေး ကွဲလွဲမှုကို စစ်ရင် သုံးပါတယ်။

Regression analysis မှာ linear regression ဆို df = n – p – 1 ဖြစ်ပါတယ်၊ p က predictor variable တွေ ရဲ့ အရေအတွက်ပါ။ ဒီ df ကို သုံး ပြီး model ရဲ့ ကိုက်ညီမှုကို စစ်ပါတယ်။ ဥပမာ၊ လခတွေ နဲ့ ပညာအရည်အချင်းတွေ ဆက်စပ်မှုကို ခွဲခြမ်းရင် သုံးပါတယ်။

တိုတိုပြောရရင် degree of freedom က အချက်အလက်တွေရဲ့ လွတ်လပ်မှုကိုတိုင်းပြီး ရလဒ်တွေရဲ့ ယုံကြည်ရမှု ကို မြှင့်ပေးပါတယ်။ အမျိုးမျိုးသော test တွေမှာ တွက်ပုံ ကွဲပြားပေမဲ့ ရည်ရွယ်ချက်က တူညီပါတယ်၊ ရလဒ်တွေ ကို မှန်ကန်စွာ အဓိပ္ပာယ် ဖွင့်နိုင်ဖို့ပါ။ သုတေသီတစ်ယောက်အနေနဲ့ ဒီအယူအဆကို နားလည်ရင် သုတေသန ရလဒ်တွေရဲ့ အရည်အသွေးကို မြှင့်နိုင်ပါတယ်။

နပေတိုး

မှားရင် ပြင်ပေးခဲ့ကြပါခဗျ။ စိတ်သဘောရိုးနဲ့ ပြောတာပါ။


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

EHEALTH ArchitectureEHEALTH Architecture

#eHealth#Architecture     အရင်အပတ်တွေက eHealth Model တွေအကြောင်းကို အကြမ်းဖျဉ်းရေးခဲ့ပါတယ်။ ကျန်တဲ့ model တွေကို ဆက်မရေးတော့ပါဘူး။ အားလုံးပဲ မိမိတို့ စိတ်ဝင်စားရင် ရှာဖတ်နိုင်ပါတယ်။ ဒါမှမဟုတ် ကျွန်တော့်ထံ email ပို့ပြီး ဆက်သွယ်နိုင်ပါတယ်။အခု ဆက်ပြီးရေးသားချင်တာက eHealth Architecture တွေပဲဖြစ်ပါတယ်။ Architecture တွေအကြောင်းကို မပြောခင် ဘာကြောင့် Architecture တွေက အရေးကြီးသလဲ

Systematic Random SamplingSystematic Random Sampling

Systematic Random Sampling Systematic Random Sampling ဆိုတာ Population တစ်ခုလုံးကို စနစ်တကျနဲ့ ကျပန်းရွေးချယ်တဲ့ နည်းလမ်းတစ်ခုဖြစ်ပါတယ်။ Simple Random Sampling နဲ့မတူတာက ဒီနည်းလမ်းမှာ ပထမဦးဆုံး Sample ကို ကျပန်းရွေးချယ်ပြီး ကျန်တဲ့ Sample တွေကို ပုံသေ Interval (ကြားကာလ) တစ်ခုနဲ့ ရွေးချယ်သွားတာပါ။ Systematic

Statistics သမိုင်းကြောင်းStatistics သမိုင်းကြောင်း

စာရင်းအင်းပညာ (Statistics) ရဲ့ သမိုင်းကြောင်း စာရင်းအင်းပညာဟာ ရှေးခေတ်ကတည်းက အသုံးပြုခဲ့၊ အသုံးဝင်ခဲ့ပါတယ်။ ကနဦးမှာ တိုင်းပြည်ရဲ့ လူဦးရေ၊ ငွေကြေး၊ စစ်အင်အား စတဲ့ အချက်အလက်တွေကို စုစည်းပြီး စီမံခန့်ခွဲဖို့အတွက် အသုံးပြုခဲ့ပါတယ်။ မီဆိုပိုတေးမီးယား၊ အီဂျစ်၊ ရောမ စသည့် ရှေးဟောင်းနိုင်ငံတွေမှာ တိုင်းရင်းစုစာရင်း၊ ကုန်ပစ္စည်းစာရင်း တွေကို ပြုစုခဲ့ကြပါတယ်။ အထူးသဖြင့် မီဆိုပိုတေးမီးယားမှာ ဘုရားရှိခိုးကျောင်းတွေက