naywinaung blog,statistics residual analysis

residual analysis

မနေ့က ရေးခဲ့တဲ့ regression အကြောင်း နည်းနည်း ဆက်ပွားကြည့်ကြရအောင်ဗျာ
residual analysis

Regression analysis မှာ residual analysis ဆိုတာရှိပါတယ်။ Residual ဆိုတာက ရိုးရိုးရှင်းရှင်း ပြောရရင် observed value (တကယ့် ဒေတာ y) နဲ့ predicted value (model က ခန့်မှန်းထားတဲ့ ŷ) ကြားက ကွာခြားချက်ကို ဆိုလိုတာပါ။

Residual = Observed – Predicted
ဒါမှမဟုတ် e = y – ŷ

ဒီ residual တွေကို စမ်းသပ်ရတာ (residual diagnostics) က မော်ဒယ်ရဲ့ အဓိက assumptions တွေ မှန်မမှန် စစ်ဖို့ဖြစ်ပါတယ်။ အဲဒီ assumptions တွေ ချိုးဖောက်ခဲ့ရင် ရလဒ်တွေက ယုံကြည်ရမှု နည်းသွားနိုင်လို့ပါ။ အဓိက စစ်ရတဲ့ assumptions တွေကတော့

1. Linearity 
   Independent variable (X) နဲ့ dependent variable (Y ) ကြားက ဆက်စပ်မှုက linear ဖြစ်ရမယ်။ ဆိုလိုတာ ပုံစံ က တည့်တည့် လိုင်းနဲ့ ဖော်ပြနိုင်ရမယ်။ Residual vs Fitted plot ကြည့်ရင် ပုံစံ မရှိဘဲ random ပဲ ဖြစ်နေရမယ်။ အကယ်၍ ကွေ့ညွတ်နေတယ်၊ လှိုင်းလုံးလို ဖြစ်နေတယ်ဆိုရင် linearity မရှိဘူး ဆိုတာကို သိနိုင်ပါတယ်။

2. Independence 
   Residual တစ်ခုနဲ့ တစ်ခု ဆက်စပ်မှု မရှိရဘူး။ အချိန်စီးရီး ဒေတာ မှာ အဖြစ်များပါတယ်။ ဥပမာ ယနေ့ residual ကြီးရင် မနက်ဖြန် residual လည်း ကြီးနေတတ်တယ် (autocorrelation)။ Durbin-Watson test နဲ့ စစ်ကြပါတယ်။ independence မရှိရင် မော်ဒယ်ရဲ့ standard error တွေက မမှန်နိုင်ပါဘူး။

3. Homoscedasticity (ဒါမှမဟုတ် constant variance) 
   Residual တွေရဲ့ variance က တစ်ပုံစံတည်း ရှိရပါမယ်။ ဆိုလိုတာက predicted value နည်းနည်းလေးပဲဖြစ်စေ၊ အများကြီးပဲဖြစ်စေ residual တွေရဲ့ ပျံ့နှံ့မှုက အတူတူပဲ ဖြစ်ရပါမယ်။ Residual vs Fitted plot မှာ ပုံစံ မရှိဘဲ အဆက်မပြတ် ပျံ့နေရပါမယ်။ အကယ်၍ ပုံစံ က funnel shape ဆိုရင် heteroscedasticity ရှိနေပါတယ်။ Breusch-Pagan test နဲ့ စစ်ကြပါတယ်။ homoscedasticity မရှိရင် coefficient တွေ ရဲ့ significance ကို စမ်းတဲ့ အခါ မှားနိုင်ပါတယ်။

4. Normality 
   Residual တွေ က normal distribution ဖြစ်ရပါမယ် (mean ≈ 0 နဲ့ symmetric)။ ဒါ မှ ကျွန်တော်တို့ သုံးတဲ့ t-test, F-test, confidence interval တွေ ယုံကြည်လို့ရပါမယ်။ QQ-plot ကြည့်ရင် အမှတ်တွေ တည့်တည့် လိုင်းပေါ်မှာ ရှိနေရပါမယ်။ Shapiro-Wilk test လည်း သုံးနိုင်ပါတယ်။ မမှန်ရင် အထူးသဖြင့် sample size နည်းတဲ့ အခါ ရလဒ်တွေ မတိကျနိုင်ပါဘူး။

ဒီ assumptions တွေ စစ်ဖို့အတွက် residual တွေကို အဓိက သုံးရပါတယ်။ ဘာလို့လဲ ဆိုတော့ residual က မော်ဒယ်က မဖမ်းမိတဲ့ အပိုင်း ဖြစ်နေလို့ပါပဲ။ ဒါကြောင့် residual plot တွေ (Residuals vs Fitted, Scale-Location, QQ-plot, Residuals vs Leverage စသဖြင့်) ကြည့်ပြီး မော်ဒယ်က ကျန်းမာရဲ့လား ဆိုတာ စစ်ရပါတယ်။

အကယ်၍ ချို့ယွင်းချက် တွေ့ရင် ဘာလုပ်လို့ ရလဲ။ 
– Data ကို transform လုပ်လို့ရပါတယ် (log, square root စသဖြင့်) 
– Outlier တွေ ဖယ်ထုတ်နိုင်ပါတယ် ဒါမှမဟုတ် ပြင်နိုင်ပါတယ် 
– အခြား model သုံးလို့ရပါတယ် (robust regression, generalized linear model စသဖြင့်)

အတိုချုပ်ဆို residual testing ဆိုတာ မော်ဒယ်ရဲ့ အမှားတွေ ကို စစ်ဆေးပြီး ယုံကြည်စိတ်ချရတဲ့ ရလဒ်တွေ ရဖို့ လုပ်တာပဲဖြစ်ပါတယ်။

နပေတိုး
မြန်မာပြည်တက္ကသိုလ်တစ်ခုက သုတေသနလေ့လာနေသူ ကျောင်းသား
အဟေဟေ


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

DMAICDMAIC

#DMAIC#Processမည်သည့် ကုန်ထုတ်လုပ်မှုနှင့် ဝန်ဆောင်မှုမျိုးမဆို စဉ်ဆက်မပြတ် တိုးတက်နေဖို့ လိုအပ်ပါတယ်။ ဒီလို ဖွံ့ဖြိုးတိုးတက်မှုမျိုးကို ရရှိစေဖို့ဆိုရင် Input, process, output မှန်ကန်နေဖို့လိုအပ်ပါတယ်။ တကယ်လို့ လုပ်ငန်းစဉ်ထဲမှာ ချို့ယွင်းချက်တွေရှိနေခဲ့ရင် ဖွံ့ဖြိုးတိုးတက်မှုတွေက တုံ့နှေးသွားလေ့ရှိပါတယ်။ ဒါကြောင့် DMAIC Model ကို အသုံးပြုကြလေ့ရှိပါတယ်။ ဒါကြောင့် ဗဟုသုတအနေနှင့် DMAIC မော်ဒယ် (DMAIC Model) အကြောင်းကို

eHealth M_Zawisza_Business_ModeleHealth M_Zawisza_Business_Model

#eHealth#M_Zawisza_Business_Modelehealth နှင့်ပတ်သက်တဲ့ model တွေကို ရှေ့ပိုင်းမှာ ရှင်းပြခဲ့ပါတယ်။ အခုရေးသားမဲ့ business model ကတော့ နိုင်ငံတကာ ကုမ္ပဏီတော်တော်များများမှာ အသုံးများတဲ့ Enterprise Model တစ်ခုပဲဖြစ်ပါတယ်။ ဒီModel မှာတော့ အစိတ်အပိုင်း ကိုးခုပါဝင်ပါတယ်။အဲ့ဒါတွေကတော့၁။ Key Partners ( မိတ်ဖက်အဖွဲ့အစည်းများ)၂။ Key Activities ( ပင်မလုပ်ငန်းဆောင်ရွက်မှုများ)၃။ Key Resources

Chapter 2 Literature Review ကို ဘယ်လိုရေးရမလဲChapter 2 Literature Review ကို ဘယ်လိုရေးရမလဲ

Literature Review ဆိုတာက သုတေသနနဲ့ သက်ဆိုင်တဲ့ အရင်က ထွက်ထားတဲ့ စာအုပ်တွေ၊ ဂျာနယ်စာတမ်းတွေ၊ ကွန်ဖရင့် စာတမ်းတွေ၊ ဒါမှမဟုတ် အခြား ယုံကြည်စိတ်ချရတဲ့ အရင်းအမြစ်တွေကို စနစ်တကျ စုစည်း၊ တင်ပြ၊ ဆန်းစစ်၊ ဝေဖန်သုံးသပ်ပြီး သုတေသနရဲ့ နေရာချထားမှု (position) ကို ရှင်းရှင်းလင်းလင်း ပြသတဲ့ အခန်းဖြစ်ပါတယ်။ ဒီအခန်းက သုတေသန ဘယ်လောက်