naywinaung blog,statistics residual analysis

residual analysis

မနေ့က ရေးခဲ့တဲ့ regression အကြောင်း နည်းနည်း ဆက်ပွားကြည့်ကြရအောင်ဗျာ
residual analysis

Regression analysis မှာ residual analysis ဆိုတာရှိပါတယ်။ Residual ဆိုတာက ရိုးရိုးရှင်းရှင်း ပြောရရင် observed value (တကယ့် ဒေတာ y) နဲ့ predicted value (model က ခန့်မှန်းထားတဲ့ ŷ) ကြားက ကွာခြားချက်ကို ဆိုလိုတာပါ။

Residual = Observed – Predicted
ဒါမှမဟုတ် e = y – ŷ

ဒီ residual တွေကို စမ်းသပ်ရတာ (residual diagnostics) က မော်ဒယ်ရဲ့ အဓိက assumptions တွေ မှန်မမှန် စစ်ဖို့ဖြစ်ပါတယ်။ အဲဒီ assumptions တွေ ချိုးဖောက်ခဲ့ရင် ရလဒ်တွေက ယုံကြည်ရမှု နည်းသွားနိုင်လို့ပါ။ အဓိက စစ်ရတဲ့ assumptions တွေကတော့

1. Linearity 
   Independent variable (X) နဲ့ dependent variable (Y ) ကြားက ဆက်စပ်မှုက linear ဖြစ်ရမယ်။ ဆိုလိုတာ ပုံစံ က တည့်တည့် လိုင်းနဲ့ ဖော်ပြနိုင်ရမယ်။ Residual vs Fitted plot ကြည့်ရင် ပုံစံ မရှိဘဲ random ပဲ ဖြစ်နေရမယ်။ အကယ်၍ ကွေ့ညွတ်နေတယ်၊ လှိုင်းလုံးလို ဖြစ်နေတယ်ဆိုရင် linearity မရှိဘူး ဆိုတာကို သိနိုင်ပါတယ်။

2. Independence 
   Residual တစ်ခုနဲ့ တစ်ခု ဆက်စပ်မှု မရှိရဘူး။ အချိန်စီးရီး ဒေတာ မှာ အဖြစ်များပါတယ်။ ဥပမာ ယနေ့ residual ကြီးရင် မနက်ဖြန် residual လည်း ကြီးနေတတ်တယ် (autocorrelation)။ Durbin-Watson test နဲ့ စစ်ကြပါတယ်။ independence မရှိရင် မော်ဒယ်ရဲ့ standard error တွေက မမှန်နိုင်ပါဘူး။

3. Homoscedasticity (ဒါမှမဟုတ် constant variance) 
   Residual တွေရဲ့ variance က တစ်ပုံစံတည်း ရှိရပါမယ်။ ဆိုလိုတာက predicted value နည်းနည်းလေးပဲဖြစ်စေ၊ အများကြီးပဲဖြစ်စေ residual တွေရဲ့ ပျံ့နှံ့မှုက အတူတူပဲ ဖြစ်ရပါမယ်။ Residual vs Fitted plot မှာ ပုံစံ မရှိဘဲ အဆက်မပြတ် ပျံ့နေရပါမယ်။ အကယ်၍ ပုံစံ က funnel shape ဆိုရင် heteroscedasticity ရှိနေပါတယ်။ Breusch-Pagan test နဲ့ စစ်ကြပါတယ်။ homoscedasticity မရှိရင် coefficient တွေ ရဲ့ significance ကို စမ်းတဲ့ အခါ မှားနိုင်ပါတယ်။

4. Normality 
   Residual တွေ က normal distribution ဖြစ်ရပါမယ် (mean ≈ 0 နဲ့ symmetric)။ ဒါ မှ ကျွန်တော်တို့ သုံးတဲ့ t-test, F-test, confidence interval တွေ ယုံကြည်လို့ရပါမယ်။ QQ-plot ကြည့်ရင် အမှတ်တွေ တည့်တည့် လိုင်းပေါ်မှာ ရှိနေရပါမယ်။ Shapiro-Wilk test လည်း သုံးနိုင်ပါတယ်။ မမှန်ရင် အထူးသဖြင့် sample size နည်းတဲ့ အခါ ရလဒ်တွေ မတိကျနိုင်ပါဘူး။

ဒီ assumptions တွေ စစ်ဖို့အတွက် residual တွေကို အဓိက သုံးရပါတယ်။ ဘာလို့လဲ ဆိုတော့ residual က မော်ဒယ်က မဖမ်းမိတဲ့ အပိုင်း ဖြစ်နေလို့ပါပဲ။ ဒါကြောင့် residual plot တွေ (Residuals vs Fitted, Scale-Location, QQ-plot, Residuals vs Leverage စသဖြင့်) ကြည့်ပြီး မော်ဒယ်က ကျန်းမာရဲ့လား ဆိုတာ စစ်ရပါတယ်။

အကယ်၍ ချို့ယွင်းချက် တွေ့ရင် ဘာလုပ်လို့ ရလဲ။ 
– Data ကို transform လုပ်လို့ရပါတယ် (log, square root စသဖြင့်) 
– Outlier တွေ ဖယ်ထုတ်နိုင်ပါတယ် ဒါမှမဟုတ် ပြင်နိုင်ပါတယ် 
– အခြား model သုံးလို့ရပါတယ် (robust regression, generalized linear model စသဖြင့်)

အတိုချုပ်ဆို residual testing ဆိုတာ မော်ဒယ်ရဲ့ အမှားတွေ ကို စစ်ဆေးပြီး ယုံကြည်စိတ်ချရတဲ့ ရလဒ်တွေ ရဖို့ လုပ်တာပဲဖြစ်ပါတယ်။

နပေတိုး
မြန်မာပြည်တက္ကသိုလ်တစ်ခုက သုတေသနလေ့လာနေသူ ကျောင်းသား
အဟေဟေ


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

သုတေသနအမျိုးအစားများသုတေသနအမျိုးအစားများ

သုတေသနစာတမ်းများကို အမျိုးအစားခွဲခြားရာတွင် အမျိုးမျိုးခွဲခြားကြသော်လည်း အောက်ပါ အမျိုးအစားများမှာ အသုံးများသော သုတေသနအမျိုးအစားများ ဖြစ်ကြပါတယ်။1.APPLIED RESEARCH ( အသုံးချ သုတေသန)2.BASIC RESEARCH (အခြေခံသုတေသန)3.CORRELATIONAL RESEARCH(ဆက်နွယ်ပတ်သက်မှုဆိုင်ရာ သုတေသန)4.DESCRIPTIVE RESEARCH( ဖော်ညွှန်းပြ သုတေသန)5.ETHNOGRAPHIC RESEARCH( ရှေးဟောင်းယဉ်ကျေးမှုသုတေသန)6.EXPERIMENTAL RESEARCH( စမ်းသပ်စစ်ဆေးခြင်းသုတေသန)7.EXPLORATORY RESEARCH (ရေနံဓာတ်ငွေ့ရှာဖွေရေးသုတေသန)8.GROUNDED THEORY RESEARCH( မြေပြင်သုတေသန)9.HISTORICAL RESEARCH(သမိုင်းသုတေသန)10.PHENOMENOLOGICAL RESEARCH(ဖြစ်စဉ်သုတေသနပြုမှု)11.QUALITATIVE

Thesis စာတမ်းရဲ့ Chapter 1 ကို ဘယ်လိုရေးမလဲThesis စာတမ်းရဲ့ Chapter 1 ကို ဘယ်လိုရေးမလဲ

Rationale of the Study ရေးသားနည်း ၁။ ဘာကြောင့် ဒီလေ့လာမှုကို လုပ်ရမလဲဆိုတဲ့ အခြေခံအကြောင်းရင်းကို ဖော်ပြရပါမယ် ပထမဦးဆုံး လေ့လာမှုရဲ့ အရေးပါမှု၊ လိုအပ်မှုကို ရှင်းပြရမှာပါ။ လက်ရှိအခြေအနေမှာ ဘယ်လိုပြဿနာတွေရှိသလဲ၊ ဒီပြဿနာတွေက ဘယ်လိုအကျိုးဆက်တွေဖြစ်စေသလဲ၊ ဒီလေ့လာမှုက အဲဒီပြဿနာတွေကို ဘယ်လိုဖြေရှင်းနိုင်မလဲဆိုတာ ဖော်ပြရပါမယ်။ ဖော်ပြတဲ့အခါမှာ ကမ္ဘာ့အခြေအနေ၊ အရှေ့တောင်အာရှအခြေအနေ၊ မြန်မာ့ အခြေအနေ ဆိုပြီး

eHealth   (Five Cs Model)eHealth   (Five Cs Model)

eHealthFive Cs Modelဖွံဖြိုးဆဲနိုင်ငံတော်တော်များများမှာ ehealth ကိုစတင်အကောင်အထည်ဖော်ကြတဲ့အခါFive Cs Model ဟာ အလွန်ရေပန်းစားပါတယ်။5Cs ဆိုတာကတော့၁။ Contextဖွံ့ဖြိုးဆဲနိုင်ငံများအနေနှင့် သတင်းအချက်အလက်နှင့်ဆက်သွယ်ရေးဆိုင်ရာနည်းပညာ အတွက် အခြေခံအဆောက်အဉီများ ပြည့်စုံလုံလောက်မှုမရှိကြပါဘူး။ ဒီလိုအခြေအနေမျိုးမှာ မိမိတို့တည်ဆောက်ချင်တဲ့ ehealth အတွက် အသင့်တော်ဆုံးသော နည်းပညာရပ်ဝန်းကို ရွေးချယ်ရပါလိမ့်မယ်။ ကျေးလက်ဒေသများကို များများနှင့်မြန်မြန်ထိရောက်မဲ့ အသင့်တော်ဆုံးသော ဆက်သွယ်ရေးဆိုင်ရာနည်းပညာကို ရွေးချယ်ရပါမယ်။ ထို့အတူ ကုန်ကျစာရိတ်အလွန်ကြီးမားတဲ့ နည်းပညာဆိုင်ရာ