Cluster Sampling

Cluster Sampling

Cluster Sampling ဆိုတာ လူအုပ်စုအကြီးကြီးကို လေ့လာချင်တဲ့အခါ သုံးတဲ့နည်းဖြစ်ပါတယ်။ ဒါပေမဲ့ လူတွေကို တစ်ယောက်ချင်းစီ မရွေးထုတ်ဘဲ အုပ်စုလိုက် ရွေးထုတ်တာကို Cluster Sampling လို့ခေါ်ပါတယ်။

အဲ့ဒီမှာ Cluster ဆိုတာက သဘာဝအလျောက် ဖြစ်နေတဲ့ အုပ်စုတွေကို ပြောတာ။ ဥပမာ… ကျောင်းတွေဆို အတန်းတွေက Cluster တွေပါပဲ။ ရွာတွေဆိုရင် အိမ်ထောင်စုတွေက Cluster တွေပေါ့။

ဒါဆို Cluster Sampling ကို ဘယ်လိုလုပ်ရမလဲဆိုတာ မေးလာနိုင်တယ်။ လုပ်ရတာ လွယ်ပါတယ်။ ပထမဦးဆုံး ကိုယ်လေ့လာချင်တဲ့ လူအုပ်စုကို သတ်မှတ်လိုက်။ ပြီးရင် အဲ့ဒီလူအုပ်စုကို Cluster တွေအဖြစ် ခွဲထုတ်လိုက်။ ပြီးတော့ Cluster တွေထဲကနေ တချို့ကို ကျပန်းရွေးထုတ်လိုက်။ နောက်ဆုံး ရွေးထားတဲ့ Cluster ထဲက လူတွေဆီကနေ လိုအပ်တဲ့ Data တွေကို စုဆောင်းလိုက်ရုံပဲ။

Cluster Samplingရဲ့ အားသာချက်တွေကတော့ ပိုက်ဆံကုန်တာ သက်သာတယ်။ အချိန်ကုန်လည်း သက်သာတယ်။ နောက်ပြီး တကယ့်အပြင်မှာ သုံးရတာလည်း ပိုလွယ်ပါတယ်။ ဒါပေမဲ့ အားနည်းချက်တွေလည်းရှိပါတယ်။ Sampling Error များနိုင်ပါတယ်။ Cluster တွေကို မှားရွေးမိရင် Bias တွေ ဖြစ်သွားနိုင်ပါတယ်။

ဒါဆို Cluster Sampling ကို ဘယ်အချိန်မှာ သုံးသင့်လဲ။ လူအုပ်စုကြီးကြီးကို လေ့လာချင်တဲ့အခါ၊ ငွေနဲ့အချိန်ကို သက်သာချင်တဲ့အခါ၊ လူတွေက နေရာအနှံ့အပြားမှာ နေထိုင်တဲ့အခါမျိုးတွေမှာ သုံးသင့်ပါတယ်။

ဥပမာအနေနဲ့ ပြောရရင် မြို့တစ်မြို့မှာရှိတဲ့ အိမ်ထောင်စုတွေရဲ့ ဝင်ငွေကို လေ့လာချင်တယ်ဆိုပါတော့။ အိမ်တွေကို တစ်အိမ်ချင်းစီ လိုက်မေးမယ့်အစား ရပ်ကွက်တွေကို Cluster တွေအဖြစ် သတ်မှတ်လိုက်။ ပြီးတော့ ရပ်ကွက်တချို့ကို ရွေးထုတ်ပြီး အဲ့ဒီရပ်ကွက်ထဲက အိမ်ထောင်စုတွေရဲ့ ဝင်ငွေကို မေးမြန်းလိုက်ရင် အချိန်ကုန်သက်သာပြီး လေ့လာလို့ရသွားပါပြီ။

ဆက်ပြီး cluster လုပ်နည်းလေး ရှင်းပြချင်ပါတယ်။
Cluster Sampling လုပ်မယ်ဆိုရင် ဒီအဆင့်တွေကို ဆောင်ရွက်ရပါမယ်။

အဆင့် (၁) – Population ကို သတ်မှတ်ပါ

ပထမဆုံး ကိုယ်လေ့လာချင်တဲ့ လူအုပ်စုက ဘယ်သူတွေလဲဆိုတာ အတိအကျ ပြောရပါမယ်။ ဥပမာ… မြို့တစ်မြို့က အိမ်ထောင်စုတွေရဲ့ ပျမ်းမျှဝင်ငွေကို လေ့လာချင်တယ်ဆိုရင် အဲ့ဒီမြို့က အိမ်ထောင်စုအားလုံးက Population ပါပဲ။

အဆင့် (၂) – Cluster တွေကို ဖော်ထုတ်ပါ

Population ကို Cluster တွေအဖြစ် ခွဲထုတ်ရပါမယ်။ ရပ်ကွက်တွေကို Cluster တွေအဖြစ် သတ်မှတ်လို့ရပါတယ်။ တစ်နည်းအားဖြင့် လေ့လာချင်တဲ့ အိမ်ထောင်စုတွေက ရပ်ကွက်တွေထဲမှာ စုနေတယ်လို့ သတ်မှတ်လိုက်တာပါ။

အဆင့် (၃) – sample အရေအတွက် ဘယ်လောက်လိုလဲ တွက်ပါ

အရေးကြီးဆုံးအဆင့်က ဒီအဆင့်ပါပဲ။ ဘာလို့လဲဆိုတော့ sample အရေအတွက် မှန်မှ ကိုယ်ရတဲ့ ရလဒ်က ယုံကြည်စိတ်ချရမှာပါ။ sample အရေအတွက်ကို တွက်ဖို့အတွက် ဒီ Formula ကို သုံးလို့ရပါတယ်။

n = (N * z^2 * p * (1-p)) / (e^2 * (N-1) + z^2 * p * (1-p))

– n = လိုအပ်တဲ့ sample အရေအတွက်
– N = Population ထဲမှာရှိတဲ့ sample အရေအတွက် အားလုံး
– z = Confidence Level ရဲ့ z-score (ဥပမာ- 95% Confidence Level ဆိုရင် z = 1.96)
– p = ခန့်မှန်းခြေ ဖြစ်နိုင်ချေ (မသိရင် 0.5 ထားလိုက်ပါ)
– e = Margin of Error (ဘယ်လောက်အထိ မှားနိုင်လဲ)

အဆင့် (၄) – Cluster တွေကို ကျပန်းရွေးချယ်ပါ

အပေါ်က Formula နဲ့ တွက်ပြီး sample အရေအတွက် ဘယ်လောက်လိုလဲ သိပြီဆိုရင် Cluster တွေကို ကျပန်းရွေးရပါမယ်။ ဥပမာ- ရပ်ကွက် (၅) ခုကို ရွေးရမယ်ဆိုရင် မြို့ထဲမှာရှိတဲ့ ရပ်ကွက်အားလုံးထဲကနေ ရပ်ကွက် (၅) ခုကို Random ရွေးလိုက်ပါ။

အဆင့် (၅) – Sample Size in cluster ကို တွက်ပါ

နောက်ဆုံးအဆင့်က ရွေးထားတဲ့ Cluster တစ်ခုချင်းစီထဲမှာ လူဘယ်နှစ်ယောက်ကို မေးမြန်းရမလဲဆိုတာ တွက်ရပါမယ်။ ဒီအတွက် ဒီ Formula ကို သုံးလို့ရပါတယ်။

n_c = n / m

– n_c = Cluster တစ်ခုထဲက Sample Size
– n = လိုအပ်တဲ့ Sample Size အားလုံး
– m = ရွေးထားတဲ့ Cluster အရေအတွက်

ဥပမာ
မြို့တစ်မြို့မှာရှိတဲ့ အိမ်ထောင်စု (၅၀၀၀) ရဲ့ ဝင်ငွေကို လေ့လာချင်တယ်။ မြို့ထဲမှာ ရပ်ကွက် (၁၀၀) ရှိတယ်။ 95% Confidence Level နဲ့ 5% Margin of Error ကို သုံးမယ်ဆိုရင်

1. sample အရေအတွက်ကို တွက်ပါမယ်။ N = 100 , z = 1.96 , p = 0.5 , e = 0.05

n = (100 * 1.96^2 * 0.5 * 0.5) / (0.05^2 * (100-1) + 1.96^2 * 0.5 * 0.5)
n = 384.16 / (0.2475 + 0.9604)
n = 384.16 / 1.2079
n = 318 လောက်ရပါမယ်

2. ၃၁၈ ယောက်ကို မေးမြန်းဖို့ အတွက် ရပ်ကွက် (၂၀) ကို ရွေးမယ်။ cluster ဘယ်လောက်ရွေးမလဲ၊ ရပ်ကွက် ဘယ်နှစ်ခုကို ရွေးမလဲဆိုတာက သုတေသနရဲ့ အခြေအနေပေါ်မှာ မူတည်ပါတယ်။
– အချိန်နဲ့ ငွေကြေး အကန့်အသတ် –
အချိန်နဲ့ ငွေကြေး အကန့်အသတ်ရှိရင် ရပ်ကွက် အရေအတွက်ကို လျှော့ချနိုင်ပါတယ်။
– တိကျမှု
ရလဒ်ကို တိတိကျကျ သိချင်ရင် ရပ်ကွက် အရေအတွက်ကို များများရွေးရပါမယ်။ဒါကြောင့် ရပ်ကွက် အရေအတွက်ကို တွက်ဖို့အတွက် အတိအကျ ပြောလို့မရပါဘူး။ သုတေသနရဲ့ အခြေအနေကို ကြည့်ပြီး ဆုံးဖြတ်ရမှာ ဖြစ်ပါတယ်။
ပြီးတော့ တစ်ရပ်ကွက်မှာ အိမ်ထောင်စု ဘယ်နှစ်ခုကို မေးရမလဲ တွက်ပါမယ်။ အိမ်ထောင်စု (၄၀၀) ကို မေးမြန်းဖို့ စဉ်းစားထားတယ်ဆိုရင်
n_c = 400 / 20
n_c = 20

ဒါကြောင့် ရွေးထားတဲ့ ရပ်ကွက်တစ်ခုထဲက အိမ်ထောင်စု (၂၀) ကို မေးမြန်းရပါမယ်။
ဒီလောက်ဆိုရင် Cluster Sampling လုပ်တဲ့ အဆင့်တွေ၊ Cluster အရေအတွက် တွက်ပုံတွေ၊ Sample Size တွက်ပုံတွေကို သဘောပေါက်လောက်ပြီလို့ ထင်ပါတယ်။

Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leon Gordis ၏ Epidemiology အကြောင်း ဖတ်မိသမျှစာအုပ်က Epidemiology လို့ခေါ်တဲ့ ဘာသာရပ်အကြောင်းပါ။ Epidemiology ဆိုတာကတော့ လူဦးရေတွေထဲမှာ ရောဂါတွေ ဘယ်လိုပျံ့နှံ့နေလဲ၊ ဒီပျံ့နှံ့မှုကို လွှမ်းမိုးတဲ့အချက်တွေက ဘာတွေလဲဆိုတာကို လေ့လာတာ ဖြစ်ပါတယ်။ လူတိုင်း ရောဂါမဖြစ်ကြပါဘူး။ အချို့သူတွေမှာပဲ ရောဂါဖြစ်တတ်တာကို လေ့လာပြီး ဘယ်လိုဝိသေသလက္ခဏာတွေက ရောဂါကိုဖြစ်စေနိုင်လဲ ဒါမှမဟုတ် ကာကွယ်ပေးနိုင်လဲဆိုတာကို ရှာဖွေတာပါ။ဒီစာအုပ်မှာ အဓိကအားဖြင့်

Discover more from naywinaung

Leave a Reply Cancel reply

Related Post

Simple Random SamplingSimple Random Sampling

statistical test များရွေးချယ်ခြင်းstatistical test များရွေးချယ်ခြင်း

Leon Gordis ၏ EpidemiologyLeon Gordis ၏ Epidemiology