Cluster Sampling

Cluster Sampling

Cluster Sampling ဆိုတာ လူအုပ်စုအကြီးကြီးကို လေ့လာချင်တဲ့အခါ သုံးတဲ့နည်းဖြစ်ပါတယ်။ ဒါပေမဲ့ လူတွေကို တစ်ယောက်ချင်းစီ မရွေးထုတ်ဘဲ အုပ်စုလိုက် ရွေးထုတ်တာကို Cluster Sampling လို့ခေါ်ပါတယ်။

အဲ့ဒီမှာ Cluster ဆိုတာက သဘာဝအလျောက် ဖြစ်နေတဲ့ အုပ်စုတွေကို ပြောတာ။ ဥပမာ… ကျောင်းတွေဆို အတန်းတွေက Cluster တွေပါပဲ။ ရွာတွေဆိုရင် အိမ်ထောင်စုတွေက Cluster တွေပေါ့။

ဒါဆို Cluster Sampling ကို ဘယ်လိုလုပ်ရမလဲဆိုတာ မေးလာနိုင်တယ်။ လုပ်ရတာ လွယ်ပါတယ်။ ပထမဦးဆုံး ကိုယ်လေ့လာချင်တဲ့ လူအုပ်စုကို သတ်မှတ်လိုက်။ ပြီးရင် အဲ့ဒီလူအုပ်စုကို Cluster တွေအဖြစ် ခွဲထုတ်လိုက်။ ပြီးတော့ Cluster တွေထဲကနေ တချို့ကို ကျပန်းရွေးထုတ်လိုက်။ နောက်ဆုံး ရွေးထားတဲ့ Cluster ထဲက လူတွေဆီကနေ လိုအပ်တဲ့ Data တွေကို စုဆောင်းလိုက်ရုံပဲ။

Cluster Samplingရဲ့ အားသာချက်တွေကတော့ ပိုက်ဆံကုန်တာ သက်သာတယ်။ အချိန်ကုန်လည်း သက်သာတယ်။ နောက်ပြီး တကယ့်အပြင်မှာ သုံးရတာလည်း ပိုလွယ်ပါတယ်။ ဒါပေမဲ့ အားနည်းချက်တွေလည်းရှိပါတယ်။ Sampling Error များနိုင်ပါတယ်။ Cluster တွေကို မှားရွေးမိရင် Bias တွေ ဖြစ်သွားနိုင်ပါတယ်။

ဒါဆို Cluster Sampling ကို ဘယ်အချိန်မှာ သုံးသင့်လဲ။ လူအုပ်စုကြီးကြီးကို လေ့လာချင်တဲ့အခါ၊ ငွေနဲ့အချိန်ကို သက်သာချင်တဲ့အခါ၊ လူတွေက နေရာအနှံ့အပြားမှာ နေထိုင်တဲ့အခါမျိုးတွေမှာ သုံးသင့်ပါတယ်။

ဥပမာအနေနဲ့ ပြောရရင် မြို့တစ်မြို့မှာရှိတဲ့ အိမ်ထောင်စုတွေရဲ့ ဝင်ငွေကို လေ့လာချင်တယ်ဆိုပါတော့။ အိမ်တွေကို တစ်အိမ်ချင်းစီ လိုက်မေးမယ့်အစား ရပ်ကွက်တွေကို Cluster တွေအဖြစ် သတ်မှတ်လိုက်။ ပြီးတော့ ရပ်ကွက်တချို့ကို ရွေးထုတ်ပြီး အဲ့ဒီရပ်ကွက်ထဲက အိမ်ထောင်စုတွေရဲ့ ဝင်ငွေကို မေးမြန်းလိုက်ရင် အချိန်ကုန်သက်သာပြီး လေ့လာလို့ရသွားပါပြီ။

ဆက်ပြီး cluster လုပ်နည်းလေး ရှင်းပြချင်ပါတယ်။
Cluster Sampling လုပ်မယ်ဆိုရင် ဒီအဆင့်တွေကို ဆောင်ရွက်ရပါမယ်။

အဆင့် (၁) – Population ကို သတ်မှတ်ပါ

ပထမဆုံး ကိုယ်လေ့လာချင်တဲ့ လူအုပ်စုက ဘယ်သူတွေလဲဆိုတာ အတိအကျ ပြောရပါမယ်။ ဥပမာ… မြို့တစ်မြို့က အိမ်ထောင်စုတွေရဲ့ ပျမ်းမျှဝင်ငွေကို လေ့လာချင်တယ်ဆိုရင် အဲ့ဒီမြို့က အိမ်ထောင်စုအားလုံးက Population ပါပဲ။

အဆင့် (၂) – Cluster တွေကို ဖော်ထုတ်ပါ

Population ကို Cluster တွေအဖြစ် ခွဲထုတ်ရပါမယ်။ ရပ်ကွက်တွေကို Cluster တွေအဖြစ် သတ်မှတ်လို့ရပါတယ်။ တစ်နည်းအားဖြင့် လေ့လာချင်တဲ့ အိမ်ထောင်စုတွေက ရပ်ကွက်တွေထဲမှာ စုနေတယ်လို့ သတ်မှတ်လိုက်တာပါ။

အဆင့် (၃) – sample အရေအတွက် ဘယ်လောက်လိုလဲ တွက်ပါ

အရေးကြီးဆုံးအဆင့်က ဒီအဆင့်ပါပဲ။ ဘာလို့လဲဆိုတော့ sample အရေအတွက် မှန်မှ ကိုယ်ရတဲ့ ရလဒ်က ယုံကြည်စိတ်ချရမှာပါ။  sample  အရေအတွက်ကို တွက်ဖို့အတွက် ဒီ Formula ကို သုံးလို့ရပါတယ်။

n = (N * z^2 * p * (1-p)) / (e^2 * (N-1) + z^2 * p * (1-p))

–  n  = လိုအပ်တဲ့  sample  အရေအတွက်
–  N  = Population ထဲမှာရှိတဲ့  sample  အရေအတွက် အားလုံး
–  z  = Confidence Level ရဲ့ z-score (ဥပမာ- 95% Confidence Level ဆိုရင် z = 1.96)
–  p  = ခန့်မှန်းခြေ ဖြစ်နိုင်ချေ (မသိရင် 0.5 ထားလိုက်ပါ)
–  e  = Margin of Error (ဘယ်လောက်အထိ မှားနိုင်လဲ)

အဆင့် (၄) – Cluster တွေကို ကျပန်းရွေးချယ်ပါ

အပေါ်က Formula နဲ့ တွက်ပြီး  sample  အရေအတွက် ဘယ်လောက်လိုလဲ သိပြီဆိုရင်  Cluster တွေကို ကျပန်းရွေးရပါမယ်။ ဥပမာ- ရပ်ကွက် (၅) ခုကို ရွေးရမယ်ဆိုရင် မြို့ထဲမှာရှိတဲ့ ရပ်ကွက်အားလုံးထဲကနေ ရပ်ကွက် (၅) ခုကို Random ရွေးလိုက်ပါ။

အဆင့် (၅) – Sample Size in cluster ကို တွက်ပါ

နောက်ဆုံးအဆင့်က ရွေးထားတဲ့ Cluster တစ်ခုချင်းစီထဲမှာ လူဘယ်နှစ်ယောက်ကို မေးမြန်းရမလဲဆိုတာ တွက်ရပါမယ်။ ဒီအတွက် ဒီ Formula ကို သုံးလို့ရပါတယ်။

n_c = n / m

–  n_c  = Cluster တစ်ခုထဲက Sample Size
–  n  = လိုအပ်တဲ့ Sample Size အားလုံး
–  m  = ရွေးထားတဲ့ Cluster အရေအတွက်

ဥပမာ
မြို့တစ်မြို့မှာရှိတဲ့ အိမ်ထောင်စု (၅၀၀၀) ရဲ့ ဝင်ငွေကို လေ့လာချင်တယ်။ မြို့ထဲမှာ ရပ်ကွက် (၁၀၀) ရှိတယ်။ 95% Confidence Level နဲ့ 5% Margin of Error ကို သုံးမယ်ဆိုရင်

1.  sample  အရေအတွက်ကို တွက်ပါမယ်။  N = 100 ,  z = 1.96 ,  p = 0.5 ,  e = 0.05

n = (100 * 1.96^2 * 0.5 * 0.5) / (0.05^2 * (100-1) + 1.96^2 * 0.5 * 0.5)
n = 384.16 / (0.2475 + 0.9604)
n = 384.16 / 1.2079
n = 318 လောက်ရပါမယ်

2. ၃၁၈ ယောက်ကို မေးမြန်းဖို့ အတွက် ရပ်ကွက် (၂၀) ကို ရွေးမယ်။ cluster ဘယ်လောက်ရွေးမလဲ၊ ရပ်ကွက် ဘယ်နှစ်ခုကို ရွေးမလဲဆိုတာက သုတေသနရဲ့ အခြေအနေပေါ်မှာ မူတည်ပါတယ်။
– အချိန်နဲ့ ငွေကြေး အကန့်အသတ် –
အချိန်နဲ့ ငွေကြေး အကန့်အသတ်ရှိရင် ရပ်ကွက် အရေအတွက်ကို လျှော့ချနိုင်ပါတယ်။
– တိကျမှု
ရလဒ်ကို တိတိကျကျ သိချင်ရင် ရပ်ကွက် အရေအတွက်ကို များများရွေးရပါမယ်။ဒါကြောင့် ရပ်ကွက် အရေအတွက်ကို တွက်ဖို့အတွက် အတိအကျ ပြောလို့မရပါဘူး။ သုတေသနရဲ့ အခြေအနေကို ကြည့်ပြီး ဆုံးဖြတ်ရမှာ ဖြစ်ပါတယ်။
ပြီးတော့ တစ်ရပ်ကွက်မှာ အိမ်ထောင်စု ဘယ်နှစ်ခုကို မေးရမလဲ တွက်ပါမယ်။ အိမ်ထောင်စု (၄၀၀) ကို မေးမြန်းဖို့ စဉ်းစားထားတယ်ဆိုရင်
n_c = 400 / 20
n_c = 20

ဒါကြောင့် ရွေးထားတဲ့ ရပ်ကွက်တစ်ခုထဲက အိမ်ထောင်စု (၂၀) ကို မေးမြန်းရပါမယ်။
ဒီလောက်ဆိုရင် Cluster Sampling လုပ်တဲ့ အဆင့်တွေ၊ Cluster အရေအတွက် တွက်ပုံတွေ၊ Sample Size တွက်ပုံတွေကို သဘောပေါက်လောက်ပြီလို့ ထင်ပါတယ်။


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

Simple Random SamplingSimple Random Sampling

Simple Random Sampling“Simple Random Sampling” ဆိုတာကို အလွယ်ကူဆုံး နားလည်အောင် ပြောရရင် “မဲနှိုက်တာ” နဲ့ အတူတူပါပဲ။ လူအများကြီးထဲကမှ လူအနည်းငယ်ကို ရွေးတဲ့အခါမှာ ဘယ်သူ့ကိုမဆို ပါဝင်ခွင့် အခွင့်အရေး တန်းတူပေးပြီး ကံစမ်းမဲနှိုက်သလိုမျိုး ရွေးချယ်တဲ့ နည်းလမ်းဖြစ်ပါတယ်။SRS ရဲ့ အဓိကအချက်တွေကတော့၁။ အားလုံးမှာ အခွင့်အရေး တန်းတူရှိတယ် (Equal Chance)လူဦးရေ (Population)

statistical test များရွေးချယ်ခြင်းstatistical test များရွေးချယ်ခြင်း

statistical test များရွေးချယ်ခြင်းကိုယ့်ရဲ့ဒေတာတွေကို ဘယ်လို test တွေ သုံးပြီး စမ်းစစ်မလဲဆိုတာကို အကြမ်းဖျဉ်းလေး ရှင်းပြပါမယ်။ပထမဆုံးအနေနဲ့ မိမိရဲ့ဒေတာတွေကို ကွဲပြားခြားနားမှု ရှိ၊ မရှိ သိချင်တာလား၊ သို့မဟုတ်၊ ဆက်စပ်မှု ရှိမရှိ သိချင်တာလား ဆိုတာ အရင်ဆုံး စဉ်းစားကြရပါမယ်။ကွဲပြားမှု ရှိ မရှိ သိချင်တာဆိုရင် မိမိ သိချင်တဲ့ data တွေရဲ့ variables

Leon Gordis ၏ EpidemiologyLeon Gordis ၏ Epidemiology

Leon Gordis ၏ Epidemiology အကြောင်း ဖတ်မိသမျှစာအုပ်က Epidemiology လို့ခေါ်တဲ့ ဘာသာရပ်အကြောင်းပါ။ Epidemiology ဆိုတာကတော့ လူဦးရေတွေထဲမှာ ရောဂါတွေ ဘယ်လိုပျံ့နှံ့နေလဲ၊ ဒီပျံ့နှံ့မှုကို လွှမ်းမိုးတဲ့အချက်တွေက ဘာတွေလဲဆိုတာကို လေ့လာတာ ဖြစ်ပါတယ်။ လူတိုင်း ရောဂါမဖြစ်ကြပါဘူး။ အချို့သူတွေမှာပဲ ရောဂါဖြစ်တတ်တာကို လေ့လာပြီး ဘယ်လိုဝိသေသလက္ခဏာတွေက ရောဂါကိုဖြစ်စေနိုင်လဲ ဒါမှမဟုတ် ကာကွယ်ပေးနိုင်လဲဆိုတာကို ရှာဖွေတာပါ။ဒီစာအုပ်မှာ အဓိကအားဖြင့်