naywinaung blog,research,Research Methodology Stratified Random Sampling

Stratified Random Sampling

Stratified Random Sampling အကြောင်း

Stratified Random Sampling ဆိုတာက လူဦးရေအုပ်စုကြီးတစ်ခုကို လေ့လာတဲ့အခါမှာ အုပ်စုတစ်ခုလုံး(population)ရဲ့ ပုံစံကိုဖမ်းယူနိုင်ဖို့အတွက် အသုံးပြုတဲ့ နည်းလမ်းတစ်ခုပါ။

ဥပမာ- ကျောင်းတစ်ကျောင်းမှာ ကျောင်းသားဦးရေအများကြီးရှိတယ်ဆိုပါစို့။ အဲဒီကျောင်းက ကျောင်းသားတွေရဲ့ ပျမ်းမျှရမှတ်ကို သိချင်တယ်ဆိုရင် ကျောင်းသားအားလုံးကို မေးမြန်းဖို့ဆိုတာ မလွယ်ကူပါဘူး။ ဒါကြောင့် Stratified Random Sampling ကိုသုံးပြီး အဲဒီကျောင်းသားအုပ်စုကြီးကို အရင်ဆုံး အလွှာ (strata) တွေခွဲပါတယ်။ အဲဒီအလွှာတွေက ဘာတွေဖြစ်မလဲဆိုတော့ ကျောင်းသားတွေရဲ့ အတန်းအလိုက် (grade level) ခွဲတာမျိုးပေါ့။ ဥပမာ – ပထမတန်း၊ ဒုတိယတန်း၊ တတိယတန်း အစရှိသဖြင့်ပေါ့။

အဲဒီလို အလွှာတွေခွဲပြီးတဲ့အခါမှာ တစ်လွှာချင်းစီကနေ ကျောင်းသားတွေကို Random Sample ရယူပါတယ်။ Random Sample ဆိုတာက ကျပန်းရွေးချယ်တာကို ပြောတာပါ။ ဥပမာ – ပထမတန်းက ကျောင်းသား (၁၀) ယောက်၊ ဒုတိယတန်းက (၁၅) ယောက်၊ တတိယတန်းက (၂၀) ယောက် စသဖြင့် ကျပန်းရွေးထုတ်ပြီး သူတို့ရဲ့ ရမှတ်တွေကို မေးမြန်းပြီး ပျမ်းမျှရမှတ်ကို တွက်ထုတ်တာမျိုးပါ။

ဒီလိုလုပ်ခြင်းအားဖြင့် ကျောင်းသားအုပ်စုတစ်ခုလုံးရဲ့ ပုံစံကို ပိုပြီးတိကျစွာဖမ်းယူနိုင်ပါတယ်။ ဘာလို့လဲဆိုတော့ တစ်လွှာချင်းစီရဲ့ ကိုယ်စားပြုမှု (representation) ကို ထည့်သွင်းစဉ်းစားထားလို့ပါ။ အဲဒါကြောင့် Stratified Random Sampling ဟာ စာရင်းအင်းလေ့လာမှုတွေမှာ အရေးပါတဲ့အခန်းကဏ္ဍမှာ ပါဝင်ပါတယ်။

Stratified လုပ်နည်း

1.အရင်ဆုံး Population ကို Define လုပ်ပါ။
ကိုယ်လေ့လာချင်တဲ့ လူအုပ်စု (population) က ဘယ်သူတွေလဲဆိုတာ အတိအကျ သတ်မှတ်ရပါမယ်။ ဥပမာ – မြို့တစ်မြို့က အိမ်ထောင်စုတွေရဲ့ လစဉ်ဝင်ငွေကို လေ့လာမယ်ဆိုရင်၊ အဲဒီမြို့က အိမ်ထောင်စုအားလုံးဟာ ကိုယ်ရဲ့ population ဖြစ်ပါတယ်။

2. Strata ခွဲဖို့အတွက် Variable ရွေးပါ။
Population ကို ဘယ်လိုအလွှာတွေ (strata) ခွဲမလဲဆိုတာ ဆုံးဖြတ်ရပါမယ်။ ဒီနေရာမှာ ကိုယ်လေ့လာမယ့်အကြောင်းအရာ (research question) နဲ့ သက်ဆိုင်တဲ့ variable ကို ရွေးချယ်ရပါမယ်။ ဥပမာ – ဝင်ငွေကိုလေ့လာမယ်ဆိုရင် နေထိုင်တဲ့ရပ်ကွက် (neighborhood)၊ လူမျိုး (ethnicity)၊ ပညာအရည်အချင်း (education level) စတာတွေက variable တွေ ဖြစ်နိုင်ပါတယ်။

3. Strata တစ်ခုချင်းစီအတွက် Size သတ်မှတ်ပါ။ ရွေးချယ်လိုက်တဲ့ variable ပေါ်မူတည်ပြီး population ကို အလွှာတွေခွဲရပါမယ်။ ဥပမာ – ရပ်ကွက်အလိုက် အလွှာခွဲမယ်ဆိုရင် ရပ်ကွက်တစ်ခုစီမှာရှိတဲ့ အိမ်ထောင်စုအရေအတွက်ကို သိဖို့လိုပါတယ်။

4. Sampling Technique ရွေးချယ်ပါ။

Stratified Random Sampling မှာ အဓိက (၂) မျိုးရှိပါတယ်။
– Proportionate Stratified Sampling ဆိုတာက တစ်လွှာချင်းစီက Sample Size ကို အလွှာရဲ့ Size နဲ့အချိုးကျ ရွေးချယ်တာပါ။ ဥပမာ – အလွှာတစ်ခုက population ရဲ့ (၂၀%) ရှိရင် Sample ထဲမှာလည်း (၂၀%) ပါဝင်ရပါမယ်။

– Disproportionate Stratified Sampling ဆိုတာက အလွှာရဲ့ Size ကို ထည့်မတွက်ဘဲ တခြားအကြောင်းအရာတွေပေါ်မူတည်ပြီး Sample Size ကို ရွေးချယ်တာပါ။ ဥပမာ – အလွှာတစ်ခုမှာ လူနည်းနေရင်တောင် ကိုယ်စားပြုမှုသေချာအောင် Sample Size ကို ပိုယူတာမျိုးဖြစ်ပါတယ်။

Random ဘယ်လောက်ယူရမလဲ

Random ဘယ်လောက်ယူရမလဲဆိုတာကို တွက်ဖို့အတွက် အဓိကအချက် (၃) ခု ရှိပါတယ်။

1. Population Size
ကိုယ်လေ့လာမယ့် လူအုပ်စုတစ်ခုလုံးမှာ ဘယ်နှစ်ယောက်ရှိလဲဆိုတာ သိဖို့လိုပါတယ်။

2. Margin of Error
ရလဒ်မှာ ဘယ်လောက်အထိ မှားနိုင်လဲဆိုတာကို ခန့်မှန်းတာပါ။ Margin of Error နည်းလေလေ၊ Sample Size က ကြီးလေလေပါပဲ။

3. Confidence Level
ကိုယ့်ရဲ့ ရလဒ်ကို ဘယ်လောက်အထိ ယုံကြည်လဲဆိုတာကို ဖော်ပြတာပါ။ Confidence Level မြင့်လေလေ၊ Sample Size က ကြီးလေလေပါပဲ။

ဒါတွေကို အသုံးပြုပြီး Sample Size တွက်တဲ့ Formula တွေ အများကြီးရှိပါတယ်။ဥပမာအနေနှင့် Cochran’s Formula ကို ရှင်းပြပါမယ်။ ဒီ Formula ကို Population Size က ကြီးတဲ့အခါ (ဥပမာ – ၅၀၀၀ ကျော်ရင်) အသုံးပြုဖို့ သင့်တော်ပါတယ်။

n = (z^2 * p * q) / E^2

–  n  = လိုအပ်တဲ့ Sample Size
–  z  = Confidence Level ရဲ့ z-score (ဥပမာ – 95% Confidence Level အတွက် z = 1.96)
–  p  = လေ့လာမယ့် သုတေသနရဲ့ ခန့်မှန်းခြေအားဖြင့် ဖြစ်နိုင်ချေ (estimated proportion of the attribute that is present in the population)။ မသိရင် 0.5 (50%) လို့ ထားနိုင်ပါတယ်။
–  q  = 1 – p (ဖြစ်နိုင်ချေမရှိတာ)
–  E  = Margin of Error (desirable margin of error)

ဥပမာအားဖြင့် မြို့တစ်မြို့မှာ အိမ်ထောင်စု (၁၀၀၀၀) ရှိတယ်။ အဲဒီမြို့က အိမ်ထောင်စုတွေမှာ အင်တာနက်သုံးစွဲမှုနှုန်းကို 95% Confidence Level နဲ့ Margin of Error 5% နဲ့ လေ့လာချင်တယ်ဆိုပါစို့။

1. z-score: 95% Confidence Level အတွက် z = 1.96
2. p: အင်တာနက်သုံးစွဲမှုနှုန်းကို မသိတဲ့အတွက် p = 0.5 လို့ ထားမယ်။
3. q: q = 1 – p = 1 – 0.5 = 0.5
4. E: Margin of Error = 5% = 0.05

Formula ထဲမှာ ထည့်တွက်ကြည့်ရအောင်…

n = (1.96^2 * 0.5 * 0.5) / 0.05^2
n = (3.8416 * 0.25) / 0.0025
n = 0.9604 / 0.0025
n = 384.16

ဒါကြောင့် Sample Size က အနည်းဆုံး (၃၈၅) လိုအပ်ပါတယ်။
ဒီ Formula က အခြေခံ Formula တစ်ခုသာဖြစ်ပါတယ်။ တကယ့်လက်တွေ့မှာ ကိုယ့်ရဲ့ Research Question နဲ့ Data ရဲ့ အခြေအနေပေါ်မူတည်ပြီး Formula ကို ပြောင်းလဲသုံးစွဲရနိုင်ပါတယ်။ Population Size က သိပ်မကြီးဘူးဆိုရင် Finite Population Correction Factor ကို ထည့်သွင်းစဉ်းစားဖို့ လိုအပ်နိုင်ပါတယ်။

Finite Population Correction Factor (FPC) ဆိုတာဘာလဲ

FPC ဆိုတာ Population Size က သိပ်မကြီးတဲ့အခါ (ဥပမာ – ၁၀၀၀ အောက်) Sample Size တွက်တဲ့အခါမှာ ထည့်စဉ်းစားရမယ့် အချက်တစ်ခုဖြစ်ပါတယ်။ Population Size သေးတဲ့အခါ Sample တစ်ခုရွေးလိုက်တာနဲ့ ကျန်တဲ့ Population ထဲက Data တွေရဲ့ ဖြစ်နိုင်ချေ (probability) က ပြောင်းလဲသွားနိုင်ပါတယ်။ ဒါကြောင့် Sample Size ကို ချိန်ညှိပေးဖို့ FPC ကို အသုံးပြုပါတယ်။

ဘယ်အချိန်မှာ FPC ကို သုံးရမလဲ

– Sampling Fraction (n/N) က 5% ထက်ကြီးတဲ့အခါ FPC ကို သုံးသင့်ပါတယ်။ ဆိုလိုတာက Sample Size ဟာ Population Size ရဲ့ 5% ထက်ပိုကြီးနေရင် FPC ကို ထည့်စဉ်းစားသင့်ပါတယ်။
– Population Size က သေးငယ်တဲ့အခါ (ဥပမာ – ၁၀၀၀ အောက်) FPC ကို သုံးသင့်ပါတယ်။

FPC Formula

FPC = sqrt((N – n) / (N – 1))

–  N  = Population Size
–  n  = Sample Size

FPC ကို ဘယ်လိုသုံးမလဲ

Sample Size တွက်ပြီးတဲ့အခါ FPC ကို သုံးပြီး Sample Size ကို ချိန်ညှိနိုင်ပါတယ်။ ချိန်ညှိပြီး Sample Size ကို  n_adjusted  လို့ သတ်မှတ်ရင်…

n_adjusted = n / (1 + ((n – 1) / N))

ဥပမာအားဖြင့် ကျောင်းတစ်ကျောင်းမှာ ကျောင်းသား (၂၀၀) ရှိတယ်။ Sample Size (၅၀) နဲ့ လေ့လာမယ်ဆိုပါစို့။

FPC = sqrt((200 – 50) / (200 – 1))
FPC = sqrt(150 / 199)
FPC = sqrt(0.7538)
FPC = 0.8682

FPC ကို သုံးပြီး Sample Size ကို ချိန်ညှိမယ်။

n_adjusted = n / (1 + ((n – 1) / N))
n_adjusted = 50 / (1 + ((50 – 1) / 200))
n_adjusted = 50 / (1 + (49 / 200))
n_adjusted = 50 / (1 + 0.245)
n_adjusted = 50 / 1.245
n_adjusted = 40.16

ဒါကြောင့် FPC ကို သုံးပြီး ချိန်ညှိလိုက်တဲ့ Sample Size က (၄၀) ဝန်းကျင် ဖြစ်ပါတယ်။ FPC ကို သုံးခြင်းအားဖြင့် ရလဒ်တွေရဲ့ ယုံကြည်စိတ်ချရမှု (reliability) ကို မြှင့်တင်နိုင်ပါတယ်။

ဒါမှမဟုတ် Sample Size တွက်တဲ့ Formula ထဲမှာ FPC ကို ထည့်သုံးနိုင်ပါတယ်။ ဥပမာ – Cochran’s Formula ကို FPC နဲ့ ချိန်ညှိမယ်ဆိုရင်…

n = (z^2 * p * q) / (E^2 + ((z^2 * p * q) / N))


Stratified Random Sampling ကို သုံးသင့်တဲ့ အခြေအနေများ

1. Population က Heterogeneous ဖြစ်နေတဲ့အခါ
– Population ထဲမှာ မတူညီတဲ့ Subgroup (အုပ်စုငယ်) တွေ အများကြီးရှိနေရင် Stratified Random Sampling ကို သုံးသင့်ပါတယ်။

2. Subgroup တစ်ခုချင်းစီကို ကိုယ်စားပြုချင်တဲ့အခါ
– Population ထဲက Subgroup တစ်ခုချင်းစီရဲ့ အချက်အလက်တွေကို တိတိကျကျ သိချင်တဲ့အခါ Stratified Random Sampling က အကောင်းဆုံးရွေးချယ်မှု ဖြစ်ပါတယ်။

3. Sampling Error ကို လျှော့ချချင်တဲ့အခါ
– Simple Random Sampling နဲ့ယှဉ်ရင် Stratified Random Sampling က Sampling Error ကို ပိုလျှော့ချပေးနိုင်ပါတယ်။ ဘာလို့လဲဆိုတော့ Stratified Random Sampling က Population ထဲက မတူညီတဲ့ Subgroup တွေကို ထည့်သွင်းစဉ်းစားပြီး Sample ကို ရွေးချယ်တာကြောင့် ဖြစ်ပါတယ်။

4. Data တွေကို နှိုင်းယှဉ်ချင်တဲ့အခါ
– Subgroup တွေကြားထဲမှာ နှိုင်းယှဉ်မှုတွေ ပြုလုပ်ချင်တဲ့အခါ Stratified Random Sampling က အသုံးဝင်ပါတယ်။

Stratified Random Sampling ကို မသုံးသင့်တဲ့ အခြေအနေများ

1. Population က Homogeneous ဖြစ်နေတဲ့အခါ
– Population ထဲမှာ အားလုံးက တူညီနေမယ်ဆိုရင် Stratified Random Sampling ကို သုံးဖို့ မလိုအပ်ပါဘူး။ Simple Random Sampling နဲ့လည်း လုံလောက်ပါတယ်။

2. Strata ခွဲဖို့ ခက်ခဲတဲ့အခါ
– Population ကို Strata ခွဲဖို့အတွက် လိုအပ်တဲ့ Information တွေ မရှိဘူးဆိုရင် Stratified Random Sampling ကို သုံးလို့မရပါဘူး။

3. Subgroup တွေရဲ့ Size က သေးငယ်လွန်းတဲ့အခါ
– Subgroup တစ်ခုချင်းစီရဲ့ Size က သေးငယ်လွန်းရင် Stratified Random Sampling ကို သုံးတာက အကျိုးမများပါဘူး။ ဘာလို့လဲဆိုတော့ သေးငယ်တဲ့ Subgroup တွေကနေ ရလာတဲ့ Data တွေက ကိုယ်စားပြုမှု မလုံလောက်နိုင်ပါဘူး။

4. အချိန်နဲ့ ငွေကြေး အကန့်အသတ်ရှိတဲ့အခါ
– Stratified Random Sampling က Simple Random Sampling ထက် အချိန်နဲ့ ငွေကြေးပိုကုန်နိုင်ပါတယ်။ ဒါကြောင့် အချိန်နဲ့ ငွေကြေး အကန့်အသတ်ရှိတဲ့အခါ Stratified Random Sampling ကို မသုံးသင့်ပါဘူး။

Stratified Random Sampling ဟာ Population ထဲမှာ မတူညီတဲ့ Subgroup တွေရှိနေတဲ့အခါနဲ့ Subgroup တစ်ခုချင်းစီကို ကိုယ်စားပြုချင်တဲ့အခါမှာ အသုံးဝင်တဲ့ Sampling Technique တစ်ခုပါ။ ဒါပေမဲ့ Population က Homogeneous ဖြစ်နေတဲ့အခါ၊ Strata ခွဲဖို့ ခက်ခဲတဲ့အခါ၊ Subgroup တွေရဲ့ Size က သေးငယ်လွန်းတဲ့အခါနဲ့ အချိန်၊ ငွေကြေး အကန့်အသတ်ရှိတဲ့အခါမျိုးတွေမှာတော့ Stratified Random Sampling ကို သုံးဖို့ မသင့်တော်ပါဘူး။


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

Snowball SamplingSnowball Sampling

“Snowball Sampling ဆိုတာက သုတေသနလုပ်ဖို့ ခက်ခဲတဲ့ လူအုပ်စုတွေကို လေ့လာတဲ့အခါ အသုံးဝင်တဲ့ နည်းလမ်းတစ်ခုပါပဲ။ စဉ်းစားကြည့်ပါ… မူးယစ်ဆေးစွဲနေတဲ့သူတွေအကြောင်းကို လေ့လာချင်တယ်ဆိုရင် မူးယစ်ဆေးစွဲနေတဲ့သူတွေကို ရှာဖို့ ခက်ခဲနိုင်ပါတယ်။ အဲ့ဒီလို အခြေအနေမျိုးမှာ Snowball Sampling က အသုံးဝင်လာတာပါ။ Snowball Sampling ကို ဘယ်လိုလုပ်မလဲဆိုတော့… ၁။ ပထမဦးဆုံး သုတေသနနဲ့ သက်ဆိုင်တဲ့ လူတစ်ယောက်

“ဘက်လိုက်မှု (Bias)” အကြောင်း“ဘက်လိုက်မှု (Bias)” အကြောင်း

ရောဂါဗေဒဆိုင်ရာ လေ့လာမှုတွေမှာ ဘက်လိုက်မှု (Bias) ဆိုတာက တကယ်တော့ စနစ်ကျတဲ့ အမှား (systematic error) တစ်မျိုးပါ။ ဒီအမှားက လေ့လာမှုရဲ့ ဒီဇိုင်း (design) ဒါမှမဟုတ် ဆောင်ရွက်ပုံ (conduct) ထဲမှာ ဖြစ်ပေါ်လာပြီး အကြောင်းအရာတွေကြားက ဆက်စပ်မှုကို မှန်ကန်စွာ ခန့်မှန်းနိုင်စွမ်းကို ထိခိုက်စေနိုင်ပါတယ်။ လေ့လာမှုတစ်ခုမှာ ဆက်စပ်မှုတစ်ခုကို တွေ့ရတဲ့အခါ၊ အဲဒီဆက်စပ်မှုက အကြောင်းအရာရဲ့

QQ Plot ဆိုတာ ဘာလဲ?QQ Plot ဆိုတာ ဘာလဲ?

QQ plot ဆိုတာ ဒေတာ (အထူးသဖြင့် regression လုပ်ပြီးထွက်လာတဲ့ residual တွေ) က ပုံမှန်ဖြန့်ကျက်မှု (Normal Distribution) ရှိလား၊ မရှိဘူးလားဆိုတာကို မျက်စိနဲ့မြင်အောင် စစ်ဆေးတဲ့ နည်းလမ်းတစ်ခုဖြစ်ပါတယ်။ဘာလို့ ဒီကောင်ကို သုံးတာလဲ?linear regression လုပ်တယ်ဆိုတာ အိမ်တစ်လုံးရဲ့ အကျယ်အဝန်းကိုကြည့်ပြီး ဈေးနှုန်းခန့်မှန်းတာမျိုးပေါ့။ အဲဒီမှာ သင်္ချာနည်းကျ ယူဆချက်တစ်ခုက “ငါ့ရဲ့ ခန့်မှန်းချက်