naywinaung Biostatistics Chapter 4: Probability Distributions

Chapter 4: Probability Distributions

Chapter 4: Probability Distributions
Chapter 4: Probability Distributions အခန်းကတော့ ကျန်းမာရေးနယ်ပယ်မှာ အသုံးများတဲ့ ဖြစ်နိုင်ခြေဖြန့်ဝေမှုများ (Probability Distributions) ကို မိတ်ဆက်ပေးထားတာပါ။ Probability distributions ဆိုတာကတော့ ကျပန်းဖြစ်နိုင်ချေရှိတဲ့ ကိန်းရှင်တစ်ခုရဲ့ ဖြစ်နိုင်ခြေတွေကို ဖော်ပြတဲ့ပုံစံပါပဲ။

ဒီအခန်းမှာ အဓိကအားဖြင့် သင်ရမယ့်အရာတွေကတော့
1.ကျပန်းကိန်းရှင်တွေ (Random Variables) အကြောင်း
2.Discrete Probability Distributions နဲ့ သူတို့ရဲ့ ဂုဏ်သတ္တိတွေ၊ ဥပမာ Binomial Distribution နဲ့ Poisson Distribution
3.Continuous Probability Distributions နဲ့ သူတို့ရဲ့ ဂုဏ်သတ္တိတွေ၊ အထူးသဖြင့် ကျန်းမာရေးသိပ္ပံမှာ အရေးအကြီးဆုံးဖြစ်တဲ့ Normal Distribution တို့ ဖြစ်ပါတယ်။

ကျပန်းကိန်းရှင်များ (Random Variables)

ကျပန်းကိန်းရှင်ဆိုတာကတော့ တိုင်းတာခြင်း ဒါမှမဟုတ် လေ့လာခြင်းရဲ့ ရလဒ်ကို သင်္ချာတန်ဖိုးတစ်ခုအဖြစ် ဖော်ပြတာပါ။ ဥပမာ ဆေးကုသမှုခံယူတဲ့လူနာတစ်ဦးရဲ့ အသက် ဒါမှမဟုတ် သွေးပေါင်ချိန် စတာတွေ ဖြစ်နိုင်ပါတယ်။ ကျပန်းကိန်းရှင်ကို အကြီးစာလုံး X နဲ့ ဖော်ပြပြီး၊ အဲဒီကိန်းရှင်ရဲ့ တန်ဖိုးတစ်ခုချင်းစီကိုတော့ အသေးစာလုံး x နဲ့ ဖော်ပြပါတယ်။

ကျပန်းကိန်းရှင်တွေကို နှစ်မျိုးခွဲခြားနိုင်ပါတယ်။
•Discrete Random Variable (ပြတ်တောင်းပြတ်တောင်း ကျပန်းကိန်းရှင်): ဒီကိန်းရှင်တွေက ရေတွက်လို့ရတဲ့ တန်ဖိုးတွေကိုသာ ယူပါတယ်။ ဥပမာ – ဆေးရုံကိုလာတဲ့လူနာအရေအတွက်၊ သတ်မှတ်ထားတဲ့ကာလအတွင်း ရောဂါဖြစ်ပွားသူအရေအတွက် စတာတွေပါ။
•Continuous Random Variable (ဆက်တိုက် ကျပန်းကိန်းရှင်): ဒီကိန်းရှင်တွေကတော့ သတ်မှတ်ထားတဲ့ ကန့်သတ်ချက်နှစ်ခုကြားမှာ ဘယ်တန်ဖိုးကိုမဆို ယူနိုင်ပါတယ်။ ဥပမာ – လူနာတစ်ဦးရဲ့ အရပ်၊ ကိုယ်အလေးချိန်၊ သွေးပေါင်ချိန်၊ အပူချိန် စတာတွေပါ။

Probability Distribution (ဖြစ်နိုင်ခြေဖြန့်ဝေမှု)
Probability distribution ဆိုတာကတော့ ကျပန်းကိန်းရှင်တစ်ခုရဲ့ ဖြစ်နိုင်ချေရှိတဲ့ တန်ဖိုးတစ်ခုချင်းစီနဲ့ သူတို့နဲ့သက်ဆိုင်တဲ့ ဖြစ်နိုင်ခြေတွေကို ဖော်ပြတာပါ။
Discrete Probability Distributions (ပြတ်တောင်းပြတ်တောင်း ဖြစ်နိုင်ခြေဖြန့်ဝေမှုများ)
Discrete random variable တစ်ခုရဲ့ probability distribution ကတော့ တန်ဖိုးတစ်ခုစီအတွက် ဖြစ်နိုင်ခြေ f(x) ကို ဖော်ပြပါတယ်။

Probability distribution ဖြစ်ဖို့အတွက် လိုအပ်တဲ့အချက်နှစ်ချက်ကတော့
1.ဖြစ်နိုင်ခြေတစ်ခုချင်းစီဟာ သုညထက်ကြီးရမယ် ဒါမှမဟုတ် သုညနဲ့ညီရမယ် (f(x) ≥ 0)
2.ဖြစ်နိုင်ခြေအားလုံးကို ပေါင်းလိုက်ရင် ၁ နဲ့ ညီရမယ် (Σ f(x) = 1)
Discrete probability distribution တစ်ခုရဲ့ Mean (ပျမ်းမျှ) ကို μ နဲ့ ဖော်ပြပြီး၊ Variance (ပြန့်ကျဲမှု) ကို σ² နဲ့ ဖော်ပြပါတယ်။ Mean နဲ့ Variance ကို တွက်ချက်ဖို့ Formula တွေလည်း ဖော်ပြထားပါတယ်။

Bernoulli Trial (ဘာနိုလီ စမ်းသပ်မှု)
Bernoulli trial ဆိုတာကတော့ ရလဒ်နှစ်ခုသာရှိနိုင်တဲ့ စမ်းသပ်မှုမျိုးပါ။ ဥပမာ – လူနာတစ်ဦး ဆေးရုံဆင်းပြီးနောက် သတ်မှတ်ကာလအတွင်း အသက်ရှင်ခြင်း သို့မဟုတ် သေဆုံးခြင်း၊ ဆေးကုသမှုတစ်ခု အောင်မြင်ခြင်း သို့မဟုတ် မအောင်မြင်ခြင်း စတာတွေ ဖြစ်ပါတယ်။ ဒီရလဒ်နှစ်ခုကို “အောင်မြင်မှု” (success) နဲ့ “မအောင်မြင်မှု” (failure) လို့ ခေါ်နိုင်ပြီး၊ တစ်ခုက အောင်မြင်မှုဆိုရင် ကျန်တစ်ခုက မအောင်မြင်မှု (mutually exclusive outcomes) ပါ။

Binomial Distribution (ဘာနိုမီယယ် ဖြန့်ဝေမှု)
Binomial distribution က ကျန်းမာရေးသိပ္ပံမှာ အသုံးများတဲ့ distribution တစ်ခုပါ။ ဒီ distribution ဟာ Bernoulli trial တွေကနေ ဆင်းသက်လာတာပါ။ သတ်မှတ်ထားတဲ့ အကြိမ်ရေ (n) အတွင်း Bernoulli trial တွေကို လွတ်လွတ်လပ်လပ် ပြုလုပ်ပြီး အောင်မြင်မှု (x) အရေအတွက်ကို စိတ်ဝင်စားတဲ့အခါ Binomial distribution ကို အသုံးပြုပါတယ်။ ဒီ distribution မှာ ပါဝင်တဲ့ Parameter တွေကတော့ n (စမ်းသပ်မှုအရေအတွက်) နဲ့ p (တစ်ကြိမ်စမ်းသပ်မှုမှာ အောင်မြင်ဖို့ ဖြစ်နိုင်ခြေ) ပါ။ Binomial distribution ရဲ့ ဖြစ်နိုင်ခြေ function f(x) ကို တွက်ချက်ဖို့ Formula လည်း ပေးထားပါတယ်။

Poisson Distribution (ပိုအာဆွန် ဖြန့်ဝေမှု)
Poisson distribution ကတော့ သတ်မှတ်ထားတဲ့ ကာလ၊ နေရာ သို့မဟုတ် ပမာဏတစ်ခုအတွင်း ကျပန်းဖြစ်ရပ်တစ်ခု ဖြစ်ပွားတဲ့အရေအတွက် (x) အတွက် ဖြစ်နိုင်ခြေကို ပေးပါတယ်။ ဒီ distribution ရဲ့ Parameter က λ (lambda) ဖြစ်ပြီး သတ်မှတ်ကာလ/နေရာအတွင်း ကျပန်းဖြစ်ရပ် ဖြစ်ပွားတဲ့ ပျမ်းမျှအရေအတွက်ပါ။ Poisson distribution ရဲ့ ဖြစ်နိုင်ခြေ function f(x) ကို တွက်ချက်ဖို့ Formula လည်း ပေးထားပါတယ်။

Continuous Probability Distributions (ဆက်တိုက် ဖြစ်နိုင်ခြေဖြန့်ဝေမှုများ)
Continuous random variable တွေအတွက် probability distribution ကို probability density function လို့ ခေါ်ပါတယ်။ discrete distribution နဲ့ မတူတာက continuous distribution မှာ တန်ဖိုးတစ်ခုချင်းစီအတွက် ဖြစ်နိုင်ခြေက သုညပါ။ ဖြစ်နိုင်ခြေကို တွက်တဲ့အခါ သတ်မှတ်ထားတဲ့ တန်ဖိုးနှစ်ခု (a နဲ့ b) ကြား ဧရိယာ (area) ကို တွက်ရပါတယ်။ Function f(x) ရဲ့ အောက်က area ဟာ ဖြစ်နိုင်ခြေ P(a < X < b) ကို ကိုယ်စားပြုပါတယ်။
probability density function ဖြစ်ဖို့အတွက် လိုအပ်တဲ့အချက်နှစ်ချက်ကတော့
1.f(x) ≥ 0 (ဘယ် X တန်ဖိုးအတွက်မဆို function တန်ဖိုးက သုညထက်ကြီးရမယ် ဒါမှမဟုတ် သုညနဲ့ညီရမယ်)
2.Function ရဲ့ အောက်က စုစုပေါင်း area (x axis တစ်လျှောက်) ဟာ ၁ နဲ့ ညီရမယ်

The Normal Distribution (နော်မယ် ဖြန့်ဝေမှု)
Normal distribution ဟာ စာရင်းအင်းပညာမှာ အရေးအကြီးဆုံး distribution ပါ။ Gauss က Gaussian distribution လို့လည်း ခေါ်ပါတယ်။ Normal distribution မှာ အရေးကြီးတဲ့ ဂုဏ်သတ္တိတွေရှိပါတယ်။
1.ပုံသဏ္ဍာန်က ခေါင်းလောင်းပုံ (bell-shaped) ဖြစ်ပြီး ညီမျှခြင်း (symmetrical) ရှိပါတယ်။
2.Mean (ပျမ်းမျှ)၊ Median (အလယ်တန်ဖိုး) နဲ့ Mode (အကြိမ်ရေအများဆုံးတန်ဖိုး) တွေဟာ တူညီပြီး distribution ရဲ့ အလယ်မှာ ရှိပါတယ်။
3.Curve အောက်က စုစုပေါင်း area ဟာ ၁ နဲ့ ညီပါတယ်။
4.Mean ကနေ Standard Deviation (σ) ၁ ခုခြား ဧရိယာဟာ ၆၈% ခန့်ရှိပါတယ်။
5.Mean ကနေ Standard Deviation ၂ ခုခြား ဧရိယာဟာ ၉၅% ခန့်ရှိပါတယ်။
6.Mean ကနေ Standard Deviation ၃ ခုခြား ဧရိယာဟာ ၉၉.၇% ခန့်ရှိပါတယ်။

The Standard Normal Distribution (စံ နော်မယ် ဖြန့်ဝေမှု)
Normal distribution တွေဟာ μ (mean) နဲ့ σ (standard deviation) တန်ဖိုးပေါ် မူတည်ပြီး ပုံစံမျိုးစုံ ရှိနိုင်ပါတယ်။ ဒီထဲမှာ အရေးအကြီးဆုံးကတော့ Standard Normal Distribution ပါ။ ဒီ distribution မှာ mean က 0 ဖြစ်ပြီး standard deviation က 1 ဖြစ်ပါတယ်။ ဘယ် normal distribution ကိုမဆို Z-transformation Formula ကို အသုံးပြုပြီး Standard Normal Distribution အဖြစ် ပြောင်းလို့ရပါတယ်။ Z-score ကတော့ z = (X – μ) / σ ဖြစ်ပြီး၊ ဒီ Z-score တွေအတွက် ဖြစ်နိုင်ခြေဧရိယာတွေကို Appendix Table D မှာ ရှာဖွေနိုင်ပါတယ်။

ခြုံငုံပြီးပြောရရင် Chapter 4 ဟာ Probability Distribution တွေရဲ့ အခြေခံသဘောတရားတွေ၊ discrete နဲ့ continuous random variables တွေရဲ့ distribution အမျိုးအစားတွေ (Binomial, Poisson, Normal) နဲ့ သူတို့ရဲ့ အရေးကြီးတဲ့ ဂုဏ်သတ္တိတွေအကြောင်းကို ဖော်ပြထားတာပါ။ ဒီသဘောတရားတွေဟာ နောက်အခန်းတွေမှာ သင်ရမယ့် statistical inference တွေကို နားလည်ဖို့အတွက် အုတ်မြစ်ချပေးထားတာ ဖြစ်ပါတယ်။

အခန်းရဲ့ နောက်ဆုံးမှာ Formulas Summary နဲ့ Review Questions တွေလည်း ပါဝင်ပါတယ်။
ဒါကတော့ Chapter 4 ရဲ့ အဓိကအချက်တွေပဲ ဖြစ်ပါတယ်။


Discover more from naywinaung

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post

Daniel Chapter 3:Daniel Chapter 3:

Daniel Chapter 3:အခြေခံ ဖြစ်နိုင်ခြေ သဘောတရားများ (Some Basic Probability Concepts)Chapter 3 ဟာ ဖြစ်နိုင်ခြေရဲ့ အခြေခံသဘောတရားတွေကို မိတ်ဆက်ပေးပြီး ကိန်းဂဏန်းဆိုင်ရာ ကောက်ချက်ချမှုတွေအတွက် အုတ်မြစ်ချပေးပါတယ်ဒီအခန်းရဲ့ အဓိကရည်ရွယ်ချက်ကတော့ ကျန်းမာရေးသိပ္ပံနယ်ပယ်မှာ အသုံးဝင်တဲ့ ဖြစ်နိုင်ခြေဆိုင်ရာ အယူအဆတွေနဲ့ တွက်ချက်မှုတွေကို နားလည်စေဖို့ ဖြစ်ပါတယ်။ဖြစ်နိုင်ခြေကို ရှုထောင့်နှစ်မျိုးနဲ့ ကြည့်နိုင်ပါတယ်။ပထမတစ်ခုကတော့ ရည်ရွယ်ချက်အခြေခံ ဖြစ်နိုင်ခြေ (Objective

Simple Linear Regression နှင့် CorrelationSimple Linear Regression နှင့် Correlation

အခန်း ၉ ဖြစ်တဲ့ “Simple Linear Regression နှင့် Correlation” အကြောင်းကို အသေးစိတ် တင်ပြပေးပါမယ်။ဒီအခန်းက ဘာတွေအကြောင်းလဲဆိုတော့ အချက်အလက်နှစ်ခုကြားက ဆက်နွှယ်မှုကို ဘယ်လို လေ့လာမယ်၊ တိုင်းတာမလဲဆိုတဲ့ အခြေခံနည်းလမ်းနှစ်ခုကို မိတ်ဆက်ပေးတာ ဖြစ်ပါတယ်။ Regression က အချက်အလက်တစ်ခု (Y) ကို နောက်တစ်ခု (X) ကို အခြေခံပြီး ခန့်မှန်းတာ၊

Chapter 12 The Chi-Square DistributionChapter 12 The Chi-Square Distribution

အခန်း ၁၂ ဖြစ်တဲ့ “ခိုင်စကွဲယား ဖြန့်ဝေမှု (The Chi-Square Distribution) နဲ့ ကြိမ်နှုန်းဆိုင်ရာ ခွဲခြမ်းစိတ်ဖြာခြင်း (Analysis of Frequencies)” အကြောင်းကို ဆွေးနွေးပေးပါမယ်။ ဒီအခန်းဟာ ကျွန်တော်တို့ အရင်က လေ့လာခဲ့တဲ့ ကိန်းဂဏာန်း တိုင်းတာမှုတွေ ဒါမှမဟုတ် ဆက်နွယ်မှုတွေနဲ့ မတူဘဲ အရေအတွက် (counts) ဒါမှမဟုတ် ကြိမ်နှုန်း (frequencies)