توزیع برنولی چیست؟
توزیع برنولی یکی از بنیادیترین توزیعهای احتمال در آمار و نظریهٔ احتمالات است که به بررسی آزمایشهای تصادفی دو وضعیتی میپردازد. در این نوع آزمایشها، فقط دو پیامد یا نتیجهٔ ممکن وجود دارد که معمولاً به آنها موفقیت و شکست میگویند.
به عنوان مثال، میتوان به موارد زیر اشاره کرد:
- پرتاب یک سکه: دو نتیجهٔ ممکن عبارتند از شیر و خط.
- انتخاب یک فرد به طور تصادفی: دو نتیجهٔ ممکن عبارتند از مرد یا زن بودن.
- آزمایش خون برای یک بیماری خاص: دو نتیجهٔ ممکن عبارتند از داشتن یا نداشتن بیماری.
متغیر تصادفی در توزیع برنولی، با X نشان داده میشود و مقادیر ۰ (در صورت شکست) و ۱ (در صورت موفقیت) را به خود میگیرد.
مفاهیم کلیدی در توزیع برنولی:
- احتمال موفقیت (p): احتمال وقوع نتیجهٔ “موفقیت” در یک آزمایش برنولی را نشان میدهد.
- احتمال شکست (q): 1 – p است و احتمال وقوع نتیجهٔ “شکست” در یک آزمایش برنولی را نشان میدهد.
تابع جرم احتمال:
تابع جرم احتمال (PMF) توزیع برنولی، احتمال X را برای هر مقدار از آن تعیین میکند:
- P(X = 0) = q = 1 – p: احتمال وقوع “شکست”.
- P(X = 1) = p: احتمال وقوع “موفقیت”.
مثال کاربردی:
فرض کنید سکهای را به طور تصادفی ۱۰ بار پرتاب میکنیم. احتمال اینکه دقیقاً ۳ بار شیر بیاید چقدر است؟
در این مثال، X تعداد دفعاتی است که شیر میآید. بنابراین، X یک متغیر تصادفی برنولی با p = 0.5 (احتمال شیر آمدن) است.
ما میخواهیم P(X = 3) را محاسبه کنیم، که احتمال ۳ بار شیر آمدن در ۱۰ پرتاب است.
این احتمال را میتوان با استفاده از ترکیبهای با جایگزینی و PMF توزیع برنولی محاسبه کرد:
P(X = 3) = (10C3) * p^3 * q^7 = (10 * 9 * 8) / (3 * 2 * 1) * (0.5)^3 * (0.5)^7 = 0.125
بنابراین، احتمال اینکه دقیقاً ۳ بار در ۱۰ پرتاب سکه، شیر بیاید ۰.۱۲۵ یا ۱۲.۵% است.
کاربردهای توزیع برنولی:
توزیع برنولی کاربردهای فراوانی در علوم مختلف، از جمله موارد زیر دارد:
- آزمایشهای پزشکی: برای بررسی احتمال ابتلا به یک بیماری خاص یا اثربخشی یک درمان جدید.
- کنترل کیفیت: برای بررسی تعداد محصولات معیوب در یک خط تولید.
- علم سیاست: برای پیشبینی نتایج انتخابات یا نظرسنجیها.
- یادگیری ماشین: به عنوان بلوک ساختاری برای مدلهای پیچیدهتر مانند رگرسیون لجستیک و شبکههای عصبی مصنوعی.
جمعبندی:
توزیع برنولی یک توزیع احتمالی بنیادی در آمار است که برای مدلسازی آزمایشهای تصادفی دو وضعیتی به کار میرود. این توزیع دارای کاربردهای فراوانی در زمینههای مختلف مانند پزشکی، کنترل کیفیت، علوم سیاسی و یادگیری ماشین است.