در علوم داده و آمار، توزیع احتمال مفهومی بنیادی برای مطالعه رفتار و پیشبینی رویدادهای تصادفی است.
به طور کلی، توزیع احتمال به نحوه توزیع شدن مقادیر ممکن برای یک متغیر تصادفی اشاره میکند.
به عبارت دیگر، توزیع احتمال نشان میدهد که هر مقدار در فضای نمونه با چه احتمالی ممکن است رخ دهد.
انواع توزیعهای احتمال:
- توزیعهای گسسته: برای متغیرهای تصادفی گسسته که فقط میتوانند مقادیر مجزا و قابل شمارش داشته باشند، مانند تعداد دفعات پرتاب سکه یا تعداد افراد در یک کلاس درس.
- برخی از توزیعهای گسسته رایج: دوجملهای، هندسی، پواسون، هایپرژئومتریک
- توزیعهای پیوسته: برای متغیرهای تصادفی پیوسته که میتوانند هر مقداری در یک بازه خاص داشته باشند، مانند قد افراد یا وزن اشیاء.
- برخی از توزیعهای پیوسته رایج: یکنواخت، نرمال، نمایی، وایبول
شاخصهای توصیفی توزیعهای احتمال:
- امید ریاضی: میانگین مقادیر ممکن برای متغیر تصادفی.
- واریانس: میانگین مربع انحرافات مقادیر از امید ریاضی.
- انحراف معیار: جذر مربع واریانس.
کاربرد توزیعهای احتمال:
- مدلسازی پدیدههای تصادفی: از توزیعهای احتمال برای مدلسازی پدیدههای تصادفی مانند پرتاب سکه،掷 تاس، انتخاب تصادفی از یک لیست و غیره استفاده میشود.
- تحلیل دادههای تصادفی: از توزیعهای احتمال برای تحلیل دادههای تصادفی مانند نتایج نظرسنجیها، دادههای آزمایشگاهی و غیره استفاده میشود.
- استنتاج آماری: از توزیعهای احتمال برای استنتاج در مورد پارامترهای جمعیت بر اساس نمونهای از آن استفاده میشود.
مثال:
فرض کنید یک سکه را به طور تصادفی پرتاب میکنیم.
- متغیر تصادفی: نتیجه پرتاب سکه (سر یا دم)
- توزیع احتمال: دوجملهای با p = 0.5
این توزیع احتمال نشان میدهد که احتمال وقوع “سر” یا “دم” هر کدام ۰.۵ است.
منابع:
- در علوم داده و آمار، مفاهیم دیگری مانند تابع چگالی احتمال، تابع توزیع تجمعی و مونت کارلو نیز با توزیعهای احتمال مرتبط هستند.
- برای مطالعه بیشتر در مورد این مفاهیم، میتوانید به منابع تخصصی علوم داده و آمار مراجعه کنید.