آمار و احتمال

آزمون‌های کای دو

توضیح جامع آزمون‌های کای دو (χ۲)

آزمون‌های کای دو (χ۲) از جمله ابزارهای آماری پرکاربرد در آمار استنباطی هستند که برای بررسی فرضیه‌هایی در مورد جمعیت با استفاده از داده‌های دسته‌بندی شده (دسته‌ای یا کیفی) به کار می‌روند.

در این نوع آزمون‌ها، فرضیه صفر (H0) بیان می‌کند که توزیع دسته‌بندی مشاهده شده در نمونه با توزیع انتظاری (توزیع فرضی) یکسان است. در مقابل، فرضیه بدیل (H1) بیان می‌کند که توزیع دسته‌بندی مشاهده شده در نمونه با توزیع انتظاری (توزیع فرضی) تفاوت دارد.

دو نوع اصلی از آزمون‌های کای دو وجود دارد:

  • آزمون کای دو استقلال: برای بررسی استقلال دو متغیر دسته‌بندی (مانند جنسیت و رنگ مو) به کار می‌رود.
  • آزمون کای دو برابری نسبت‌ها: برای بررسی تفاوت نسبت‌ها در دو یا چند گروه دسته‌بندی (مانند نسبت افراد سیگاری در دو گروه سنی) به کار می‌رود.

مراحل انجام آزمون‌های کای دو:

  1. طرح سوال تحقیق و تعیین فرضیه‌ها: ابتدا باید سوال تحقیق خود را به صورت واضح مشخص کنید و فرضیه‌های صفر و بدیل را برای آزمون خود تعیین کنید.
  2. جمع‌آوری داده‌ها: داده‌های دسته‌بندی شده را برای دو یا چند گروه جمع‌آوری کنید.
  3. ایجاد جدول تناوب فرض‌ها: جدول تناوب فرض‌ها را با استفاده از داده‌های جمع‌آوری شده ایجاد کنید.
  4. محاسبه آماره‌ی آزمون: با استفاده از فرمول آماره کای دو و اطلاعات جدول تناوب فرض‌ها، آماره کای دو را محاسبه کنید.
  5. تعیین مقدار p: با استفاده از جدول کای دو یا نرم‌افزارهای آماری، مقدار p را برای آماره کای دو محاسبه شده و درجات آزادی بدست آورید.
  6. تفسیر نتایج: مقدار p را با سطح معنی‌داری (معمولاً ۰.۰۵) مقایسه کنید:
    • اگر مقدار p کمتر از سطح معنی‌داری باشد، فرضیه صفر رد و فرضیه بدیل پذیرفته می‌شود.
    • اگر مقدار p بزرگتر یا مساوی سطح معنی‌داری باشد، به اندازه کافی برای رد فرضیه صفر، شواهد وجود ندارد.

مثال‌های کاربردی آزمون‌های کای دو:

در ادامه به ارائه چند مثال دیگر از کاربرد آزمون‌های کای دو در زمینه‌های مختلف می‌پردازیم:

مثال ۱: آزمون کای دو استقلال برای بررسی ارتباط بین سطح تحصیلات و تمایل به استفاده از اینترنت

فرض کنید می‌خواهیم ببینیم آیا بین سطح تحصیلات افراد و تمایل به استفاده از اینترنت ارتباط معنی‌داری وجود دارد یا خیر. برای این کار از آزمون کای دو استقلال استفاده می‌کنیم.

مراحل انجام آزمون:

  1. جمع‌آوری داده‌ها: سطح تحصیلات (دیپلم، لیسانس، فوق‌لیسانس و دکترا) و تمایل به استفاده از اینترنت (بله یا خیر) ۲۰۰ نفر به طور تصادفی ثبت می‌شود.
  2. ایجاد جدول تناوب فرض‌ها:
سطح تحصیلات تمایل به استفاده از اینترنت تعداد مشاهده شده تعداد فرضی
دیپلم بله ۴۵ ۵۰
دیپلم خیر ۳۵ ۵۰
لیسانس بله ۷۰ ۶۰
لیسانس خیر ۳۰ ۴۰
فوق‌لیسانس بله ۳۵ ۲۵
فوق‌لیسانس خیر ۱۵ ۲۵
دکترا بله ۱۵ ۱۰
دکترا خیر ۵ ۱۰
  1. محاسبه آماره‌ی آزمون: با استفاده از نرم‌افزار آماری، آماره کای دو ۲۴.۱ و درجات آزادی ۱۸ محاسبه می‌شود.
  2. تعیین مقدار p: با استفاده از جدول کای دو، مقدار p برای آماره کای دو محاسبه شده و درجات آزادی ۰.۰۱۳ بدست می‌آید.
  3. تفسیر نتایج:
  • مقدار p (0.013) از سطح معنی‌داری (۰.۰۵) کمتر است.
  • بنابراین، فرضیه صفر رد و فرضیه بدیل پذیرفته می‌شود.
  • با سطح اطمینان ۹۵% می‌توان نتیجه‌گیری کرد که بین سطح تحصیلات افراد و تمایل به استفاده از اینترنت ارتباط معنی‌داری وجود دارد.

مثال ۲: آزمون کای دو برابری نسبت‌ها برای بررسی تفاوت نرخ قبولی در دو رشته تحصیلی مختلف

فرض کنید می‌خواهیم ببینیم آیا نرخ قبولی دانشجویان در دو رشته تحصیلی مهندسی کامپیوتر و مهندسی برق با یکدیگر تفاوت معنی‌داری دارد یا خیر. برای این کار از آزمون کای دو برابری نسبت‌ها استفاده می‌کنیم.

مراحل انجام آزمون:

  1. جمع‌آوری داده‌ها: وضعیت قبولی (قبول یا مردود) دانشجویان دو رشته تحصیلی مهندسی کامپیوتر و مهندسی برق در یک دانشگاه به طور تصادفی بررسی می‌شود.
  2. ایجاد جدول تناوب فرض‌ها:
وضعیت قبولی رشته تحصیلی تعداد مشاهده شده تعداد فرضی
قبول مهندسی کامپیوتر ۶۰ ۵۵
قبول مهندسی برق ۴۰ ۴۵
مردود مهندسی کامپیوتر ۲۰ ۲۵
مردود مهندسی برق ۳۰ ۲۵
  1. محاسبه آماره‌ی آزمون: با استفاده از نرم‌افزار آماری، آماره کای دو ۲.۸۴ و درجات آزادی ۱ محاسبه می‌شود.
  2. تعیین مقدار p: با استفاده از جدول کای دو، مقدار p برای آماره کای دو محاسبه شده و درجات آزادی ۰.۰۹۲ بدست می‌آید.
  3. تفسیر نتایج:
  • مقدار p (0.092) از سطح معنی‌داری (۰.۰۵) بیشتر است.
  • بنابراین، به اندازه کافی برای رد فرضیه صفر، شواهد وجود ندارد.

مثال ۳: آزمون کای دو برای بررسی تناسب تاس‌های یک بازی

فرض کنید می‌خواهیم ببینیم که آیا تاس‌های یک بازی به طور عادلانه تاس ریخته می‌شوند یا خیر. به عبارت دیگر، می‌خواهیم بررسی کنیم که آیا احتمال آمدن هر وجه از تاس برابر با ۱/۶ است یا خیر. برای این کار از آزمون کای دو استفاده می‌کنیم.

مراحل انجام آزمون:

  1. جمع‌آوری داده‌ها: تاس را ۱۰۰ بار پرتاب می‌کنیم و تعداد دفعات آمدن هر وجه را ثبت می‌کنیم.
  2. ایجاد جدول تناوب فرض‌ها:
وجه تاس تعداد مشاهده شده تعداد فرضی
۱ ۱۸ ۱۶.۶۷
۲ ۱۴ ۱۶.۶۷
۳ ۱۹ ۱۶.۶۷
۴ ۱۷ ۱۶.۶۷
۵ ۱۵ ۱۶.۶۷
۶ ۱۷ ۱۶.۶۷
  1. محاسبه آماره‌ی آزمون: با استفاده از نرم‌افزار آماری، آماره کای دو ۱.۱۴ و درجات آزادی ۵ محاسبه می‌شود.
  2. تعیین مقدار p: با استفاده از جدول کای دو، مقدار p برای آماره کای دو محاسبه شده و درجات آزادی ۰.۸۹۱ بدست می‌آید.
  3. تفسیر نتایج:
  • مقدار p (0.891) از سطح معنی‌داری (۰.۰۵) بیشتر است.
  • بنابراین، به اندازه کافی برای رد فرضیه صفر، شواهد وجود ندارد.
  • با سطح اطمینان ۹۵% می‌توان نتیجه‌گیری کرد که تاس‌های بازی به طور عادلانه تاس ریخته می‌شوند.

مثال ۴: آزمون کای دو برای بررسی وابستگی بین پاسخ‌های دو نظرسنجی

فرض کنید دو نظرسنجی در مورد یک موضوع خاص انجام شده است و می‌خواهیم ببینیم آیا بین پاسخ‌های دو نظرسنجی ارتباط معنی‌داری وجود دارد یا خیر. برای این کار از آزمون کای دو استقلال استفاده می‌کنیم.

مراحل انجام آزمون:

  1. جمع‌آوری داده‌ها: پاسخ‌های ۱۰۰ نفر به دو نظرسنجی در مورد یک موضوع خاص جمع‌آوری می‌شود.
  2. ایجاد جدول تناوب فرض‌ها:
پاسخ نظرسنجی ۱ پاسخ نظرسنجی ۲ تعداد مشاهده شده تعداد فرضی
موافق موافق ۳۰ ۲۵
موافق مخالف ۲۰ ۲۰
مخالف موافق ۲۵ ۲۵
مخالف مخالف ۲۵ ۳۰
  1. محاسبه آماره‌ی آزمون: با استفاده از نرم‌افزار آماری، آماره کای دو ۲.۵ و درجات آزادی ۳ محاسبه می‌شود.
  2. تعیین مقدار p: با استفاده از جدول کای دو، مقدار p برای آماره کای دو محاسبه شده و درجات آزادی ۰.۲۸۱ بدست می‌آید.
  3. تفسیر نتایج:
  • مقدار p (0.281) از سطح معنی‌داری (۰.۰۵) بیشتر است.
  • بنابراین، به اندازه کافی برای رد فرضیه صفر، شواهد وجود ندارد.
  • با سطح اطمینان ۹۵% می‌توان نتیجه‌گیری کرد که بین پاسخ‌های دو نظرسنجی ارتباط معنی‌داری وجود ندارد.
۵/۵ ( ۱ امتیاز )
نمایش بیشتر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا