توضیح جامع آزمونهای کای دو (χ۲)
آزمونهای کای دو (χ۲) از جمله ابزارهای آماری پرکاربرد در آمار استنباطی هستند که برای بررسی فرضیههایی در مورد جمعیت با استفاده از دادههای دستهبندی شده (دستهای یا کیفی) به کار میروند.
در این نوع آزمونها، فرضیه صفر (H0) بیان میکند که توزیع دستهبندی مشاهده شده در نمونه با توزیع انتظاری (توزیع فرضی) یکسان است. در مقابل، فرضیه بدیل (H1) بیان میکند که توزیع دستهبندی مشاهده شده در نمونه با توزیع انتظاری (توزیع فرضی) تفاوت دارد.
دو نوع اصلی از آزمونهای کای دو وجود دارد:
- آزمون کای دو استقلال: برای بررسی استقلال دو متغیر دستهبندی (مانند جنسیت و رنگ مو) به کار میرود.
- آزمون کای دو برابری نسبتها: برای بررسی تفاوت نسبتها در دو یا چند گروه دستهبندی (مانند نسبت افراد سیگاری در دو گروه سنی) به کار میرود.
مراحل انجام آزمونهای کای دو:
- طرح سوال تحقیق و تعیین فرضیهها: ابتدا باید سوال تحقیق خود را به صورت واضح مشخص کنید و فرضیههای صفر و بدیل را برای آزمون خود تعیین کنید.
- جمعآوری دادهها: دادههای دستهبندی شده را برای دو یا چند گروه جمعآوری کنید.
- ایجاد جدول تناوب فرضها: جدول تناوب فرضها را با استفاده از دادههای جمعآوری شده ایجاد کنید.
- محاسبه آمارهی آزمون: با استفاده از فرمول آماره کای دو و اطلاعات جدول تناوب فرضها، آماره کای دو را محاسبه کنید.
- تعیین مقدار p: با استفاده از جدول کای دو یا نرمافزارهای آماری، مقدار p را برای آماره کای دو محاسبه شده و درجات آزادی بدست آورید.
- تفسیر نتایج: مقدار p را با سطح معنیداری (معمولاً ۰.۰۵) مقایسه کنید:
- اگر مقدار p کمتر از سطح معنیداری باشد، فرضیه صفر رد و فرضیه بدیل پذیرفته میشود.
- اگر مقدار p بزرگتر یا مساوی سطح معنیداری باشد، به اندازه کافی برای رد فرضیه صفر، شواهد وجود ندارد.
مثالهای کاربردی آزمونهای کای دو:
در ادامه به ارائه چند مثال دیگر از کاربرد آزمونهای کای دو در زمینههای مختلف میپردازیم:
مثال ۱: آزمون کای دو استقلال برای بررسی ارتباط بین سطح تحصیلات و تمایل به استفاده از اینترنت
فرض کنید میخواهیم ببینیم آیا بین سطح تحصیلات افراد و تمایل به استفاده از اینترنت ارتباط معنیداری وجود دارد یا خیر. برای این کار از آزمون کای دو استقلال استفاده میکنیم.
مراحل انجام آزمون:
- جمعآوری دادهها: سطح تحصیلات (دیپلم، لیسانس، فوقلیسانس و دکترا) و تمایل به استفاده از اینترنت (بله یا خیر) ۲۰۰ نفر به طور تصادفی ثبت میشود.
- ایجاد جدول تناوب فرضها:
سطح تحصیلات | تمایل به استفاده از اینترنت | تعداد مشاهده شده | تعداد فرضی |
---|---|---|---|
دیپلم | بله | ۴۵ | ۵۰ |
دیپلم | خیر | ۳۵ | ۵۰ |
لیسانس | بله | ۷۰ | ۶۰ |
لیسانس | خیر | ۳۰ | ۴۰ |
فوقلیسانس | بله | ۳۵ | ۲۵ |
فوقلیسانس | خیر | ۱۵ | ۲۵ |
دکترا | بله | ۱۵ | ۱۰ |
دکترا | خیر | ۵ | ۱۰ |
- محاسبه آمارهی آزمون: با استفاده از نرمافزار آماری، آماره کای دو ۲۴.۱ و درجات آزادی ۱۸ محاسبه میشود.
- تعیین مقدار p: با استفاده از جدول کای دو، مقدار p برای آماره کای دو محاسبه شده و درجات آزادی ۰.۰۱۳ بدست میآید.
- تفسیر نتایج:
- مقدار p (0.013) از سطح معنیداری (۰.۰۵) کمتر است.
- بنابراین، فرضیه صفر رد و فرضیه بدیل پذیرفته میشود.
- با سطح اطمینان ۹۵% میتوان نتیجهگیری کرد که بین سطح تحصیلات افراد و تمایل به استفاده از اینترنت ارتباط معنیداری وجود دارد.
مثال ۲: آزمون کای دو برابری نسبتها برای بررسی تفاوت نرخ قبولی در دو رشته تحصیلی مختلف
فرض کنید میخواهیم ببینیم آیا نرخ قبولی دانشجویان در دو رشته تحصیلی مهندسی کامپیوتر و مهندسی برق با یکدیگر تفاوت معنیداری دارد یا خیر. برای این کار از آزمون کای دو برابری نسبتها استفاده میکنیم.
مراحل انجام آزمون:
- جمعآوری دادهها: وضعیت قبولی (قبول یا مردود) دانشجویان دو رشته تحصیلی مهندسی کامپیوتر و مهندسی برق در یک دانشگاه به طور تصادفی بررسی میشود.
- ایجاد جدول تناوب فرضها:
وضعیت قبولی | رشته تحصیلی | تعداد مشاهده شده | تعداد فرضی |
---|---|---|---|
قبول | مهندسی کامپیوتر | ۶۰ | ۵۵ |
قبول | مهندسی برق | ۴۰ | ۴۵ |
مردود | مهندسی کامپیوتر | ۲۰ | ۲۵ |
مردود | مهندسی برق | ۳۰ | ۲۵ |
- محاسبه آمارهی آزمون: با استفاده از نرمافزار آماری، آماره کای دو ۲.۸۴ و درجات آزادی ۱ محاسبه میشود.
- تعیین مقدار p: با استفاده از جدول کای دو، مقدار p برای آماره کای دو محاسبه شده و درجات آزادی ۰.۰۹۲ بدست میآید.
- تفسیر نتایج:
- مقدار p (0.092) از سطح معنیداری (۰.۰۵) بیشتر است.
- بنابراین، به اندازه کافی برای رد فرضیه صفر، شواهد وجود ندارد.
مثال ۳: آزمون کای دو برای بررسی تناسب تاسهای یک بازی
فرض کنید میخواهیم ببینیم که آیا تاسهای یک بازی به طور عادلانه تاس ریخته میشوند یا خیر. به عبارت دیگر، میخواهیم بررسی کنیم که آیا احتمال آمدن هر وجه از تاس برابر با ۱/۶ است یا خیر. برای این کار از آزمون کای دو استفاده میکنیم.
مراحل انجام آزمون:
- جمعآوری دادهها: تاس را ۱۰۰ بار پرتاب میکنیم و تعداد دفعات آمدن هر وجه را ثبت میکنیم.
- ایجاد جدول تناوب فرضها:
وجه تاس | تعداد مشاهده شده | تعداد فرضی |
---|---|---|
۱ | ۱۸ | ۱۶.۶۷ |
۲ | ۱۴ | ۱۶.۶۷ |
۳ | ۱۹ | ۱۶.۶۷ |
۴ | ۱۷ | ۱۶.۶۷ |
۵ | ۱۵ | ۱۶.۶۷ |
۶ | ۱۷ | ۱۶.۶۷ |
- محاسبه آمارهی آزمون: با استفاده از نرمافزار آماری، آماره کای دو ۱.۱۴ و درجات آزادی ۵ محاسبه میشود.
- تعیین مقدار p: با استفاده از جدول کای دو، مقدار p برای آماره کای دو محاسبه شده و درجات آزادی ۰.۸۹۱ بدست میآید.
- تفسیر نتایج:
- مقدار p (0.891) از سطح معنیداری (۰.۰۵) بیشتر است.
- بنابراین، به اندازه کافی برای رد فرضیه صفر، شواهد وجود ندارد.
- با سطح اطمینان ۹۵% میتوان نتیجهگیری کرد که تاسهای بازی به طور عادلانه تاس ریخته میشوند.
مثال ۴: آزمون کای دو برای بررسی وابستگی بین پاسخهای دو نظرسنجی
فرض کنید دو نظرسنجی در مورد یک موضوع خاص انجام شده است و میخواهیم ببینیم آیا بین پاسخهای دو نظرسنجی ارتباط معنیداری وجود دارد یا خیر. برای این کار از آزمون کای دو استقلال استفاده میکنیم.
مراحل انجام آزمون:
- جمعآوری دادهها: پاسخهای ۱۰۰ نفر به دو نظرسنجی در مورد یک موضوع خاص جمعآوری میشود.
- ایجاد جدول تناوب فرضها:
پاسخ نظرسنجی ۱ | پاسخ نظرسنجی ۲ | تعداد مشاهده شده | تعداد فرضی |
---|---|---|---|
موافق | موافق | ۳۰ | ۲۵ |
موافق | مخالف | ۲۰ | ۲۰ |
مخالف | موافق | ۲۵ | ۲۵ |
مخالف | مخالف | ۲۵ | ۳۰ |
- محاسبه آمارهی آزمون: با استفاده از نرمافزار آماری، آماره کای دو ۲.۵ و درجات آزادی ۳ محاسبه میشود.
- تعیین مقدار p: با استفاده از جدول کای دو، مقدار p برای آماره کای دو محاسبه شده و درجات آزادی ۰.۲۸۱ بدست میآید.
- تفسیر نتایج:
- مقدار p (0.281) از سطح معنیداری (۰.۰۵) بیشتر است.
- بنابراین، به اندازه کافی برای رد فرضیه صفر، شواهد وجود ندارد.
- با سطح اطمینان ۹۵% میتوان نتیجهگیری کرد که بین پاسخهای دو نظرسنجی ارتباط معنیداری وجود ندارد.