مقدمه
در علم آمار، جدول توافقی (Contingency Table) ابزاری برای نمایش اطلاعات ماتریسی است که بر اساس فراوانی دوطرفه یا برحسب دو یا چند متغیر کیفی تنظیم شده است. به همین علت گاهی به آن جدول متقاطع (Cross Tabulation) نیز میگویند.
جدولهای توافقی برای خلاصهسازی و نمایش روابط بین متغیرهای دستهبندی شده (دستهای یا اسمی) مفید هستند. از این جداول میتوان برای بررسی وجود وابستگی یا استقلال بین متغیرها، مقایسه فراوانیها در گروههای مختلف و محاسبه آمارههای توصیفی مانند درصد و نسبت استفاده کرد.
اجزای جدول توافقی
یک جدول توافقی شامل ردیفها، ستونها و خانهها است:
- ردیفها: نشاندهنده مقادیر یک متغیر (معمولاً به عنوان متغیر وابسته در نظر گرفته میشود).
- ستونها: نشاندهنده مقادیر متغیر دیگر (معمولاً به عنوان متغیر مستقل در نظر گرفته میشود).
- خانهها: محل تقاطع بین ردیفها و ستونها. هر خانه شامل تعداد مشاهداتی است که در آن دسته خاص از متغیرها قرار میگیرند.
مثال
فرض کنید میخواهیم رابطه بین رنگ مو و رنگ چشم افراد را در یک نمونه 100 نفری بررسی کنیم.
رنگ موی افراد به سه دسته قهوهای، بلوند و سیاه و رنگ چشم آنها به دو دسته آبی و قهوهای طبقهبندی میشود.
با توجه به این اطلاعات، میتوانیم جدول توافقی زیر را ایجاد کنیم:
رنگ مو | رنگ چشم | فراوانی | درصد |
---|---|---|---|
قهوهای | آبی | 20 | 20% |
قهوهای | قهوهای | 30 | 30% |
بلوند | آبی | 25 | 25% |
بلوند | قهوهای | 25 | 25% |
سیاه | آبی | 10 | 10% |
سیاه | قهوهای | 0 | 0% |
جمع | – | 100 | 100% |
در این جدول، خانه (2، 1) نشاندهنده تعداد افرادی است که موهای قهوهای و چشمان آبی دارند (20 نفر) و خانه (4، 2) نشاندهنده تعداد افرادی است که موهای سیاه و چشمان قهوهای دارند (0 نفر).
تحلیل جدول توافقی
پس از ایجاد جدول توافقی، میتوان از روشهای مختلفی برای تحلیل دادهها استفاده کرد.
- بررسی فراوانیها: میتوان به سادگی فراوانیها را در هر خانه، ردیف و ستون مشاهده کرد. این امر به شما کمک میکند تا بفهمید کدام دستهها از متغیرها رایجتر هستند.
- محاسبه درصدها: میتوانید درصد مشاهدات را در هر خانه، ردیف و ستون محاسبه کنید. این امر به شما کمک میکند تا تناسب هر دسته را در مقایسه با کل نمونه درک کنید.
- آزمونهای آماری: میتوانید از آزمونهای آماری مانند آزمون کای دو برای بررسی وجود وابستگی یا استقلال بین متغیرها استفاده کنید.
- شاخصهای وابستگی: میتوانید از شاخصهای وابستگی مانند ضریب کرامر یا V Cramer برای سنجش قدرت رابطه بین متغیرها استفاده کنید.
کاربردهای جدول توافقی
جدولهای توافقی در زمینههای مختلفی کاربرد دارند، از جمله:
- پژوهشهای پزشکی: برای بررسی رابطه بین عوامل خطر و بیماریها.
- پژوهشهای بازاریابی: برای بررسی ترجیحات و رفتار مصرفکنندگان.
- علوم اجتماعی: برای بررسی روابط بین متغیرهای اجتماعی مانند نژاد، جنسیت و سطح تحصیلات.
مزایای استفاده از جدول توافقی
- ساده و آسان برای درک
- نمایش بصری واضح از روابط بین متغیرها
- مفید برای مقایسه فراوانیها در گروههای مختلف
- میتوان از آن برای محاسبه آمارههای توصیفی و انجام آزمونهای آماری استفاده کرد.
معایب استفاده از جدول توافقی
- با افزایش تعداد متغیرها، جدول میتواند پیچیده و دشوار برای تفسیر شود.
- فقط برای متغیرهای دستهبندی شده (دستهای یا اسمی) قابل استفاده است.
مثال تحلیل دادههای طبقهبندی شده با استفاده از جدول توافقی در پایتون
در این مثال، از کتابخانه pandas
برای ایجاد و تحلیل یک جدول توافقی از دادههای مربوط به رنگ مو و رنگ چشم افراد استفاده خواهیم کرد.
import pandas as pd
# دادهها را به صورت لیست دیکشنری ذخیره کنید
data = [
{"مو": "قهوهای", "چشم": "آبی"},
{"مو": "قهوهای", "چشم": "قهوهای"},
{"مو": "بلوند", "چشم": "آبی"},
{"مو": "بلوند", "چشم": "قهوهای"},
{"مو": "سیاه", "چشم": "آبی"},
{"مو": "سیاه", "چشم": "قهوهای"},
]
# تبدیل دادهها به DataFrame
df = pd.DataFrame(data)
# ایجاد جدول توافقی
table = pd.crosstab(df["مو"], df["چشم"], margins=True)
# نمایش جدول توافقی
print(table)
این کد خروجی زیر را تولید میکند:
چشم
مو آبی قهوهای جمع
قهوهای 20 30 50
بلوند 25 25 50
سیاه 10 0 10
جمع 55 55 110
در این مثال، ما از تابع pd.crosstab()
برای ایجاد جدول توافقی استفاده کردهایم. این تابع دو ستون مو
و چشم
را به عنوان ورودی میگیرد و یک جدول جدید با فراوانی مشاهدات در هر ترکیب از مقادیر دو ستون ایجاد میکند.
همچنین میتوان از سایر توابع کتابخانه pandas
برای محاسبه درصدها، انجام آزمونهای آماری و رسم نمودارها بر اساس دادههای جدول توافقی استفاده کرد.