آمار و احتمال

تحلیل داده‌های طبقه‌بندی شده با جدول توافقی (Contingency Table)

 مقدمه

در علم آمار، جدول توافقی (Contingency Table) ابزاری برای نمایش اطلاعات ماتریسی است که بر اساس فراوانی دوطرفه یا برحسب دو یا چند متغیر کیفی تنظیم شده است. به همین علت گاهی به آن جدول متقاطع (Cross Tabulation) نیز می‌گویند.

جدول‌های توافقی برای خلاصه‌سازی و نمایش روابط بین متغیرهای دسته‌بندی شده (دسته‌ای یا اسمی) مفید هستند. از این جداول می‌توان برای بررسی وجود وابستگی یا استقلال بین متغیرها، مقایسه فراوانی‌ها در گروه‌های مختلف و محاسبه آماره‌های توصیفی مانند درصد و نسبت استفاده کرد.

اجزای جدول توافقی

یک جدول توافقی شامل ردیف‌ها، ستون‌ها و خانه‌ها است:

  • ردیف‌ها: نشان‌دهنده مقادیر یک متغیر (معمولاً به عنوان متغیر وابسته در نظر گرفته می‌شود).
  • ستون‌ها: نشان‌دهنده مقادیر متغیر دیگر (معمولاً به عنوان متغیر مستقل در نظر گرفته می‌شود).
  • خانه‌ها: محل تقاطع بین ردیف‌ها و ستون‌ها. هر خانه شامل تعداد مشاهداتی است که در آن دسته خاص از متغیرها قرار می‌گیرند.

مثال

فرض کنید می‌خواهیم رابطه بین رنگ مو و رنگ چشم افراد را در یک نمونه 100 نفری بررسی کنیم.

رنگ موی افراد به سه دسته قهوه‌ای، بلوند و سیاه و رنگ چشم آنها به دو دسته آبی و قهوه‌ای طبقه‌بندی می‌شود.

با توجه به این اطلاعات، می‌توانیم جدول توافقی زیر را ایجاد کنیم:

رنگ مو رنگ چشم فراوانی درصد
قهوه‌ای آبی 20 20%
قهوه‌ای قهوه‌ای 30 30%
بلوند آبی 25 25%
بلوند قهوه‌ای 25 25%
سیاه آبی 10 10%
سیاه قهوه‌ای 0 0%
جمع 100 100%

در این جدول، خانه (2، 1) نشان‌دهنده تعداد افرادی است که موهای قهوه‌ای و چشمان آبی دارند (20 نفر) و خانه (4، 2) نشان‌دهنده تعداد افرادی است که موهای سیاه و چشمان قهوه‌ای دارند (0 نفر).

تحلیل جدول توافقی

پس از ایجاد جدول توافقی، می‌توان از روش‌های مختلفی برای تحلیل داده‌ها استفاده کرد.

  • بررسی فراوانی‌ها: می‌توان به سادگی فراوانی‌ها را در هر خانه، ردیف و ستون مشاهده کرد. این امر به شما کمک می‌کند تا بفهمید کدام دسته‌ها از متغیرها رایج‌تر هستند.
  • محاسبه درصدها: می‌توانید درصد مشاهدات را در هر خانه، ردیف و ستون محاسبه کنید. این امر به شما کمک می‌کند تا تناسب هر دسته را در مقایسه با کل نمونه درک کنید.
  • آزمون‌های آماری: می‌توانید از آزمون‌های آماری مانند آزمون کای دو برای بررسی وجود وابستگی یا استقلال بین متغیرها استفاده کنید.
  • شاخص‌های وابستگی: می‌توانید از شاخص‌های وابستگی مانند ضریب کرامر یا V Cramer برای سنجش قدرت رابطه بین متغیرها استفاده کنید.

کاربردهای جدول توافقی

جدول‌های توافقی در زمینه‌های مختلفی کاربرد دارند، از جمله:

  • پژوهش‌های پزشکی: برای بررسی رابطه بین عوامل خطر و بیماری‌ها.
  • پژوهش‌های بازاریابی: برای بررسی ترجیحات و رفتار مصرف‌کنندگان.
  • علوم اجتماعی: برای بررسی روابط بین متغیرهای اجتماعی مانند نژاد، جنسیت و سطح تحصیلات.

مزایای استفاده از جدول توافقی

  • ساده و آسان برای درک
  • نمایش بصری واضح از روابط بین متغیرها
  • مفید برای مقایسه فراوانی‌ها در گروه‌های مختلف
  • می‌توان از آن برای محاسبه آماره‌های توصیفی و انجام آزمون‌های آماری استفاده کرد.

معایب استفاده از جدول توافقی

  • با افزایش تعداد متغیرها، جدول می‌تواند پیچیده و دشوار برای تفسیر شود.
  • فقط برای متغیرهای دسته‌بندی شده (دسته‌ای یا اسمی) قابل استفاده است.

مثال تحلیل داده‌های طبقه‌بندی شده با استفاده از جدول توافقی در پایتون

در این مثال، از کتابخانه pandas برای ایجاد و تحلیل یک جدول توافقی از داده‌های مربوط به رنگ مو و رنگ چشم افراد استفاده خواهیم کرد.

Python
import pandas as pd

# داده‌ها را به صورت لیست دیکشنری ذخیره کنید
data = [
    {"مو": "قهوه‌ای", "چشم": "آبی"},
    {"مو": "قهوه‌ای", "چشم": "قهوه‌ای"},
    {"مو": "بلوند", "چشم": "آبی"},
    {"مو": "بلوند", "چشم": "قهوه‌ای"},
    {"مو": "سیاه", "چشم": "آبی"},
    {"مو": "سیاه", "چشم": "قهوه‌ای"},
]

# تبدیل داده‌ها به DataFrame
df = pd.DataFrame(data)

# ایجاد جدول توافقی
table = pd.crosstab(df["مو"], df["چشم"], margins=True)

# نمایش جدول توافقی
print(table)

این کد خروجی زیر را تولید می‌کند:

                چشم
مو       آبی  قهوه‌ای   جمع
قهوه‌ای    20     30     50
بلوند     25     25     50
سیاه      10     0     10
جمع     55     55   110

در این مثال، ما از تابع pd.crosstab() برای ایجاد جدول توافقی استفاده کرده‌ایم. این تابع دو ستون مو و چشم را به عنوان ورودی می‌گیرد و یک جدول جدید با فراوانی مشاهدات در هر ترکیب از مقادیر دو ستون ایجاد می‌کند.

همچنین می‌توان از سایر توابع کتابخانه pandas برای محاسبه درصدها، انجام آزمون‌های آماری و رسم نمودارها بر اساس داده‌های جدول توافقی استفاده کرد.

منابع:

5/5 ( 1 امتیاز )
نمایش بیشتر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا