مفهوم کشیدگی در آمار
در حوزه علم آمار، کشیدگی (Kurtosis) مقیاسی برای سنجش تیزی قله و فراوانی دمهای توزیع دادهها به شمار میآید. به عبارت دیگر، کشیدگی بیانگر آن است که چه میزان از دادهها در مرکز توزیع متمرکز شدهاند و چه مقدار در دو انتهای (دمهای) آن پراکنده شدهاند.
توزیعهای نرمال که نمودار آنها به شکل زنگوله است، دارای کشیدگی ۳ هستند. این بدین معناست که قله نمودار حول میانگین متقارن بوده و دمهای آن نه خیلی کوتاه و نه خیلی بلند هستند.
انواع کشیدگی:
- کشیدگی مثبت (Leptokurtic):این نوع توزیع دارای قلهای تیزتر و دمهایی سنگینتر (тяжелее) نسبت به توزیع نرمال است. در این حالت، مقادیر دادهای که از میانگین دورتر هستند، بیشتر از توزیع نرمال رواج دارند.
- کشیدگی منفی (Platykurtic):این نوع توزیع دارای قلهای پهنتر و دمهایی کوتاهتر نسبت به توزیع نرمال است. در این حالت، مقادیر دادهای که از میانگین دورتر هستند، کمتر از توزیع نرمال رواج دارند.
مثالهای کاربردی:
- امتحانات نهایی: فرض کنید نمرات دانشآموزان در یک امتحان نهایی را بررسی میکنیم.
- توزیع نرمال: اگر نمرات به طور متقارن حول نمره متوسط توزیع شده باشند و تعداد کمی از نمرات خیلی پایین یا خیلی بالا باشند، میتوان گفت توزیع نمرات نرمال است و کشیدگی آن ۳ است.
- کشیدگی مثبت: اگر تعداد قابل توجهی از نمرات خیلی بالا باشند، نشاندهنده این است که امتحان آسان بوده و بسیاری از دانشآموزان نمرههای عالی کسب کردهاند. در این حالت، توزیع نمرات کشیدگی مثبت خواهد داشت.
- کشیدگی منفی: اگر تعداد قابل توجهی از نمرات خیلی پایین باشند، نشاندهنده این است که امتحان دشوار بوده و بسیاری از دانشآموزان نمرههای پایینی کسب کردهاند. در این حالت، توزیع نمرات کشیدگی منفی خواهد داشت.
- بازده سهام: در بازار مالی، توزیع بازده سهام یک شرکت ممکن است کشیدگی بالایی داشته باشد، به این معنی که احتمال وقوع نوسانات قیمتی شدید (هم مثبت و هم منفی) در مقایسه با توزیع نرمال بیشتر است. این موضوع برای سرمایهگذاران حائز اهمیت است، زیرا نشاندهنده ریسک بالاتر سرمایهگذاری در آن سهم است.
کاربردهای کشیدگی:
- آزمون نرمال بودن توزیع: از کشیدگی برای بررسی اینکه آیا توزیع دادهها نرمال است یا خیر استفاده میشود. توزیعهای نرمال دارای کشیدگی ۳ هستند.
- سنجش ریسک: در امور مالی، از کشیدگی برای سنجش ریسک سرمایهگذاریها استفاده میشود. توزیعهایی با کشیدگی بالا، نشاندهنده ریسک بالاتر نوسانات قیمتی هستند.
- تشخیص ناهنجاری: مقادیر دادهای که به طور قابل توجهی از بقیه دادهها دور هستند (outliers) میتوانند بر محاسبه کشیدگی تاثیر بگذارند. بررسی کشیدگی میتواند به شناسایی این ناهنجاریها کمک کند.
نکات:
- در هنگام تفسیر نتایج کشیدگی، باید به تعداد دادهها نیز توجه کرد. با افزایش تعداد دادهها، دقت محاسبه کشیدگی نیز افزایش مییابد.
- کشیدگی در کنار سایر معیارهای آماری مانند میانگین، واریانس و انحراف معیار، اطلاعات مفیدی را در مورد توزیع دادهها ارائه میدهد.
منابع: