SciPy

محاسبات آماری توصیفی با SciPy

محاسبات آماری توصیفی با SciPy

SciPy مجموعه ای از ابزارهای قدرتمند برای انجام محاسبات آماری بر روی داده های شما ارائه می دهد. این کتابخانه طیف گسترده ای از توابع را برای محاسبه معیارهای آماری توصیفی رایج مانند میانگین، میانه، انحراف معیار، واریانس، چولگی و کشیدگی فراهم می کند.

در این بخش، به بررسی نحوه استفاده از SciPy برای انجام محاسبات آماری توصیفی بر روی داده های آرایه ها و ماتریس های خود می پردازیم.

۱. محاسبه معیارهای آماری اساسی

  • میانگین:

Python
import numpy as np

# محاسبه میانگین آرایه تک بعدی
array_1d = np.array([۱۰, ۲۰, ۳۰, ۴۰, ۵۰])
mean_1d = np.mean(array_1d)

# محاسبه میانگین هر ستون در ماتریس
array_2d = np.array([[۱, ۲, ۳],
                      [۴, ۵, ۶],
                      [۷, ۸, ۹]])
mean_column_wise = np.mean(array_2d, axis=۰)
  • میانه:

Python
# محاسبه میانه آرایه تک بعدی
array_1d = np.array([۱۰, ۲۰, ۳۰, ۴۰, ۵۰])
median_1d = np.median(array_1d)

# محاسبه میانه هر ردیف در ماتریس
array_2d = np.array([[۱, ۲, ۳],
                      [۴, ۵, ۶],
                      [۷, ۸, ۹]])
median_row_wise = np.median(array_2d, axis=۱)
  • انحراف معیار:

Python
# محاسبه انحراف معیار آرایه تک بعدی
array_1d = np.array([۱۰, ۲۰, ۳۰, ۴۰, ۵۰])
std_dev_1d = np.std(array_1d)

# محاسبه انحراف معیار هر ستون در ماتریس
array_2d = np.array([[۱, ۲, ۳],
                      [۴, ۵, ۶],
                      [۷, ۸, ۹]])
std_dev_column_wise = np.std(array_2d, axis=۰)
  • واریانس:

Python
# محاسبه واریانس آرایه تک بعدی
array_1d = np.array([۱۰, ۲۰, ۳۰, ۴۰, ۵۰])
variance_1d = np.var(array_1d)

# محاسبه واریانس هر ردیف در ماتریس
array_2d = np.array([[۱, ۲, ۳],
                      [۴, ۵, ۶],
                      [۷, ۸, ۹]])
variance_row_wise = np.var(array_2d, axis=۱)

۲. محاسبه معیارهای شکل توزیع

  • چولگی:

Python
# محاسبه چولگی آرایه تک بعدی
array_1d = np.array([۱۰, ۲۰, ۳۰, ۴۰, ۵۰])
skew_1d = np.skew(array_1d)

# محاسبه چولگی هر ستون در ماتریس
array_2d = np.array([[۱, ۲, ۳],
                      [۴, ۵, ۶],
                      [۷, ۸, ۹]])
skew_column_wise = np.skew(array_2d, axis=۰)
  • کشیدگی:

Python
# محاسبه کشیدگی آرایه تک بعدی
array_1d = np.array([۱۰, ۲۰, ۳۰, ۴۰, ۵۰])
kurtosis_1d = np.kurtosis(array_1d)

# محاسبه کشیدگی هر ستون در ماتریس
array_2d = np.array([[۱, ۲, ۳],
                      [۴, ۵, ۶],
                      [۷, ۸, ۹]])
kurtosis_column_wise = np.kurtosis(array_2d)

توزیع فراوانی:

  • محاسبه مقادیر و فرکانس های منحصر به فرد:
Python
import numpy as np

# محاسبه مقادیر و فرکانس های منحصر به فرد در آرایه تک بعدی
array_1d = np.array([۱۰, ۲۰, ۲۰, ۳۰, ۴۰, ۵۰])
unique_values, unique_counts = np.unique(array_1d, return_counts=True)

# نمایش مقادیر و فرکانس های منحصر به فرد
print("مقادیر منحصر به فرد:", unique_values)
print("فرکانس ها:", unique_counts)
  • محاسبه هیستوگرام:

Python
# محاسبه هیستوگرام آرایه تک بعدی
array_1d = np.array([۱۰, ۲۰, ۳۰, ۴۰, ۵۰])
hist, bins = np.histogram(array_1d)

# نمایش مقادیر هیستوگرام و لبه های سطل
print("مقادیر هیستوگرام:", hist)
print("لبه های سطل:", bins)

نکات مهم:

  • SciPy توابع مختلف دیگری را برای محاسبات آماری تخصصی تر مانند آزمون های فرضیه، رگرسیون و تجزیه و تحلیل واریانس ارائه می دهد.
  • برای اطلاعات بیشتر در مورد توابع آماری SciPy، می توانید به مستندات SciPy مراجعه کنید: https://docs.scipy.org/

در این بخش، به بررسی نحوه استفاده از SciPy برای انجام طیف گسترده ای از محاسبات آماری توصیفی بر روی داده های آرایه ها و ماتریس های شما پرداختیم. با استفاده از این ابزارها، می توانید به طور خلاصه ویژگی های توزیع داده های خود را درک کرده و الگوهای جالبی را کشف کنید.

۵/۵ ( ۱ امتیاز )
نمایش بیشتر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا