Matplotlib

فیلتر کردن داده ها در Matplotlib

فیلتر کردن داده ها در Matplotlib

Matplotlib به عنوان کتابخانه ای قدرتمند برای تجسم داده در پایتون، امکاناتی برای فیلتر کردن داده ها قبل از رسم نمودار را برای شما فراهم می کند. این امر به شما کمک می کند تا زیرمجموعه ای از داده ها را که برای تجزیه و تحلیل و رسم نمودار مورد نظر شما relevant هستند، انتخاب کنید.

در این راهنما، به بررسی روش های مختلف فیلتر کردن داده ها در Matplotlib می پردازیم:

۱. انتخاب داده ها بر اساس شرط:

  • استفاده از np.where():
Python
import numpy as np
import matplotlib.pyplot as plt

# داده های مربوط به نام، سن و قد
data = np.array([
    ['Alice', ۳۰, ۱۷۰],
    ['Bob', ۲۵, ۱۸۲],
    ['Charlie', ۲۲, ۱۶۸],
    ['David', ۳۳, ۱۷۵],
    ['Emily', ۲۷, ۱۷۱]
])

# انتخاب داده هایی که سن آنها بیشتر از ۲۵ سال باشد
filtered_data = data[np.where(data[:, ۱] > ۲۵)]

# چاپ داده های فیلتر شده
print(filtered_data)
  • استفاده از np.isin():
Python
import numpy as np
import matplotlib.pyplot as plt

# داده های مربوط به نام، سن و شهر
data = np.array([
    ['Alice', ۳۰, 'Berlin'],
    ['Bob', ۲۵, 'Paris'],
    ['Charlie', ۲۲, 'Berlin'],
    ['David', ۳۳, 'Madrid'],
    ['Emily', ۲۷, 'Berlin']
])

# انتخاب داده هایی که ساکن شهر برلین هستند
filtered_data = data[np.isin(data[:, ۲], ['Berlin'])]

# چاپ داده های فیلتر شده
print(filtered_data)

۲. انتخاب داده ها با استفاده از اسلایس ها:

Python
import numpy as np
import matplotlib.pyplot as plt

# داده های مربوط به دما در طول روز
temperatures = np.array([۲۰, ۲۲, ۲۵, ۲۷, ۲۸, ۲۶, ۲۴, ۲۲, ۲۱])

# انتخاب داده های مربوط به بعد از ظهر (شاخص ۳ به بعد)
afternoon_temperatures = temperatures[۳:]

# رسم نمودار خطی با داده های فیلتر شده
plt.plot(afternoon_temperatures)
plt.xlabel('زمان (ساعت)')
plt.ylabel('دمای هوا (درجه سانتیگراد)')
plt.title("نمودار خطی با داده های مربوط به بعد از ظهر")
plt.show()

۳. فیلتر کردن داده ها بر اساس مقادیر NaN:

Python
import numpy as np
import matplotlib.pyplot as plt

# داده های مربوط به قد و وزن
heights = np.array([۱۷۰, ۱۶۵, np.nan, ۱۷۲, ۱۷۵])
weights = np.array([۶۵, ۷۰, np.nan, ۶۸, ۷۲])

# حذف ردیف هایی که مقادیر NaN دارند
valid_indices = np.where(~np.isnan(heights) & ~np.isnan(weights))[۰]
filtered_heights = heights[valid_indices]
filtered_weights = weights[valid_indices]

# رسم نمودار پراکندگی با داده های فیلتر شده
plt.scatter(filtered_heights, filtered_weights)
plt.xlabel('قد (سانتی متر)')
plt.ylabel('وزن (کیلوگرم)')
plt.title("نمودار پراکندگی با داده های فیلتر شده (بدون NaN)")
plt.show()

۴. فیلتر کردن داده ها با استفاده از کتابخانه های Pandas:

  • اگر از Pandas برای مدیریت داده های خود استفاده می کنید، می توانید از توابع فیلترینگ Pandas مانند DataFrame.query() یا DataFrame.loc[] برای انتخاب زیرمجموعه ای از داده ها بر اساس شرایط مختلف استفاده کنید.

نکات کلیدی:

  • از روش های مناسب برای فیلتر کردن داده ها بر اساس نوع داده ها و نیازهای شما استفاده کنید.
  • قبل از رسم نمودار، داده های خود را به دقت فیلتر کنید تا از دقت و وضوح نمودارهای خود اطمینان حاصل کنید.
۰/۵ ( ۰ امتیاز )
نمایش بیشتر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا