Series: ذخیره دادههای تکبعدی
Series یکی از ساختارهای داده اصلی در Pandas است که برای ذخیرهسازی دادههای تکبعدی (مانند یک لیست یا آرایه) به همراه برچسبهای مربوطه (شاخص) استفاده میشود.
ویژگیهای Series:
- ذخیرهسازی دادهها: Series میتواند انواع مختلفی از دادهها مانند اعداد، رشتهها، تاریخها و مقادیر بولی را ذخیره کند.
- برچسبگذاری: هر عنصر در Series با یک برچسب (شاخص) منحصر به فرد مرتبط است. شاخص میتواند از رشتهها، اعداد یا تاریخها تشکیل شده باشد.
- دسترسی به دادهها: میتوانید به عناصر Series با استفاده از شاخصهای آنها به طور مستقیم یا با استفاده از توابع Pandas دسترسی داشته باشید.
- عملیات: میتوانید عملیات مختلفی مانند مرتبسازی، فیلتر کردن، جمعآوری و تجزیه و تحلیل آماری را بر روی دادههای Series انجام دهید.
ایجاد Series:
- از لیست:
Python
import pandas as pd
data = [۱, ۲, ۳, ۴, ۵]
s = pd.Series(data)
print(s)
- از آرایه NumPy:
Python
import numpy as np
import pandas as pd
data = np.array([۱, ۲, ۳, ۴, ۵])
s = pd.Series(data)
print(s)
- از دیکشنری:
Python
import pandas as pd
data = {"a": ۱, "b": ۲, "c": ۳}
s = pd.Series(data)
print(s)
دسترسی به دادهها:
- با استفاده از شاخص:
Python
print(s[۰]) # دسترسی به اولین عنصر
print(s["a"]) # دسترسی به عنصر با برچسب "a"
- با استفاده از توابع Pandas:
Python
print(s.head()) # نمایش پنج عنصر اول
print(s.tail()) # نمایش پنج عنصر آخر
print(s.describe()) # نمایش آمار توصیفی
عملیات:
- مرتبسازی:
Python
s.sort_values(ascending=False, inplace=True) # مرتبسازی نزولی در محل
print(s)
- فیلتر کردن:
Python
filtered_series = s[s > ۲] # فیلتر کردن عناصر بزرگتر از ۲
print(filtered_series)
- جمعآوری:
Python
total = s.sum()
print(total) # محاسبه مجموع عناصر
- تجزیه و تحلیل آماری:
Python
print(s.mean()) # میانگین
print(s.std()) # انحراف معیار
Series ابزاری قدرتمند برای ذخیرهسازی، دستکاری و تجزیه و تحلیل دادههای تکبعدی در Pandas است. با استفاده از Series، میتوانید به طور کارآمد با دادههای خطی خود کار کنید و بینشهای ارزشمندی از آنها استخراج کنید.