شاخص: برچسبگذاری دادهها برای دسترسی آسان
شاخص در Pandas یک عنصر کلیدی برای ساختارهای داده Series و DataFrame است که به شما امکان میدهد به طور کارآمد به دادههای خود دسترسی داشته باشید و آنها را دستکاری کنید.
ویژگیهای شاخص:
- منحصر به فرد بودن: هر عنصر در Series یا هر سطر در DataFrame باید یک برچسب شاخص منحصر به فرد داشته باشد.
- انواع مختلف: شاخصها میتوانند از رشتهها، اعداد یا تاریخها تشکیل شده باشند.
- قابلیت تغییر: میتوانید شاخصها را به طور دلخواه تغییر دهید یا مرتبسازی کنید.
- دسترسی آسان: میتوانید با استفاده از شاخصها به طور مستقیم به عناصر Series یا سطرهای DataFrame دسترسی داشته باشید.
مزایای استفاده از شاخص:
- دسترسی سریع: شاخصها به شما امکان میدهند به طور مستقیم به عناصر Series یا سطرهای DataFrame بدون نیاز به پیمایش در کل ساختار داده دسترسی داشته باشید.
- انعطافپذیری: میتوانید از انواع مختلف شاخصها برای برچسبگذاری دادههای خود استفاده کنید و آنها را به دلخواه مرتبسازی کنید.
- قابلیت جستجو: میتوانید با استفاده از شاخصها به دنبال عناصر یا سطرهای خاص در Series یا DataFrame خود باشید.
- تجزیه و تحلیل آسان: شاخصها به شما امکان میدهند دادههای خود را به طور کارآمد تجزیه و تحلیل و دستکاری کنید.
انواع شاخص:
- شاخص عددی: از اعداد برای برچسبگذاری عناصر یا سطرها استفاده میکند.
- شاخص رشتهای: از رشتهها برای برچسبگذاری عناصر یا سطرها استفاده میکند.
- شاخص تاریخ: از تاریخها و timestamps برای برچسبگذاری عناصر یا سطرها استفاده میکند.
- شاخص چند سطحی: از سلسله مراتبی از برچسبها برای برچسبگذاری سطرها در DataFrameهای چندبعدی استفاده میکند.
ایجاد شاخص:
- به طور پیش فرض: Pandas به طور خودکار یک شاخص عددی را برای Series و DataFrameهای جدید ایجاد میکند.
- از لیست: میتوانید با استفاده از یک لیست از اعداد، رشتهها یا تاریخها، شاخص سفارشی ایجاد کنید.
- از آرایه NumPy: میتوانید با استفاده از یک آرایه NumPy از اعداد، رشتهها یا تاریخها، شاخص سفارشی ایجاد کنید.
دسترسی به دادهها با استفاده از شاخص:
- با استفاده از اسلایسها: میتوانید با استفاده از اسلایسها، زیرمجموعهای از عناصر یا سطرها را با توجه به شاخصهای آنها انتخاب کنید.
- با استفاده از مقادیر شاخص: میتوانید با استفاده از مقادیر شاخص خاص، به عناصر یا سطرهای خاص دسترسی داشته باشید.
- با استفاده از توابع Pandas: میتوانید از توابع Pandas مانند
loc
وiloc
برای دسترسی به عناصر یا سطرها با توجه به شاخصهای آنها استفاده کنید.
تغییر شاخص:
- با استفاده از توابع Pandas: میتوانید از توابع Pandas مانند
set_index()
وreset_index()
برای تغییر شاخص Series یا DataFrame خود استفاده کنید.
مثال:
Python
import pandas as pd
data = [
["Alice", ۳۰, "Female", "USA"],
["Bob", ۲۵, "Male", "Canada"],
["Charlie", ۲۲, "Male", "USA"],
]
df = pd.DataFrame(data, columns=["Name", "Age", "Gender", "Country"])
# دسترسی به عنصر با استفاده از شاخص
print(df["Name"][۰]) # دسترسی به اولین عنصر در ستون "Name"
# انتخاب زیرمجموعهای از سطرها با استفاده از شاخص
filtered_df = df[df["Age"] > ۲۵] # فیلتر کردن سطرهایی که سن آنها بیشتر از ۲۵ است
print(filtered_df)
شاخص ابزاری قدرتمند در Pandas است که به شما امکان میدهد به طور کارآمد به دادههای خود دسترسی داشته باشید، آنها را دستکاری کنید و تجزیه و تحلیل کنید. با استفاده از شاخصها، میتوانید به سرعت و به راحتی اطلاعات مورد نیاز خود را از مجموعه دادههای خود پیدا کنید.