تبدیل انواع داده در Pandas
مقدمه:
در دنیای تجزیه و تحلیل داده، Pandas به عنوان ابزاری قدرتمند و محبوب برای دستکاری و آنالیز مجموعه داده ها شناخته می شود. یکی از وظایف متداول در Pandas، تبدیل انواع داده در ستون های DataFrame برای آماده سازی داده ها برای عملیات یا تجزیه و تحلیل خاص است.
روش های متداول:
روش های متداول:
Pandas طیف وسیعی از ابزارها را برای تبدیل انواع داده به طور موثر ارائه می دهد. در اینجا به برخی از روش های متداول اشاره می کنیم:
- استفاده از astype():
- این روش انعطاف پذیر، به شما امکان می دهد نوع داده یک ستون یا Series را به طور مستقیم به انواع مختلفی مانند
int
,float
,str
,bool
وdatetime
تغییر دهید.
- این روش انعطاف پذیر، به شما امکان می دهد نوع داده یک ستون یا Series را به طور مستقیم به انواع مختلفی مانند
Python
import pandas as pd
# مثال: تبدیل نوع داده "Age" به float
df["Age"] = df["Age"].astype(float)
- استفاده از pd.to_numeric():
- این تابع به طور خاص برای تبدیل رشته ها به مقادیر عددی (
int
یاfloat
) با توجه به فرمت داده ها طراحی شده است.pd.to_numeric
به طور خودکار نوع داده مناسب را بر اساس مقادیر موجود در ستون انتخاب می کند.
- این تابع به طور خاص برای تبدیل رشته ها به مقادیر عددی (
Python
import pandas as pd
# مثال: تبدیل نوع داده "Age" به numeric
df["Age"] = pd.to_numeric(df["Age"])
- استفاده از pd.to_datetime():
- این تابع برای تبدیل رشته ها به مقادیر تاریخ و زمان در Pandas استفاده می شود و از قالب های مختلف تاریخ و زمان پشتیبانی می کند.
Python
import pandas as pd
# مثال: تبدیل نوع داده "Date" به datetime
df["Date"] = pd.to_datetime(df["Date"])
- استفاده از apply():
- این روش به شما امکان می دهد یک تابع را به طور جداگانه برای هر مقدار در یک ستون DataFrame اعمال کنید.
apply()
برای تبدیل انواع داده با منطق پیچیده تر یا توابع سفارشی مفید است.
- این روش به شما امکان می دهد یک تابع را به طور جداگانه برای هر مقدار در یک ستون DataFrame اعمال کنید.
Python
import pandas as pd
# مثال: تبدیل اولین حرف هر نام به حروف بزرگ
def capitalize_first_letter(name):
return name[۰].upper() + name[۱:]
df["Name"] = df["Name"].apply(capitalize_first_letter)
نکات کلیدی:
- هنگام تبدیل انواع داده، مراقب از دست رفتن اطلاعات باشید. به عنوان مثال، تبدیل عدد اعشاری به عدد صحیح، قسمت اعشاری را حذف می کند.
- می توانید از عبارات شرطی مانند
if
وelse
برای تبدیل انواع داده ها به طور مشروط استفاده کنید. - کتابخانه های شخص ثالثی مانند NumPy و category_encoders ابزارهای اضافی برای تبدیل انواع داده و رمزگذاری دسته بندی ها ارائه می دهند.
نتیجه گیری:
با تسلط بر روش های مختلف تبدیل انواع داده در Pandas، می توانید به طور موثر داده های خود را برای تجزیه و تحلیل های دقیق و بصیرت افزا آماده کنید. انتخاب روش مناسب به نوع داده، نیازهای خاص شما و پیچیدگی تبدیل بستگی دارد.