Pandas

تبدیل انواع داده در Pandas

تبدیل انواع داده در Pandas

مقدمه:

در دنیای تجزیه و تحلیل داده، Pandas به عنوان ابزاری قدرتمند و محبوب برای دستکاری و آنالیز مجموعه داده ها شناخته می شود. یکی از وظایف متداول در Pandas، تبدیل انواع داده در ستون های DataFrame برای آماده سازی داده ها برای عملیات یا تجزیه و تحلیل خاص است.

روش های متداول:

Pandas طیف وسیعی از ابزارها را برای تبدیل انواع داده به طور موثر ارائه می دهد. در اینجا به برخی از روش های متداول اشاره می کنیم:

  1. استفاده از astype():

    1. این روش انعطاف پذیر، به شما امکان می دهد نوع داده یک ستون یا Series را به طور مستقیم به انواع مختلفی مانند int, float, str, bool و datetime تغییر دهید.
Python
import pandas as pd

# مثال: تبدیل نوع داده "Age" به float
df["Age"] = df["Age"].astype(float)
  1. استفاده از pd.to_numeric():

    1. این تابع به طور خاص برای تبدیل رشته ها به مقادیر عددی (int یا float) با توجه به فرمت داده ها طراحی شده است. pd.to_numeric به طور خودکار نوع داده مناسب را بر اساس مقادیر موجود در ستون انتخاب می کند.
Python
import pandas as pd

# مثال: تبدیل نوع داده "Age" به numeric
df["Age"] = pd.to_numeric(df["Age"])
  1. استفاده از pd.to_datetime():

    1. این تابع برای تبدیل رشته ها به مقادیر تاریخ و زمان در Pandas استفاده می شود و از قالب های مختلف تاریخ و زمان پشتیبانی می کند.
Python
import pandas as pd

# مثال: تبدیل نوع داده "Date" به datetime
df["Date"] = pd.to_datetime(df["Date"])
  1. استفاده از apply():

    1. این روش به شما امکان می دهد یک تابع را به طور جداگانه برای هر مقدار در یک ستون DataFrame اعمال کنید. apply() برای تبدیل انواع داده با منطق پیچیده تر یا توابع سفارشی مفید است.
Python
import pandas as pd

# مثال: تبدیل اولین حرف هر نام به حروف بزرگ
def capitalize_first_letter(name):
  return name[۰].upper() + name[۱:]

df["Name"] = df["Name"].apply(capitalize_first_letter)

نکات کلیدی:

  • هنگام تبدیل انواع داده، مراقب از دست رفتن اطلاعات باشید. به عنوان مثال، تبدیل عدد اعشاری به عدد صحیح، قسمت اعشاری را حذف می کند.
  • می توانید از عبارات شرطی مانند if و else برای تبدیل انواع داده ها به طور مشروط استفاده کنید.
  • کتابخانه های شخص ثالثی مانند NumPy و category_encoders ابزارهای اضافی برای تبدیل انواع داده و رمزگذاری دسته بندی ها ارائه می دهند.

نتیجه گیری:

با تسلط بر روش های مختلف تبدیل انواع داده در Pandas، می توانید به طور موثر داده های خود را برای تجزیه و تحلیل های دقیق و بصیرت افزا آماده کنید. انتخاب روش مناسب به نوع داده، نیازهای خاص شما و پیچیدگی تبدیل بستگی دارد.

 

۵/۵ ( ۱ امتیاز )
نمایش بیشتر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا