علوم داده

ایجاد Series و DataFrame از ابتدا

ایجاد Series و DataFrame از ابتدا

در Pandas، دو ساختار داده اصلی برای ذخیره و دستکاری داده ها وجود دارد: Series و DataFrame.

ایجاد Series:

  • از لیست:
Python
import pandas as pd

data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)

خروجی:

0    1
1    2
2    3
3    4
4    5
dtype: int64

در این مثال، data یک لیست از اعداد است. pd.Series() این لیست را به یک Series به نام s تبدیل می کند که در آن هر عدد به عنوان یک عنصر و موقعیت آن در لیست به عنوان شاخص آن در نظر گرفته می شود.

  • از آرایه NumPy:
Python
import numpy as np
import pandas as pd

data = np.array([1, 2, 3, 4, 5])
s = pd.Series(data)
print(s)

خروجی:

0    1
1    2
2    3
3    4
4    5
dtype: int64

در این مثال، data یک آرایه NumPy از اعداد است. pd.Series() این آرایه را به یک Series به نام s تبدیل می کند، به روشی مشابه مثال قبل.

  • از دیکشنری:
Python
import pandas as pd

data = {"a": 1, "b": 2, "c": 3}
s = pd.Series(data)
print(s)

خروجی:

a    1
b    2
c    3
dtype: int64

در این مثال، data یک دیکشنری است که کلیدها و مقادیر آن به ترتیب به عنوان شاخص ها و عناصر Series به نام s استفاده می شوند.

ایجاد DataFrame:

  • از لیست های لیست:
Python
import pandas as pd

data = [
    ["Alice", 30, "Female", "USA"],
    ["Bob", 25, "Male", "Canada"],
    ["Charlie", 22, "Male", "USA"],
]

df = pd.DataFrame(data, columns=["Name", "Age", "Gender", "Country"])
print(df)

خروجی:

      Name  Age  Gender     Country
0    Alice   30  Female        USA
1     Bob   25   Male     Canada
2  Charlie   22   Male        USA

در این مثال، data یک لیست از لیست ها است که هر لیست فرعی اطلاعات مربوط به یک سطر در DataFrame را نشان می دهد. pd.DataFrame() این لیست را به یک DataFrame به نام df تبدیل می کند، که در آن هر ستون بر اساس نام ستون های مشخص شده (["Name", "Age", "Gender", "Country"]) و هر سطر بر اساس داده های لیست های فرعی ایجاد می شود.

  • از دیکشنری های دیکشنری:
Python
import pandas as pd

data = {
    "Name": ["Alice", "Bob", "Charlie"],
    "Age": [30, 25, 22],
    "Gender": ["Female", "Male", "Male"],
    "Country": ["USA", "Canada", "USA"],
}

df = pd.DataFrame(data)
print(df)

خروجی:

      Name  Age  Gender     Country
0    Alice   30  Female        USA
1     Bob   25   Male     Canada
2  Charlie   22   Male        USA

مشابه مثال قبل، data یک دیکشنری از دیکشنری ها است که کلیدها و مقادیر آن به ترتیب به عنوان نام ستون ها و داده های هر ستون در DataFrame به نام df استفاده می شوند.

  • از فایل های CSV یا Excel:
Python
import pandas as pd

df = pd.read_csv("data.csv")  # خواندن داده ها از فایل CSV
df = pd.read_excel("data.xlsx")  # خواندن داده ها از فایل Excel

در این مثال، pd.read_csv() و pd.read_excel() به ترتیب برای خواندن داده‌ها از یک فایل CSV و یک فایل Excel به یک DataFrame به نام df استفاده می‌شوند.

نمایش بیشتر

نوشته‌های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا