بارگیری داده ها از فایل های CSV، JSON، Excel و پایگاه های داده
Pandas به شما امکان می دهد داده ها را از منابع مختلف مانند فایل های CSV، JSON، Excel و پایگاه های داده به طور کارآمد بارگیری کنید.
بارگیری از فایل CSV:
Python
import pandas as pd
# بارگیری داده ها از فایل CSV به DataFrame
df = pd.read_csv("data.csv")
# مشخص کردن پارامترهای اختیاری (مانند جداکننده، رمزگذاری، رد کردن سطرهای خالی)
df = pd.read_csv("data.csv", delimiter=",", encoding="ISO-8859-1", skiprows=۱)
بارگیری از فایل JSON:
Python
import pandas as pd
# بارگیری داده ها از فایل JSON به DataFrame
df = pd.read_json("data.json")
# مشخص کردن پارامترهای اختیاری (مانند نوع داده، مسیر کلیدها)
df = pd.read_json("data.json", orient="records")
بارگیری از فایل Excel:
Python
import pandas as pd
# بارگیری داده ها از فایل Excel به DataFrame
df = pd.read_excel("data.xlsx")
# مشخص کردن پارامترهای اختیاری (مانند نام برگه، شاخص ها)
df = pd.read_excel("data.xlsx", sheet_name="Sheet1", index_col=۰)
بارگیری از پایگاه داده:
Python
import pandas as pd
# اتصال به پایگاه داده MySQL و بارگیری داده ها به DataFrame
from sqlalchemy import create_engine
engine = create_engine("mysql://user:password@host:port/database")
df = pd.read_sql("SELECT * FROM table_name", engine)
# اتصال به پایگاه داده PostgreSQL و بارگیری داده ها به DataFrame
import psycopg2
connection = psycopg2.connect(dbname="database", user="user", password="password", host="host", port="port")
df = pd.read_sql("SELECT * FROM table_name", connection)
نکات:
- برای بارگیری داده ها از پایگاه های داده، به کتابخانه های پایگاه داده اضافی مانند
sqlalchemy
یاpsycopg2
نیاز دارید. - می توانید با استفاده از توابع Pandas مانند
head()
،tail()
وinfo()
برای بررسی اجمالی داده های بارگیری شده استفاده کنید. - می توانید با استفاده از توابع Pandas مانند
describe()
,dropna()
,fillna()
وreplace()
داده های بارگیری شده را قبل از تجزیه و تحلیل، تمیز و آماده کنید.
منابع:
- مستندات Pandas IO: https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html
- مستندات Pandas JSON: https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_json.html
- مستندات Pandas Excel: https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html
- مستندات SQLAlchemy: https://docs.sqlalchemy.org/
- مستندات Psycopg2: https://www.psycopg.org/docs/
با استفاده از Pandas و کتابخانه های پایگاه داده مرتبط، می توانید به طور کارآمد داده ها را از منابع مختلف بارگیری و برای تجزیه و تحلیل و مدل سازی آماده کنید.