파이썬 데이터 분석: Pandas로 쉽게 배우는 데이터 처리

안녕하세요, mj입니다!

오늘은 파이썬의 Pandas 라이브러리를 이용한 데이터 분석 방법에 대해 알아보겠습니다. Pandas는 데이터 조작 및 분석을 위한 강력한 도구로, 데이터 프레임 형식으로 데이터를 쉽게 다룰 수 있습니다. 이 포스팅에서는 Pandas의 기본적인 사용법과 예제를 통해 데이터 분석의 기초를 배워보겠습니다.

Pandas 소개

Pandas는 Python으로 데이터 분석을 할 때 가장 많이 사용되는 라이브러리 중 하나입니다. 데이터 프레임(DataFrame)이라는 2차원 배열 구조를 사용하여 데이터를 쉽게 다룰 수 있으며, 다양한 데이터 분석 작업을 효율적으로 수행할 수 있습니다.

1. Pandas 설치하기

pip install pandas

2. 기본 사용법

데이터 프레임 생성

먼저, Pandas를 불러오고 간단한 데이터 프레임을 생성해 보겠습니다.

import pandas as pd

data = {
    '이름': ['홍길동', '김철수', '이영희'],
    '나이': [25, 30, 22],
    '도시': ['서울', '부산', '대구']
}
df = pd.DataFrame(data)
print(df)

출력 결과:

    이름  나이   도시
0  홍길동  25   서울
1  김철수  30   부산
2  이영희  22   대구

데이터 요약

데이터 프레임의 기본 통계량을 요약해보겠습니다.

print(df.describe())

출력 결과:

          나이
count  3.000000
mean  25.666667
std