안녕하세요, mj입니다!
오늘은 파이썬의 Pandas 라이브러리를 이용한 데이터 분석 방법에 대해 알아보겠습니다. Pandas는 데이터 조작 및 분석을 위한 강력한 도구로, 데이터 프레임 형식으로 데이터를 쉽게 다룰 수 있습니다. 이 포스팅에서는 Pandas의 기본적인 사용법과 예제를 통해 데이터 분석의 기초를 배워보겠습니다.
Pandas 소개
Pandas는 Python으로 데이터 분석을 할 때 가장 많이 사용되는 라이브러리 중 하나입니다. 데이터 프레임(DataFrame)이라는 2차원 배열 구조를 사용하여 데이터를 쉽게 다룰 수 있으며, 다양한 데이터 분석 작업을 효율적으로 수행할 수 있습니다.
1. Pandas 설치하기
pip install pandas
2. 기본 사용법
데이터 프레임 생성
먼저, Pandas를 불러오고 간단한 데이터 프레임을 생성해 보겠습니다.
import pandas as pd
data = {
'이름': ['홍길동', '김철수', '이영희'],
'나이': [25, 30, 22],
'도시': ['서울', '부산', '대구']
}
df = pd.DataFrame(data)
print(df)
출력 결과:
이름 나이 도시
0 홍길동 25 서울
1 김철수 30 부산
2 이영희 22 대구
데이터 요약
데이터 프레임의 기본 통계량을 요약해보겠습니다.
print(df.describe())
출력 결과:
나이
count 3.000000
mean 25.666667
std