728x90
반응형
Matplotlib 아주 살짝 맛보기
이전 포스팅에서는 Pandas를 이용하여 데이터를 불러오고 분석하는 방법을 실습해 보았습니다. 이번에는 Matplotlib을 활용하여 데이터를 시각화하는 방법을 소개하겠습니다. 추후에 Matplotlib은 더 자세히 다룰 예정이니 이번 포스팅에서는 아주 살짝맛 맛보는 정도로 ^^...
시각화의 중요성?
데이터 분석에서 그래프를 활용하면 데이터를 보다 직관적으로 이해할 수 있다는 장점이 있습니다.
1. Matplotlib 소개 및 설치
Matplotlib은 파이썬에서 가장 널리 사용되는 데이터 시각화 라이브러리 중 하나입니다.
설치 방법:
pip install matplotlib
라이브러리 불러오기:
import matplotlib.pyplot as plt
2. 데이터 불러오기
이전 포스팅에서 사용한 sales_data.csv 파일을 Pandas를 활용하여 불러오겠습니다.
import pandas as pd
# CSV 파일 불러오기
df = pd.read_csv("sales_data.csv", encoding="utf-8-sig")
# 데이터 확인
print(df.head())
3. 기본적인 그래프 그리기
3.1 카테고리별 총매출 막대 그래프
category_sales = df.groupby("카테고리")["총매출"].sum()
# 막대 그래프 생성
plt.figure(figsize=(8, 5))
category_sales.plot(kind="bar", color="skyblue")
plt.title("카테고리별 총매출")
plt.xlabel("카테고리")
plt.ylabel("총매출")
plt.xticks(rotation=45)
plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.show()
3.2 일별 총매출 추세 (선 그래프)
# 날짜 데이터를 datetime 형식으로 변환
df["날짜"] = pd.to_datetime(df["날짜"])
# 일별 총매출 계산
daily_sales = df.groupby("날짜")["총매출"].sum()
# 선 그래프 생성
plt.figure(figsize=(10, 5))
daily_sales.plot(kind="line", marker="o", linestyle="-", color="red")
plt.title("일별 총매출 추세")
plt.xlabel("날짜")
plt.ylabel("총매출")
plt.grid(True)
plt.show()
3.3 상품별 매출 비율 (파이 차트)
# 상품별 총매출 계산
product_sales = df.groupby("상품명")["총매출"].sum()
# 파이 차트 생성
plt.figure(figsize=(7, 7))
product_sales.plot(kind="pie", autopct="%1.1f%%", startangle=90, colors=["lightcoral", "lightskyblue", "lightgreen", "gold", "violet"])
plt.title("상품별 매출 비율")
plt.ylabel("") # 불필요한 y축 라벨 제거
plt.show()
4. 결론
이번 포스팅에서는 Matplotlib을 활용하여 Pandas 데이터프레임을 기반으로 다양한 그래프를 그리는 방법을 실습해 보았습니다.
- 막대 그래프: 카테고리별 총매출 비교
- 선 그래프: 일별 매출 변화 추세 확인
- 파이 차트: 상품별 매출 비율 분석
다음 포스팅에서는 Numpy 맛보기 라는 주제 다뤄보겠습니다! 😊
728x90
반응형
'AI > 데이터분석' 카테고리의 다른 글
[데이터분석] #7. Numpy실습: 배열과 연산 다뤄보기 (0) | 2025.02.15 |
---|---|
[데이터분석] #6. Numpy 아주 살짝 맛보기 (0) | 2025.02.15 |
[데이터분석] #4. Pandas 맛보기2: CSV파일을 이용한 실습 (0) | 2025.01.31 |
[데이터분석] #3. Pandas 맛보기 (1) | 2025.01.31 |
[데이터분석] #2. 데이터 처리를 위한 필수 라이브러리 소개 (0) | 2025.01.31 |