[데이터분석] #5. Matplotlib 아주 살짝 맛보기

728x90
반응형

Matplotlib 아주 살짝 맛보기

이전 포스팅에서는 Pandas를 이용하여 데이터를 불러오고 분석하는 방법을 실습해 보았습니다. 이번에는 Matplotlib을 활용하여 데이터를 시각화하는 방법을 소개하겠습니다. 추후에 Matplotlib은 더 자세히 다룰 예정이니 이번 포스팅에서는 아주 살짝맛 맛보는 정도로 ^^...

 

시각화의 중요성?

데이터 분석에서 그래프를 활용하면 데이터를 보다 직관적으로 이해할 수 있다는 장점이 있습니다.

 


1. Matplotlib 소개 및 설치

Matplotlib은 파이썬에서 가장 널리 사용되는 데이터 시각화 라이브러리 중 하나입니다.

설치 방법:

pip install matplotlib

라이브러리 불러오기:

import matplotlib.pyplot as plt

2. 데이터 불러오기

이전 포스팅에서 사용한 sales_data.csv 파일을 Pandas를 활용하여 불러오겠습니다.

import pandas as pd

# CSV 파일 불러오기
df = pd.read_csv("sales_data.csv", encoding="utf-8-sig")

# 데이터 확인
print(df.head())

3. 기본적인 그래프 그리기

3.1 카테고리별 총매출 막대 그래프

category_sales = df.groupby("카테고리")["총매출"].sum()

# 막대 그래프 생성
plt.figure(figsize=(8, 5))
category_sales.plot(kind="bar", color="skyblue")
plt.title("카테고리별 총매출")
plt.xlabel("카테고리")
plt.ylabel("총매출")
plt.xticks(rotation=45)
plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.show()

3.2 일별 총매출 추세 (선 그래프)

# 날짜 데이터를 datetime 형식으로 변환
df["날짜"] = pd.to_datetime(df["날짜"])

# 일별 총매출 계산
daily_sales = df.groupby("날짜")["총매출"].sum()

# 선 그래프 생성
plt.figure(figsize=(10, 5))
daily_sales.plot(kind="line", marker="o", linestyle="-", color="red")
plt.title("일별 총매출 추세")
plt.xlabel("날짜")
plt.ylabel("총매출")
plt.grid(True)
plt.show()

3.3 상품별 매출 비율 (파이 차트)

# 상품별 총매출 계산
product_sales = df.groupby("상품명")["총매출"].sum()

# 파이 차트 생성
plt.figure(figsize=(7, 7))
product_sales.plot(kind="pie", autopct="%1.1f%%", startangle=90, colors=["lightcoral", "lightskyblue", "lightgreen", "gold", "violet"])
plt.title("상품별 매출 비율")
plt.ylabel("")  # 불필요한 y축 라벨 제거
plt.show()

4. 결론

이번 포스팅에서는 Matplotlib을 활용하여 Pandas 데이터프레임을 기반으로 다양한 그래프를 그리는 방법을 실습해 보았습니다.

  • 막대 그래프: 카테고리별 총매출 비교
  • 선 그래프: 일별 매출 변화 추세 확인
  • 파이 차트: 상품별 매출 비율 분석

다음 포스팅에서는 Numpy 맛보기 라는 주제  다뤄보겠습니다! 😊

728x90
반응형