본문 바로가기

Minding's Programming/Knowledge

[Seaborn/WordCloud] Seaborn과 Wordcloud를 활용한 시각화

728x90
반응형

Seaborn이란?

Seaborn은 데이터 시각화 라이브러리로, 파이썬의 matplotlib를 기반으로 더 간단하고 직관적인 방법으로 다양한 통계적 그래프를 생성할 수 있도록 돕는다. 데이터의 분포, 관계, 카테고리 간의 차이를 시각화하는 데 특히 유용하며, 높은 수준의 미적 디자인을 갖춘 차트를 쉽게 만들 수 있다. pandas 데이터프레임과 통합이 잘 되어 있기 때문에 데이터 분석 과정에서 매우 유용하게 쓰인다.

장점

  1. 간결한 코드: seaborn은 matplotlib에 비해 훨씬 간단한 코드로 복잡한 그래프를 그릴 수 있다.
  2. 고급 시각화 기능: 히트맵, 페어플롯, 카테고리 플롯과 같은 고급 그래프를 지원한다.
  3. 미적 디자인: seaborn의 기본 설정은 시각적으로 훨씬 더 깔끔하고 보기 좋다. 특히 데이터 시각화 결과물을 빠르고 쉽게 인상적으로 만들 수 있다.
  4. 통계적 시각화 지원: 회귀선이나 신뢰구간을 자동으로 추가할 수 있는 기능이 있어 통계 분석을 시각화하는 데 유리하다.
  5. matplotlib과의 호환성: seaborn은 matplotlib를 기반으로 만들어졌기 때문에, matplotlib의 커스터마이징 기능을 그대로 사용할 수 있다.

사용 예시

import seaborn as sns
import matplotlib.pyplot as plt
# 샘플 데이터 불러오기
tips = sns.load_dataset("tips")

# 요일별로 팁의 비율을 나타내는 바 플롯 그리기
sns.barplot(x="day", y="tip", data=tips)

# 그래프 출력
plt.show()

 

Wordcloud란?

Wordcloud는 텍스트 데이터를 시각화하는 도구로, 텍스트 내에서 빈도가 높은 단어를 크기가 큰 글씨로, 빈도가 낮은 단어를 작은 글씨로 표현하여 단어의 중요도를 한눈에 파악할 수 있게 해준다. 주로 문서나 댓글, 리뷰 등의 텍스트 데이터를 분석할 때 자주 사용되며, 직관적으로 단어의 빈도를 보여주는 방식으로 유용하다.

장점

  1. 단순하고 직관적: 텍스트 내에서 가장 중요한 단어들이 무엇인지 한눈에 파악할 수 있다.
  2. 효율적인 데이터 요약: 방대한 텍스트 데이터에서 중요한 키워드를 추출하여 요약된 정보 제공이 가능하다.
  3. 시각적 효과: 시각적으로 매우 임팩트 있는 표현 방식을 통해 결과물을 쉽게 공유할 수 있다.
  4. 커스터마이징 가능: 색상, 모양, 폰트 등을 자유롭게 설정할 수 있어 시각적 요구에 맞게 그래프를 꾸밀 수 있다.

사용 예시

from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 텍스트 데이터
text = "Python is amazing. I love working with Python and its libraries like pandas, seaborn, and matplotlib."

# 워드클라우드 생성
wordcloud = WordCloud(width=800, height=400, background_color='white').generate(text)

# 워드클라우드 출력
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
728x90