728x90
반응형
Seaborn이란?
Seaborn은 데이터 시각화 라이브러리로, 파이썬의 matplotlib를 기반으로 더 간단하고 직관적인 방법으로 다양한 통계적 그래프를 생성할 수 있도록 돕는다. 데이터의 분포, 관계, 카테고리 간의 차이를 시각화하는 데 특히 유용하며, 높은 수준의 미적 디자인을 갖춘 차트를 쉽게 만들 수 있다. pandas 데이터프레임과 통합이 잘 되어 있기 때문에 데이터 분석 과정에서 매우 유용하게 쓰인다.
장점
- 간결한 코드: seaborn은 matplotlib에 비해 훨씬 간단한 코드로 복잡한 그래프를 그릴 수 있다.
- 고급 시각화 기능: 히트맵, 페어플롯, 카테고리 플롯과 같은 고급 그래프를 지원한다.
- 미적 디자인: seaborn의 기본 설정은 시각적으로 훨씬 더 깔끔하고 보기 좋다. 특히 데이터 시각화 결과물을 빠르고 쉽게 인상적으로 만들 수 있다.
- 통계적 시각화 지원: 회귀선이나 신뢰구간을 자동으로 추가할 수 있는 기능이 있어 통계 분석을 시각화하는 데 유리하다.
- matplotlib과의 호환성: seaborn은 matplotlib를 기반으로 만들어졌기 때문에, matplotlib의 커스터마이징 기능을 그대로 사용할 수 있다.
사용 예시
import seaborn as sns
import matplotlib.pyplot as plt
# 샘플 데이터 불러오기
tips = sns.load_dataset("tips")
# 요일별로 팁의 비율을 나타내는 바 플롯 그리기
sns.barplot(x="day", y="tip", data=tips)
# 그래프 출력
plt.show()
Wordcloud란?
Wordcloud는 텍스트 데이터를 시각화하는 도구로, 텍스트 내에서 빈도가 높은 단어를 크기가 큰 글씨로, 빈도가 낮은 단어를 작은 글씨로 표현하여 단어의 중요도를 한눈에 파악할 수 있게 해준다. 주로 문서나 댓글, 리뷰 등의 텍스트 데이터를 분석할 때 자주 사용되며, 직관적으로 단어의 빈도를 보여주는 방식으로 유용하다.
장점
- 단순하고 직관적: 텍스트 내에서 가장 중요한 단어들이 무엇인지 한눈에 파악할 수 있다.
- 효율적인 데이터 요약: 방대한 텍스트 데이터에서 중요한 키워드를 추출하여 요약된 정보 제공이 가능하다.
- 시각적 효과: 시각적으로 매우 임팩트 있는 표현 방식을 통해 결과물을 쉽게 공유할 수 있다.
- 커스터마이징 가능: 색상, 모양, 폰트 등을 자유롭게 설정할 수 있어 시각적 요구에 맞게 그래프를 꾸밀 수 있다.
사용 예시
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 텍스트 데이터
text = "Python is amazing. I love working with Python and its libraries like pandas, seaborn, and matplotlib."
# 워드클라우드 생성
wordcloud = WordCloud(width=800, height=400, background_color='white').generate(text)
# 워드클라우드 출력
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
728x90
'Minding's Programming > Knowledge' 카테고리의 다른 글
[POSTMAN] POSTMAN으로 API 호출해보기 (1) | 2024.10.11 |
---|---|
[Python] 딕셔너리 max value에 대한 key 찾기 (0) | 2024.10.08 |
[코딩 테스트/Python] 코딩 테스트에서 자주 사용되는 Python 표준 라이브러리 (1) | 2024.10.01 |
[코딩테스트/Python] 코딩테스트 문제 유형 별 문제 풀이 방법 (1) | 2024.09.30 |
[CS/Python] 자료구조 & 알고리즘 정리 - 큐, 트리, 힙 (0) | 2024.09.27 |