패스트캠퍼스

[패스트캠퍼스] 데이터 분석 부트캠프 17기 - 5주차 (3) seaborn

geraedo 2025. 1. 14. 13:05

주요 학습 내용 요약

 

데이터 시각화 - Seaborn

 

1. seaborn 설치

 

2. 사용해보기

    (1) 언제 일을 해야 가장 많은 팁을 받을 수 있나요?

     (2) 누구에게 서빙해야 가장 많은 팁을 받나요?

 

(3) sns.lmplot

: 컬럼들간의 선형관계를 파악할 수 있는 그래프

: 회귀분석(Regression Analysis) -> y = ax + b
   - 독립변인이 종속변인에 미치는 영향을 알아보고자 할 때 사용

: 상관관계
   - -1~1의 사이의 값을 가짐. 절댓값이 클수록 더 높은 상관관계를 가짐.
   - 1에 가까울수록 양의 상관관계, -1에 가까울수록 음의 상관관계

 

 

-  np.polyfit 으로 회귀분석 기울기와 y절편을 구할 수 있다. 

 

 

(4) sns.heatmap

cmap = 'Blues'

(5) sns.pivot

cmap = 'color_r' 언더바r을 넣으면 색깔이 변환되어 나온다

 

(6) sns.pairplot

: lmplot의 업그레이드 버전, 여러 변수 간의 산점도 그래프

: 각 컬럼별 모든 상관관계를 시각화

: hue에 membership을 넣어 이커머스 데이터를 보기에도 좋음

 

 

3. 더 많은 데이터를 사용하고 싶으면