패스트캠퍼스

[패스트캠퍼스] 데이터 분석 부트캠프 17기 - 5주차 (5) 타이타닉 분석

geraedo 2025. 1. 14. 17:45

주요 학습 내용 요약

 

titanic 데이터 살펴보기

 

1. 각 컬럼별 생존율 구하는 함수 만들기

 

2. 요금을 많이 낸 사람의 생존 확률

 

3. 이름이 생존확률에 영향을 줬을까 ?

4. 나이는 어떨까 ?

- 나이 nan값 먼저 처리하기

   : (1) 나이 전체 평균을 빈 값에 채워 넣기

   : (2) Name_Tile의 평균을 빈 값에 채워 넣기

 

5. 범주형 데이터들을 카테고리화 하기

(1) Age 카테고리

(2) Fare 카테고리