수비니움의 튜토리얼
Beginner Ver.
kaggle을 시작하는 초보자를 위한 Kernel 입니다.
본 커널은 A Journey through Titanic을 바탕으로 재구성한 커널이며, 다른 커널에 비해 매우 간단한 구조를 가집니다.
사실 대부분의 과정을 생략했기에, 가벼운 가이드라인을 원하시는 분들에게 적합합니다.
- [Subinium Tutorial] Titanic (Beginner) 에서 확인하실 수 있습니다.
Intermediate Ver.
좀 더 체계적으로 개념을 잡기 위한 Kernel 입니다. 본 커널은 Titanic Data Science Solutions을 바탕으로 재구성한 커널입니다.
본 자료는 구성 자체가 초보자를 위한 커널이기에 내용이 필요 이상으로 자세하고, 다양한 데이터 분석 기초 연습에 적합한 커널이라고 생각합니다.
부족한 번역이지만, 좋은 자료라고 생각하고 번역했습니다. 영어를 잘하시는 분은 원본을 보는 것도 추천합니다.
Advanced Ver.
고급 테크닉을 배우고, 상위권을 노리기 위한 Kernel 입니다.
커널 추천
kaggle에서 추천하는 Tutorial 입니다.
Python Tutorials
Beginner Tutorial
- Titanic Data Science Solutions Python Notebook
- pandas를 이용한 데이터 다루기
- matplotlib과 seaborn을 통한 visualization
- scikit-learn 사용
Advanced Tutorial
- An Interactive Data Science Tutorial
- Jupyter Notebook 연습
- 머신러닝에서 특성 선택의 중요성
- Machine Learning from Start to Finish with Scikit-Learn
- cross-validation(교차 검증)을 통해 모델 일반화 확인 : 과적합 막기
- 매개변수 튜닝과 그리드 서치를 통해 여러 분류 알고리즘 중 가장 좋은 알고리즘 선택
- XGBoost Example
- 가장 인기있는 알고리즘 XGBoost 알고리즘
- An Introduction to Ensembling/Stacking in Python
- 여러 모델의 예측 결과를 합치는
앙상블
기법의 기초
- 여러 모델의 예측 결과를 합치는
R Tutorials
그 외
이 모든 것을 잘 정리한 kaggle-kr의 @이유한 님의 커널이 있습니다.
- 타이타닉 튜토리얼
- 이유한님의 강의
ETC.
- 2019 1st ML Month with KaKR의 주제입니다.
Leave a Comment