Machine Learning for Everyone
Kaggle에서 Getting Started 의 대표 5개의 주제로 영상 강의와 튜토리얼 자료 제작을 계획하고 있습니다. 구체적인 내용은 sidebar 또는 toggle menu 또는 메뉴 아래 링크를 통해 각 카테고리로 들어오시면 됩니다.
Kaggle을 공부하는 방법은 여러가지가 있지만, 그 중에서도 시작하기 좋은 방법은 다른 실력자분들의 커널을 필사하며 공부하는 방법입니다. 필사에 좋은 커널을 추천하고, 커널을 만들며, 그를 통해 강의까지 제작하기 위한 페이지입니다.
업데이트될 때마다 페이스북 페이지에 업로드 예정입니다.
- 타이타닉 Beginner Ver.
- 각 Competition에 Kaggle 추천 튜토리얼 링크 추가
1. 타이타닉 생존자 예측
- title : Titanic: Machine Learning from Disaster
- category : Classification Problem
- link
타이타닉호 침몰 사고는 1912년 4월 15일에 발생한 해상 사고로, 역사 상 가장 유명한 침몰 사고 중 하나입니다. 이 사고는 2224명의 승객과 승무원 중 1502명이나 사망한 안타까운 사고입니다. 실제 사고의 데이터를 가지고, 사람들의 생존 여부를 예측해봅시다.
머신러닝을 시작하는 분들이 가장 처음 배운다는 이진 분류(binary classification) 문제로 처음 시작하는 분들에게 적합합니다.
2. 주택 가격 예측
- title : House Prices: Advanced Regression Techniques
- category : Regression Problem
- link
머신러닝 책만 보면 나오는 회귀 예제 중 하나는 보스턴 주택 가격 예측 문제 입니다. 책의 예제를 다시 해볼 수 있는 competition도 있지만, 이제 새로운 회귀문제를 구하는 분들에게 적합합니다.
더 많아진 특성과 확장된 데이터는 특성공학과 고급 회귀 테크닉(랜덤 포레스트, 그래디언트 부스팅)을 연습할 기회가 될 것입니다.
3. 숫자 인식
- title : Digit Recognizer
- category : Computer Vision
- link
C언어를 시작할 때, "hello world!"
가 있다면, Computer Vision에서는 MNIST 가 있습니다.
1999년도에 만들어진 이 데이터는 숫자 손 글씨를 분류하는 분류하는 문제입니다.
CS231n 등 딥러닝 강의를 들으신 분이라면, 여기서 신경망을 시험해보는 것을 추천합니다. 21세기 머신러닝의 핵심 중 하나인 Computer Vision을 시작해봅시다.
4. 얼굴 키포인트
- title : Facial Keypoints Detection
- category : Image Processing
- link
대부분의 사람은 얼굴이 다르게 생겼습니다. 이런 얼굴에서 포인트를 찾는 것은 매우 많은 영역에서 필요한 기술입니다. 얼굴 추적, 표정 분석, 얼굴 인식 등 다양한 분야가 있습니다.
하지만 이 문제는 매우 어려운 문제로 알려져있습니다. 위의 Computer Vision을 좀 더 시도해봅시다. 기초는 아닌 것 같지만, 매우 필요한 분야이니까요?
5. 영화리뷰 분석하기
- title : Bag of Words Meets Bags of Popcorn
- category : Natural Language Processing
- link
인공지능의 목표 중 하나인 자연어 처리입니다. 우리가 실생활에 쓰는 언어를 처리하는 분야입니다. 국내에도 다양한 NLP 스터디가 존재하고, 많은 프로젝트들이 진행되고 있습니다.
자연어 처리에 사용되는 word2vec에 대한 기초를 이 Competition으로 시작해봅시다.
Leave a Comment