Machine Learning for Everyone

Kaggle에서 Getting Started 의 대표 5개의 주제로 영상 강의와 튜토리얼 자료 제작을 계획하고 있습니다. 구체적인 내용은 sidebar 또는 toggle menu 또는 메뉴 아래 링크를 통해 각 카테고리로 들어오시면 됩니다.

Kaggle을 공부하는 방법은 여러가지가 있지만, 그 중에서도 시작하기 좋은 방법은 다른 실력자분들의 커널을 필사하며 공부하는 방법입니다. 필사에 좋은 커널을 추천하고, 커널을 만들며, 그를 통해 강의까지 제작하기 위한 페이지입니다.

업데이트될 때마다 페이스북 페이지에 업로드 예정입니다.

  • 타이타닉 Beginner Ver.
  • 각 Competition에 Kaggle 추천 튜토리얼 링크 추가

1. 타이타닉 생존자 예측

  • title : Titanic: Machine Learning from Disaster
  • category : Classification Problem
  • link

titanic

타이타닉호 침몰 사고는 1912년 4월 15일에 발생한 해상 사고로, 역사 상 가장 유명한 침몰 사고 중 하나입니다. 이 사고는 2224명의 승객과 승무원 중 1502명이나 사망한 안타까운 사고입니다. 실제 사고의 데이터를 가지고, 사람들의 생존 여부를 예측해봅시다.

머신러닝을 시작하는 분들이 가장 처음 배운다는 이진 분류(binary classification) 문제로 처음 시작하는 분들에게 적합합니다.

시작하기

2. 주택 가격 예측

  • title : House Prices: Advanced Regression Techniques
  • category : Regression Problem
  • link

house

머신러닝 책만 보면 나오는 회귀 예제 중 하나는 보스턴 주택 가격 예측 문제 입니다. 책의 예제를 다시 해볼 수 있는 competition도 있지만, 이제 새로운 회귀문제를 구하는 분들에게 적합합니다.

더 많아진 특성과 확장된 데이터는 특성공학과 고급 회귀 테크닉(랜덤 포레스트, 그래디언트 부스팅)을 연습할 기회가 될 것입니다.

시작하기

3. 숫자 인식

  • title : Digit Recognizer
  • category : Computer Vision
  • link

handwritten-digits-classification

C언어를 시작할 때, "hello world!"가 있다면, Computer Vision에서는 MNIST 가 있습니다. 1999년도에 만들어진 이 데이터는 숫자 손 글씨를 분류하는 분류하는 문제입니다.

CS231n 등 딥러닝 강의를 들으신 분이라면, 여기서 신경망을 시험해보는 것을 추천합니다. 21세기 머신러닝의 핵심 중 하나인 Computer Vision을 시작해봅시다.

시작하기

4. 얼굴 키포인트

  • title : Facial Keypoints Detection
  • category : Image Processing
  • link

facial

대부분의 사람은 얼굴이 다르게 생겼습니다. 이런 얼굴에서 포인트를 찾는 것은 매우 많은 영역에서 필요한 기술입니다. 얼굴 추적, 표정 분석, 얼굴 인식 등 다양한 분야가 있습니다.

하지만 이 문제는 매우 어려운 문제로 알려져있습니다. 위의 Computer Vision을 좀 더 시도해봅시다. 기초는 아닌 것 같지만, 매우 필요한 분야이니까요?

시작하기

5. 영화리뷰 분석하기

  • title : Bag of Words Meets Bags of Popcorn
  • category : Natural Language Processing
  • link

movie review

인공지능의 목표 중 하나인 자연어 처리입니다. 우리가 실생활에 쓰는 언어를 처리하는 분야입니다. 국내에도 다양한 NLP 스터디가 존재하고, 많은 프로젝트들이 진행되고 있습니다.

자연어 처리에 사용되는 word2vec에 대한 기초를 이 Competition으로 시작해봅시다.

시작하기

Leave a Comment