3.1 비지도 학습의 종류

본 문서는 [파이썬 라이브러리를 활용한 머신러닝] 책을 기반으로 하고 있으며, subinium(본인)이 정리하고 추가한 내용입니다. 생략된 부분과 추가된 부분이 있으니 추가/수정하면 좋을 것 같은 부분은 댓글로 이야기해주시면 감사하겠습니다.


두 번째로 다룰 머신 러닝 알고리즘 종류는 비지도 학습(unsupervised learning) 입니다. 비지도 학습이란 알고 있는 출력값이나 정보 없이 학습 알고리즘을 가르쳐야 하는 모든 종류의 머신러닝을 가리킵니다. 비지도 학습에서 학습 알고리즘은 입력 데이터만으로 데이터에서 지식을 추출할 수 있어야 합니다.

이번 장에서 두 가지 비지도 학습을 살펴봅니다. 비지도 변환과 군집입니다.

비지도 변환

비지도 변환(unsupervised transformation) 은 데이터를 새롭게 표현하여 사람이나 다른 머신러닝 알고리즘이 원래 데이터보다 쉽게 해석할 수 있도록 만드는 알고리즘입니다. 비지도 변환이 널리 사용되는 분야는 특성이 많은 고차원 데이터를 특성의 수를 줄이면서 꼭 필요한 특징을 포함한 데이터로 표현하는 방법인 차원 축소(dimensionality reduction)입니다. 시각화를 위해 데이터셋을 2차원으로 변경하는 경우가 대표적 예입니다.

비지도 변환으로 데이터를 구성하는 단위나 성분을 찾기도 합니다. 텍스트 문서에서 주제를 추출하는 것이 그 예입니다.

군집 알고리즘

군집(clustering) 은 데이터를 비슷한 것끼리 그룹으로 묶는 것입니다. label이 없어도 사진 등에 나타나는 공통적인 특징으로 그룹화를 하는 것입니다. 블로그에서도 관련 주제로 문제를 푸는 포스팅을 한적이 있습니다. 링크

Leave a Comment