0. Interpretable Models


해석성(interpretability)를 달성하는 가장 좋은 방법은 해석 가능한 모델을 생성하는 알고리즘만 사용하는 것 입니다.

일반적으로 Linear regression, logistic regression and the decision tree가 해석 가능한 모델로 사용됩니다.

이번 장에서는 목차와 같이 다음 모델들을 설명합니다.

  • Linear Regression
  • Logistic Regression
  • Other Linear Regression Extensions
  • Decision Tree
  • Decision Rules
  • RuleFit
  • Other Interpretable Models

이 책에서 설명한 모든 해석 가능한 모델은 KNN(k-nearest neighbors)을 제외하고 모듈 수준에서 해석할 수 있습니다.

아래의 표는 해석 가능한 모델 유형과 그 속성에 대한 간략한 개요를 나타냅니다.

  • 선형(Linear)의 의미는 Feature와 Target간의 연관 관계가 선형으로 모델링이 되었음을 의미합니다.

  • 단조성(Monotonicity)이 있는 모델은 feature에 따른 target값의 결과가 항상 같은 방향으로 진행됨을 의미합니다. feature값이 커지면 target값은 항상 증가하거나, 항상 감소해야합니다. 이런 단조성은 관계를 이해하기 쉽기 때문에 모델 해석에 유용합니다.

  • 상호작용(Interaction)은 feature간의 상호작용을 통해 target값을 예측할 수 있다는 것입니다. 일부 모델에는 자동적으로 포함이 되어 있습니다. 상호작용은 예측 성능을 향상시킬 수 있지만 너무 많거나, 복잡한 상호작용은 해석 가능성을 떨어 뜨릴 수 있습니다.

모델에 따라 Classification만, 또는 Regression만, 또는 둘 다 사용할 수 있습니다.

이 표를 활용하여 원하는 task(classificatio, regression)에 따른 해석 가능한 모델을 선택할 수 있습니다.

Algorithm Linear Monotone Interaction Task
Linear regression Yes Yes No regr
Logistic regression No Yes No class
Decision trees No Some Yes class,regr
RuleFit Yes No Yes class,regr
Naive Bayes No Yes No class
k-nearest neighbors No No No class,regr