해석성(interpretability)를 달성하는 가장 좋은 방법은 해석 가능한 모델을 생성하는 알고리즘만 사용하는 것 입니다.
일반적으로 Linear regression, logistic regression and the decision tree가 해석 가능한 모델로 사용됩니다.
이번 장에서는 목차와 같이 다음 모델들을 설명합니다.
- Linear Regression
- Logistic Regression
- Other Linear Regression Extensions
- Decision Tree
- Decision Rules
- RuleFit
- Other Interpretable Models
이 책에서 설명한 모든 해석 가능한 모델은 KNN(k-nearest neighbors)을 제외하고 모듈 수준에서 해석할 수 있습니다.
아래의 표는 해석 가능한 모델 유형과 그 속성에 대한 간략한 개요를 나타냅니다.
-
선형(Linear)의 의미는 Feature와 Target간의 연관 관계가 선형으로 모델링이 되었음을 의미합니다.
-
단조성(Monotonicity)이 있는 모델은 feature에 따른 target값의 결과가 항상 같은 방향으로 진행됨을 의미합니다. feature값이 커지면 target값은 항상 증가하거나, 항상 감소해야합니다. 이런 단조성은 관계를 이해하기 쉽기 때문에 모델 해석에 유용합니다.
-
상호작용(Interaction)은 feature간의 상호작용을 통해 target값을 예측할 수 있다는 것입니다. 일부 모델에는 자동적으로 포함이 되어 있습니다. 상호작용은 예측 성능을 향상시킬 수 있지만 너무 많거나, 복잡한 상호작용은 해석 가능성을 떨어 뜨릴 수 있습니다.
모델에 따라 Classification만, 또는 Regression만, 또는 둘 다 사용할 수 있습니다.
이 표를 활용하여 원하는 task(classificatio, regression)에 따른 해석 가능한 모델을 선택할 수 있습니다.
Algorithm | Linear | Monotone | Interaction | Task |
---|---|---|---|---|
Linear regression | Yes | Yes | No | regr |
Logistic regression | No | Yes | No | class |
Decision trees | No | Some | Yes | class,regr |
RuleFit | Yes | No | Yes | class,regr |
Naive Bayes | No | Yes | No | class |
k-nearest neighbors | No | No | No | class,regr |