의사결정트리 시각화에서 가지치기 속성은 의사결정트리의 가지치기 강도를 결정합니다. 성장 알고리즘은 사용자가 지정하는 속성에 기반하여 의사결정트리를 생성합니다. 가지치기 알고리즘은
아래쪽부터 시작하여 각 노드를 해당 서브트리의 루트 노드로 간주합니다. 서브트리의 오분류 비율이 루트 노드의 오분류 비율보다 훨씬 나으면 서브트리가
유지됩니다. 서브트리의 오분류 비율이 루트 노드의 오분류 비율과 비슷하면 서브트리에 대해 가지치기가 수행됩니다. 일반적으로 의사결정트리는 적게 유지할수록
좋습니다.
가지치기 속성 슬라이더가 약에 더 가까우면 오분류 비율의 차이가 상대적으로 작은 것입니다. 가지치기 속성 슬라이더가 강에 더 가까우면 오분류 비율의 차이가 상대적으로 큰 것입니다. 즉, 가지치기 알고리즘의 강도가 약이면 강한 가지치기 알고리즘에 비해 의사결정트리의
깊이가 훨씬 깊습니다.
그 어떤 분할에도 사용되지 않는 변수는 일반적으로 다음과 같은 두 가지 이유 중 하나 때문에 의사결정트리에 영향을 줄 수 있습니다. 변수가 분할에
사용되었지만 해당 분할이 포함된 서브트리가 가지치기되었습니다. 또는 변수에 결측값이 포함되었지만 결측값 포함 속성이 비활성화되었습니다.
주: 예측변수가 의사결정트리의 예측 정확도에 기여하지 않거나, 기여도가 매우 작을 때는 표시되는 최종 의사결정트리에 예측변수가 포함되지 않습니다.