의사결정트리에서는 다음과 같은 속성을 사용할 수 있습니다.
최대 가지
노드 분할 시 허용되는 최대 가지 수를 지정합니다.
리프 크기
리프 노드에서 허용되는 관측치의 최소 개수를 지정합니다.
반응 구간
측도 반응 변수를 범주화하는 데 사용되는 구간 수를 지정합니다.
예측변수 구간
측도 변수인 예측변수를 범주화하는 데 사용되는 구간 수를 지정합니다.
가지치기
트리 가지치기 알고리즘의 강도를 지정합니다. 알고리즘의 강도가 높을수록 의사결정트리가 작아집니다. 값이 클수록 강도가 더 높습니다.
빠른 성장
정보 이득비와 k 평균 빠른 검색 방법을 사용하여 의사결정트리를 키울 수 있습니다. 이 옵션을 사용하지 않으면 정보 이득비 및 greedy 검색 방법이
사용되며, 이때에는 일반적으로 더 큰 트리가 생성되고 생성 시간도 길어집니다.
결측 포함
결측값이 있는 관측치를 포함할 수 있습니다. 범주 변수에서는 결측값이 자체 레벨에 할당됩니다. 측도 변수에서는 결측값이 사용 가능한 가장 작은 컴퓨터
값(음의 무한대)에 할당됩니다.
예측변수 재사용
예측변수에 기반하여 동일한 가지에서 분할을 두 개 이상 허용합니다.
빈도
노드에서 해당 노드에 포함된 관측치의 개수 또는 포함된 관측치의 백분율을 리포트하는지 여부를 지정합니다.
평가
-
기본 구간 개수 사용은 기본 구간 개수를 사용할지 아니면 고유한 값을 설정할지를 지정합니다. 기본적으로 측도 변수는 20개 구간씩 그룹화됩니다.
-
숫자는 기본 구간 개수 사용 속성을 선택하지 않을 때 사용할 구간 개수를 지정합니다. 5에서 100 사이의 정수 값을 지정해야 합니다.
-
예측 임계는 계산된 확률을 이벤트로 간주하는 값을 지정합니다.
-
허용도는 백분위수를 추정하는 반복 알고리즘의 수렴을 결정하는 데 사용되는 허용값을 지정합니다. 작은 값을 지정하면 알고리즘의 정밀도가 높아집니다.
진단도표 표시
리프 통계량 및 평가 창이 모델 영역에 표시되는지 여부를 지정합니다.
트리 개요 표시
트리 개요를 표시합니다. 트리 개요를 사용하면 대규모 의사결정트리를 빠르게 탐색할 수 있습니다. 의사결정트리에서 특정 영역을 확대해서 보면 트리 개요에
의사결정트리 전체가 표시되고 현재 보고 있는 영역이 강조 표시됩니다. 강조 표시된 영역을 클릭한 후 끌어서 의사결정트리의 화면을 변경할 수 있습니다.
트리 개요의 왼쪽 위에 있는

아이콘을 클릭하면 전체 의사결정트리를 볼 수 있습니다. 트리 개요의 왼쪽 위에 있는

아이콘을 클릭하면 트리 개요를 최소화할 수 있습니다.