이전 페이지|다음 페이지

의사결정트리 속성

의사결정트리에서는 다음과 같은 속성을 사용할 수 있습니다.
이름
이 모델의 이름을 지정할 수 있습니다.
최대 가지
노드 분할 시 허용되는 최대 가지 수를 지정합니다.
최대 레벨
의사결정트리의 최대 깊이를 지정합니다.
리프 크기
리프 노드에서 허용되는 관측치의 최소 개수를 지정합니다.
반응 구간
측도 반응 변수를 범주화하는 데 사용되는 구간 수를 지정합니다.
예측변수 구간
측도 변수인 예측변수를 범주화하는 데 사용되는 구간 수를 지정합니다.
가지치기
트리 가지치기 알고리즘의 강도를 지정합니다. 알고리즘의 강도가 높을수록 의사결정트리가 작아집니다. 값이 클수록 강도가 더 높습니다.
빠른 성장
정보 이득비와 k 평균 빠른 검색 방법을 사용하여 의사결정트리를 키울 수 있습니다. 이 옵션을 사용하지 않으면 정보 이득비 및 greedy 검색 방법이 사용되며, 이때에는 일반적으로 더 큰 트리가 생성되고 생성 시간도 길어집니다.
결측 포함
결측값이 있는 관측치를 포함할 수 있습니다. 범주 변수에서는 결측값이 자체 레벨에 할당됩니다. 측도 변수에서는 결측값이 사용 가능한 가장 작은 컴퓨터 값(음의 무한대)에 할당됩니다.
예측변수 재사용
예측변수에 기반하여 동일한 가지에서 분할을 두 개 이상 허용합니다.
빈도
노드에서 해당 노드에 포함된 관측치의 개수 또는 포함된 관측치의 백분율을 리포트하는지 여부를 지정합니다.
평가
  • 기본 구간 개수 사용은 기본 구간 개수를 사용할지 아니면 고유한 값을 설정할지를 지정합니다. 기본적으로 측도 변수는 20개 구간씩 그룹화됩니다.
  • 숫자기본 구간 개수 사용 속성을 선택하지 않을 때 사용할 구간 개수를 지정합니다. 5에서 100 사이의 정수 값을 지정해야 합니다.
  • 예측 임계는 계산된 확률을 이벤트로 간주하는 값을 지정합니다.
  • 허용도는 백분위수를 추정하는 반복 알고리즘의 수렴을 결정하는 데 사용되는 허용값을 지정합니다. 작은 값을 지정하면 알고리즘의 정밀도가 높아집니다.
진단도표 표시
리프 통계량평가 창이 모델 영역에 표시되는지 여부를 지정합니다.
트리 개요 표시
트리 개요를 표시합니다. 트리 개요를 사용하면 대규모 의사결정트리를 빠르게 탐색할 수 있습니다. 의사결정트리에서 특정 영역을 확대해서 보면 트리 개요에 의사결정트리 전체가 표시되고 현재 보고 있는 영역이 강조 표시됩니다. 강조 표시된 영역을 클릭한 후 끌어서 의사결정트리의 화면을 변경할 수 있습니다. 트리 개요의 왼쪽 위에 있는 크기에 맞게 아이콘 아이콘을 클릭하면 전체 의사결정트리를 볼 수 있습니다. 트리 개요의 왼쪽 위에 있는 트리 최소화 아이콘 아이콘을 클릭하면 트리 개요를 최소화할 수 있습니다.
이전 페이지|다음 페이지|페이지 위