의사결정트리에서는 하나 이상의 예측변수 데이터 항목 값을 사용하여 타겟 데이터 항목의 값을 예측합니다. 의사결정트리에는 일련의 노드가 트리로 표시됩니다. 여기서 최상위 노드는 타겟 데이터 항목이고, 트리의 각 가지는 예측변수
데이터 항목 값의 분할을 나타냅니다. 의사결정트리를 분류 및 회귀 트리라고도 합니다.
트리의 각 가지에는 가지에 대한 예측변수 이름이 분할 맨 위에 표시됩니다. 가지의 두께는 각 노드와 연결된 값 개수를 나타냅니다. 각 노드에 대한 예측변수 값은 노드 위에 표시됩니다.
트리의 각 노드에서 노드의 데이터는 히스토그램(타겟에 연속 데이터가 포함된 경우)이나 막대 그래프(타겟에 이산 데이터가 포함된 경우)로 표시됩니다. 각 노드의 히스토그램이나 막대 그래프에는 트리 분할로 선택된 타겟 데이터
항목의 값이 표시됩니다. 노드 오른쪽 위의 숫자는 막대 그래프나 히스토그램의 가장 큰 값 또는 빈도를 나타냅니다. 각 노드 맨 아래에는 노드의 총 데이터 값 수(개수)가 표시됩니다.
SAS Visual Analytics의 의사결정트리에서는 수정된 C4.5 알고리즘 버전을 사용합니다.
의사결정트리에 대한 상세 정보 테이블에는 두 개의 추가 데이터 칼럼, 즉 노드 ID와 상위 ID가 포함됩니다. 노드 ID는 트리의 각 노드에 대해 고유 값을 지정합니다. 상위 ID는 상위 노드의 ID를 지정합니다.