주: 현재 사이트에 SAS Visual Statistics에 대한 라이선스가 있으면 의사결정트리에 고급 기능이 포함됩니다.
자세한 내용은 의사결정트리를 참조하십시오.
의사결정트리에서는 하나 이상의 예측변수 데이터 항목 값을 사용하여 반응 데이터 항목의 값을 예측합니다. 의사결정트리에는 일련의 노드가 트리로 표시됩니다.
여기서 최상위 노드는 반응 데이터 항목이고, 트리의 각 가지는 예측변수 데이터 항목 값의 분할을 나타냅니다. 의사결정트리를 분류 및 회귀 트리라고도
합니다.
트리의 각 가지에는 가지에 대한 예측변수 이름이 분할 맨 위에 표시됩니다. 가지의 두께는 각 노드와 연결된 값 개수를 나타냅니다. 각 노드에 대한
예측변수 값은 노드 위에 표시됩니다.
트리의 각 노드에서 노드의 데이터는 히스토그램(반응에 연속 데이터가 포함되었을 때)이나 막대 그래프(반응에 이산 데이터가 포함되었을 때)로 표시됩니다.
각 노드의 히스토그램이나 막대 그래프에는 트리 분할로 선택된 반응 데이터 항목의 값이 표시됩니다. 노드 오른쪽 위의 숫자는 막대 그래프나 히스토그램의
가장 큰 값 또는 빈도를 나타냅니다. 각 노드 맨 아래에는 노드의 총 데이터 값 수(개수)가 표시됩니다.
의사결정트리 아래에는 노드의 Icicle 도표가 표시됩니다. Icicle 도표에서 노드의 색상은 해당 노드의 예측 레벨을 나타냅니다. 의사결정트리나
Icicle 도표에서 노드를 선택하면 해당하는 노드가 상대 위치에서 선택됩니다.
SAS Visual Analytics의 의사결정트리에서는 수정된 C4.5 알고리즘 버전을 사용합니다.
의사결정트리에 대한 상세 정보 테이블에는 두 개의 추가 데이터 칼럼, 즉 노드 ID와 상위 ID가 포함됩니다. 노드 ID는 트리의 각 노드에 대해
고유 값을 지정합니다. 상위 ID는 상위 노드의 ID를 지정합니다.