SAS Visual Statistics에서는 세 가지 회귀 시각화 모두에 대해 데이터셋의 각 관측치에 대한 예측 정보가 포함된 변수 두 개를 생성합니다.
이러한 변수는 생성된 후 예측 모델을 포함하여 다른 시각화에 사용될 수 있습니다.
새로운 두 가지 변수를 생성하려면 다음 단계를 완료합니다.
-
유효한 선형회귀, 로지스틱 회귀 또는 일반화선형모델 시각화를 생성합니다.
-
시각화의 오른쪽 위에서

을 클릭하고
예측값 파생을 선택합니다.
-
새로운 예측 변수 창에서
예측값과
잔차값 또는
확률값의 이름을 입력합니다.
잔차값은 선형회귀 및 일반화선형모델에 사용할 수 있습니다.
확률값은 로지스틱 회귀에 사용할 수 있습니다.
-
확인을 클릭합니다. 로지스틱 회귀의 예측값은
범주 변수 섹션에 표시됩니다. 다른 모델의 예측값을 포함하여 다른 모든 변수는
예측 변수 섹션에 표시됩니다.
어떤 시각화를 선택했는지에 따라 각 변수에 포함된 정보가 조금씩 다를 수 있습니다.
예측값
선형회귀 및 일반화선형모델에서 이 숫자 값은 회귀 모델에서 생성된 값입니다. 또는 모델에서 관측치 스코어를 생성했을 때 회귀 모델에서 생성될 수 있는
값입니다.
로지스틱 회귀에서 이는 계산된 확률과 예측 임계 속성에 기반하여 로지스틱 회귀에서 생성한 의사결정입니다. 모든 관측치는 관심 이벤트 레벨, 관심 없는 이벤트 레벨 또는 결측으로 분류됩니다.
잔차값
각 관측치에 대해 계산된 잔차입니다. 이 값은 선형회귀 및 일반화선형모델 시각화에 사용할 수 있습니다.
확률값
각 관측치에 대해 계산된 확률입니다. 확률값이 예측 임계 속성보다 크거나 같은 관측치는 관심 이벤트 레벨에 있는 것으로 예측됩니다. 확률값이 예측 임계 속성보다 작은 관측치는 관심 이벤트 레벨에 없는 것으로 예측됩니다. 즉, 각 개별 측도 레벨에 대해서는 예측이 생성되지 않고 관심 측도 레벨과 그
이외의 대상에 대해서만 예측이 생성됩니다.