이전 페이지|다음 페이지

SAS Visual Analytics Explorer의 데이터 분석 개요

데이터 분석 유형

SAS Visual Analytics에서는 다음 세 가지 기본 유형의 데이터 분석을 수행할 수 있습니다.
상관
측도 간의 통계적 관계 정도를 식별합니다.
적합 선
측도 간의 관계 모델을 그립니다. 선형 적합, 이차 적합, 삼차 적합 및 벌점 B 스플라인을 포함한 여러 유형의 적합 선이 있습니다.
예측
통계적 추세를 기반으로 데이터의 미래 값을 예측합니다.

상관

상관은 측도 간의 통계적 관계 정도를 식별합니다. 상관 강도는 -1에서 1 사이의 숫자로 표현됩니다. -1에 가까운 값은 음의 상관 정도가 강함을, 0에 가까운 값은 상관 정도가 거의 없거나 아예 없음을, 1에 가까운 값은 양의 상관 정도가 강함을 암시합니다.
시각화에 상관을 적용하려면 선형 적합 선을 추가하거나 상관 행렬 시각화 유형을 선택합니다.
열지도나 단순 산점도의 경우, 상관은 시각화 범례에서 텍스트 레이블로 식별됩니다. 상관결과 정보를 선택하면 정확한 상관 값을 포함하여 상관에 대한 추가적인 정보를 볼 수 있습니다.
산점도 행렬의 경우, 각 도표의 상관은 도표를 둘러싸고 있는 색상 테두리로 식별됩니다. 시각화 범례에는 색상 값의 키가 표시됩니다. 상관결과 정보를 선택하면 각 도표에 대한 정확한 상관 값을 포함하여 상관에 대한 추가적인 정보를 볼 수 있습니다.
주: 비선형 적합 유형의 경우, 산점도 행렬에는 두 방향으로 변수의 각 교차를 보여 주는 도표가 추가로 표시됩니다. 예를 들어, 산점도 행렬이 변수 A, B 및 C를 그리는 경우 비선형 적합 선이 적용될 때 A * B와 B * A 둘 모두에 대한 도표가 생성됩니다.
상관 행렬의 경우, 각 셀의 상관은 셀 배경색으로 식별됩니다. 시각화 범례에는 색상 값의 키가 표시됩니다. 각 셀의 데이터 팁에는 상관 값이 표시됩니다.

적합 선

적합 선은 두 측도 간의 관계 모델을 그립니다. 산점도와 열지도에 적합 선을 적용할 수 있습니다.
다음과 같은 유형의 적합 선을 시각화에 적용할 수 있습니다.
최적 적합
데이터에 가장 적합한 모델(선형, 이차 또는 삼차)을 선택합니다. 최적 적합 방법은 역방향 변수 선택을 사용하여 가장 높은 순서의 중요한 모델을 선택합니다. 사용된 최종 모델을 확인하려면 시각화 범례에서 회귀결과 정보를 선택합니다.
선형
선형 회귀 알고리즘에서 선형 적합 선을 생성합니다. 선형 적합 선은 두 측도 간의 관계를 가장 잘 나타내는 직선을 생성합니다. 선형 적합 선에 대해 자세히 알아보려면 시각화 범례에서 회귀결과 정보를 선택합니다.
선형 적합의 경우, 상관이 시각화에 자동으로 추가됩니다. 다른 적합 유형에는 상관을 사용할 수 없습니다.
이차
이차 적합 선을 생성합니다. 이차 적합은 단일 곡선이 있는 선을 생성합니다. 이차 적합 선은 주로 포물선 모양의 선을 생성합니다. 이차 적합 선에 대해 자세히 알아보려면 시각화 범례에서 회귀결과 정보를 선택합니다.
삼차
삼차 적합 선을 생성합니다. 삼차 적합 선은 두 개의 곡선이 있는 선을 생성합니다. 삼차 적합 선은 주로 “S”자 모양의 선을 생성합니다. 삼차 적합 선에 대해 자세히 알아보려면 시각화 범례에서 회귀결과 정보를 선택합니다.
P 스플라인
벌점 B 스플라인을 생성합니다. 벌점 B 스플라인은 데이터를 가깝게 맞추는 평활 스플라인입니다. 벌점 B 스플라인은 여러 곡률 변경 지점이 있는 복합 선을 표시할 수 있습니다. 벌점 B 스플라인에 대해 자세히 알아보려면 시각화 범례에서 회귀결과 정보를 선택합니다.

예측

예측은 통계적 추세를 기반으로 데이터의 미래 값을 예측합니다. 날짜 또는 날짜/시간 데이터 항목이 포함된 선 그래프에만 예측을 사용할 수 있습니다.
예측은 시각화에 예측된 값이 있는 선을 추가하고 신뢰 구간을 나타내는 컬러 대역도 추가합니다. 예를 들어, 95% 신뢰 구간은 미래 값에 대한 예측 모델 신뢰도가 95%인 데이터 범위입니다.
Explorer에서는 데이터와 비교해 여러 예측 모델을 자동으로 테스트한 다음 최적 모델을 선택합니다. 사용된 예측 모델을 확인하려면 시각화 범례에서 상관결과 정보를 선택합니다.
예측 모델은 다음 중 하나일 수 있습니다.
  • 진폭감소 추세 지수 평활
  • 선형 지수 평활
  • 계절 지수 평활
  • 단순 지수 평활
  • 윈터스 방법(가법)
  • 윈터스 방법(승법)
주: 예측에서는 시간의 표준 구간(예: 1시간에는 60분, 하루에는 24시간 등)을 사용하는 주기적 패턴을 고려합니다. 데이터가 비표준 구간(예: 1일에 30분 주기 48개)을 사용하는 경우에는 주기적 패턴이 예측에서 고려되지 않습니다.
이전 페이지|다음 페이지|페이지 위