이전 페이지|다음 페이지

테이블 사용 방법

입력 테이블

팩트 테이블과 차원 테이블을 작업 공간으로 끌어다 놓으면 스타 스키마에 사용됩니다. 기본적으로 Data Builder는 작업 공간에 첫 번째로 놓은 테이블을 팩트 테이블로 간주합니다. 도구 모음에서 스타 스키마 테이블 편집을 클릭하여 다른 팩트 테이블을 선택합니다.
스타 스키마가 서버를 통해 메모리에 생성되기 때문에 첫 번째 단계는 테이블이 메모리에 로드되는지 확인하는 것입니다. 스타 스키마가 실행될 때마다 테이블이 전송되는지 확인하십시오. 스타 스키마가 실행될 때마다 테이블이 전송되는 경우 성능이 저하될 수 있습니다. 반면 테이블이 서버의 메모리에 이미 로드된 경우에는 스타 스키마 실행 속도와 출력 생성 속도가 빨라집니다.
같은 HDFS 라이브러리의 테이블을 사용하여 스타 스키마를 생성할 때, 스타 스키마의 테이블 중 하나 이상이 암호화되고 HDFS 라이브러리는 암호화되지 않았으면 스타 스키마가 실행되지 않습니다. 이때에는 암호화된 테이블에 대한 암호가 필요하다는 오류 메시지가 표시됩니다. 이 오류는 이전에 암호화되었던 라이브러리에 대해 관리자가 암호화를 해제했을 때 발생할 수 있습니다. 그 이전에 라이브러리에 있던 모든 테이블은 암호화된 상태로 남아 있습니다. 이 문제는 관리자가 라이브러리에 대해 암호화를 다시 설정하면 해결됩니다. 자세한 내용은 관리자에게 문의하십시오.

칼럼 접두어

차원 테이블 이름의 처음 15자와 밑줄 문자가 처음에 차원 테이블의 칼럼 이름 접두어로 설정되어 있습니다. 출력 테이블의 칼럼 이름은 접두어와 원래 칼럼 이름을 조합한 것입니다.
하지만 입력 탭 상단의 메뉴에서 테이블 이름을 선택한 후 다른 접두어 값을 지정할 수 있습니다.
팩트 테이블의 칼럼 이름은 접두어를 사용하여 수정되지 않습니다.
칼럼 이름은 32자로 제한됩니다. 칼럼 이름이 긴 경우, 접두어를 줄이면 원래 칼럼 이름의 더 많은 부분을 유지할 수 있습니다.

출력 테이블 및 메모리 절약

메모리를 효율적으로 사용하기 위해 스키마의 기본 출력은 뷰입니다. 뷰를 생성하기 위해 출력 탭의 뷰로 출력 생성 체크 박스가 기본적으로 선택되어 있습니다. 이 체크 박스를 선택 취소하면 출력이 테이블로 생성됩니다.
출력이 뷰인 경우에는 뷰에 액세스할 때 원래 테이블을 사용하여 행이 생성됩니다. 전체 출력 테이블이 생성되지 않으며 메모리에 전체 내용이 저장되지도 않기 때문에 이는 뷰의 주요 이점입니다.
스타 스키마에서 테이블을 생성하기 위해 뷰로 출력 생성 체크 박스를 선택 취소하는 경우에는 시스템의 사용 가능한 메모리가 테이블을 저장하기에 충분해야 합니다. 스타 스키마를 실행하는 동안 시스템의 메모리가 부족해지면 출력 테이블에 사용된 메모리가 비워지고 오류 메시지가 수신됩니다.
SAS LASR Analytic Server 테이블을 스키마에 대한 입력으로 사용할 때는 스타 스키마의 출력 테이블이 동일한 라이브러리를 사용해야 합니다.
HDFS 라이브러리의 테이블을 사용하여 스타 스키마를 생성하는 때는 HDFS 라이브러리 경로와 LASR 출력 라이브러리의 태그가 일치하지 않으면 스타 스키마가 저장되지 않습니다. 이때에는 라이브러리 경로가 SAS LASR Analytic Server 태그와 일치하지 않는다는 오류 메시지가 표시됩니다. HDFS 라이브러리 경로와 일치하는 태그를 가진 LASR 라이브러리로 출력 테이블을 변경해 보십시오. LASR 라이브러리의 태그는 SAS Management Console에서 볼 수 있습니다. 자세한 내용은 관리자에게 문의하십시오.

성능 고려 사항

LASR 스타 스키마를 뷰로 생성하면 테이블을 생성할 때보다 편리할 수 있지만, 뷰를 통해 데이터에 액세스하면 성능에 부정적인 영향을 줄 수 있습니다. 영향의 정도는 차원 테이블의 크기에 따라 다릅니다. 하지만 데이터 통과 횟수는 더 중요합니다. 예를 들어, 백분위수 또는 상자 도표를 요청하거나 통계 모델을 적합시키려면 데이터를 여러 번 통과해야 합니다. 이러한 요청은 요약 통계량에 대한 요청보다 영향을 더 많이 받습니다.
다음 사항을 고려하십시오.
  • 뷰를 처음 생성할 때는 테이블을 생성할 때보다 빠릅니다. 하지만 뷰의 데이터를 액세스할 때는 테이블의 데이터를 액세스할 때보다 느립니다.
  • 테이블을 생성하려면 뷰를 생성할 때보다 물리적 메모리가 많이 필요합니다. 그러나 시스템의 메모리 용량이 충분한 경우 테이블을 생성하면 데이터에 액세스할 때 최상의 성능을 발휘합니다.
이전 페이지|다음 페이지|페이지 위