이전 페이지|다음 페이지

SAS Data in HDFS 라이브러리 사용

기본 라이브러리

배포에서 Hadoop을 배치된 데이터 공급자로 사용하는 경우, SAS Deployment Wizard는 이 공급자에 대한 사전 정의된 라이브러리를 등록합니다. 이 라이브러리는 SAS 폴더 트리에서 사용할 수 있으며 /Shared Data/SAS Visual Analytics/Public/Visual Analytics Public HDFS에 있습니다.

Staging 라이브러리

SAS Data in HDFS 라이브러리를 Staging 라이브러리로 지정할 수 있습니다. 출력 테이블의 행이 클러스터의 컴퓨터 간에 분산되기 때문에 이 라이브러리는 공용입니다. 이 경우, 서버가 메모리에 테이블을 로드할 때 데이터를 병렬로 읽을 수 있습니다.
SAS Data in HDFS 라이브러리를 Staging용으로 사용할 경우 출력 라이브러리용으로 SAS LASR Analytic 서버 라이브러리를 지정해야 합니다.

출력 라이브러리

SAS Data in HDFS 라이브러리를 출력 라이브러리로 지정할 수 있습니다. 엔진은 테이블의 행을 클러스터의 컴퓨터 간에 분산시킵니다. 이후에는 SAS 폴더 트리에서 테이블을 선택하고 마우스 오른쪽 버튼을 클릭한 후 테이블 로드를 선택합니다. 이 메뉴 옵션은 HDFS에서 SAS LASR Analytic 서버의 메모리로 테이블을 로드합니다.
출력 라이브러리에 SAS Data in HDFS 테이블이 사용되는 경우 테이블을 분할할 수 있습니다. 파티션 기준 메뉴에서 사용할 칼럼을 선택할 수 있습니다. 테이블의 분할은 선택한 칼럼과 출력형식 값이 동일한 모든 행이 클러스터에서 한 컴퓨터에 분산되도록 합니다. 아울러 이러한 행은 동일한 HDFS 블록에 배치됩니다. 분할된 테이블을 메모리에 로드할 경우 분할 정보가 유지되고 분할된 In-Memory 테이블이 생성됩니다.

참조 항목

제약

SAS Visual Data Builder에서 SAS Data in HDFS 라이브러리를 사용할 때 다음과 같은 제약이 있습니다.
  • SAS Data in HDFS 엔진은 쓰기 전용 엔진이기 때문에 SAS Data in HDFS 라이브러리를 입력 라이브러리로 지정할 수 없습니다.
  • 속성 탭의 데이터 추가 체크 박스가 비활성화됩니다. SAS Data in HDFS 엔진은 데이터 추가를 지원하지 않습니다.
  • SAS Data in HDFS 라이브러리를 출력 라이브러리로 지정한 경우, SAS Data in HDFS 엔진은 쓰기 전용 엔진이기 때문에 결과 탭에서 결과를 볼 수 없습니다.
이전 페이지|다음 페이지|페이지 위