SAS Visual Analytics에서는 Cloudera Hadoop, Hortonworks Data Platform 및 InfoSphere BigInsights에서 데이터를 가져오는 셀프 서비스 옵션을 제공합니다.
이러한 각 플랫폼은 관리자가 별도로 설정해야 합니다.
이러한 플랫폼 모두의 연결 유형에서는 공통적으로 Hive 또는 HiveServer2에 연결한 다음, 테이블을 가져옵니다. SAS 시스템 옵션 필드를 사용하면 다음과 같은 환경 변수를 지정할 수 있습니다.
set=SAS_HADOOP_JAR_PATH="/path/to/files"
options
키워드는 필드에 지정한 옵션과 함께 실행됩니다.
Hadoop 클러스터가 SAS Embedded Process와 함께 구성된 경우에는 HDFS에서 SAS LASR Analytic 서버로의 병렬 로드를 수행할 수 있습니다. 이 경우, 구성 필드에 Hadoop 구성 파일의 경로를 지정해야 합니다. 또한 Hadoop 옵션 필드에 적어도 HDFS_METADIR= 및 HDFS_DATADIR= 옵션을 지정해야 합니다. 사이트에 따라서는 추가 옵션이 필요할 수도 있습니다. Hadoop에서의 병렬 로드를 설정하는 방법에 대한 자세한 내용은 SAS Visual Analytics: 관리 설명서를 참조하십시오.