이전 페이지|다음 페이지

데이터베이스 테이블 가져오기

데이터베이스 테이블을 가져오려면 해당 데이터베이스용 SAS/ACCESS 제품이 SAS Workspace Server에서 사용 가능하도록 구성되고 라이선스도 있어야 합니다. 다음과 같은 데이터베이스에서 데이터를 가져올 수 있습니다.
  • 서버 데이터베이스 - SAS 데이터셋, Aster, DB2, Greenplum, MySQL, Netezza, ODBC, Oracle, PostgreSQL, Salesforce, SAP HANA, SQL Server, Teradata, Vertica
  • Hadoop 데이터베이스 - BigInsights, Cloudera, Cloudera Impala, Hortonworks, MapR, Pivotal HD
주: BigInsights, Cloudera, Hortonworks, MapR 및 Pivotal HD는 서로 다른 메뉴 선택 항목이지만 모두 SAS/ACCESS Interface to Hadoop을 사용합니다.
데이터베이스 테이블을 가져오는 방법:
  1. 데이터 가져오기 창의 서버 또는 Hadoop 데이터베이스 리스트에서 데이터베이스 이름을 선택합니다. 이 리스트에는 SAS/ACCESS 제품이 구성되고 라이선스가 있는 데이터 소스 및 관리자로부터 사용 권한을 부여 받은 데이터 소스만 포함됩니다.
    서버의 SAS 데이터셋을 가져오려면 서버에서 SAS 데이터셋 가져오기에서 자세한 내용을 참조하십시오.
  2. 연결 정보를 지정합니다. 다음은 연결 정보 지정과 관련된 중요한 사항입니다.
    • 서버 필드는 서버의 호스트 이름에 해당합니다. 일부 데이터베이스에서는 서버와 포트의 조합 대신 데이터 소스 이름을 사용하여 연결합니다.
    • DBMS 테이블 이름 필드에서 여러 테이블을 동시에 가져올 수 있습니다. 여러 테이블을 동시에 가져오려면 Ctrl 키를 누른 채로 테이블 선택 창에서 테이블 이름을 선택하십시오. 가져오기를 수행하는 동안 테이블 가져오기가 성공했는지, 실패했는지 또는 가져오기를 취소했는지가 상태 칼럼의 아이콘을 통해 표시됩니다. 비고 칼럼의 링크를 클릭하면 로그 또는 오류 메시지 같은 추가적인 정보를 볼 수 있습니다.
    데이터베이스별 연결 상세 정보를 보려면 데이터베이스 연결 팁 항목을 참조하십시오.
    대부분의 필드에서는 대소문자가 구분됩니다. 예를 들어, products 값을 데이터베이스 필드 값으로 지정하는 것과 PRODUCTS를 지정하는 것은 다릅니다. 대소문자 구분 여부는 데이터베이스 벤더에 따라 달라집니다. 또한 일부 데이터베이스에서는 스키마가 사용됩니다. 스키마를 명시적으로 지정하지 않은 경우 일부 데이터베이스에서는 자동으로 사용자 ID를 스키마로 사용합니다. 사용자 ID스키마 필드는 대소문자가 구분된다는 점에 유의하십시오. 잘 모르겠으면 데이터베이스 관리자에게 문의하십시오.
  3. 찾아보기를 클릭하여 가져올 테이블을 선택합니다.
  4. (선택 사항) 옵션을 펼쳐 추가적인 연결 옵션을 표시합니다. 다음은 추가 연결 옵션 지정과 관련된 중요한 사항입니다.
    • Database 옵션 필드의 유효한 값에 대한 자세한 내용은 SAS/ACCESS for Relational Databases: Reference를 참조하십시오. 여기에서 현재 작업하는 데이터베이스 유형에 대한 데이터셋 옵션 항목을 참조하십시오(예: Data Set Options for ODBC).
    • SAS 시스템 옵션 필드를 사용하여 다음과 같은 환경 변수를 지정할 수 있습니다.
      set=SAS_HADOOP_JAR_PATH="/path/to/files"
      options 키워드는 이 필드에 지정한 옵션과 함께 실행됩니다.
  5. (선택 사항) 고급을 클릭하여 라이브러리 및 위치 설정을 검토합니다. 필요에 따라 설정을 변경합니다.
    Explorer 또는 Designer에서 데이터를 가져오는 경우 데이터 구성 기능이 없으면 고급 섹션에 액세스할 수 없습니다. 대신 데이터를 범용 영역으로 가져오거나, 개인 위치에 테이블 저장을 선택하여 다른 사용자의 데이터 액세스를 방지할 수 있습니다.
  6. 확인을 클릭합니다.
테이블을 가져오면 암호를 제외한 연결 정보가 저장됩니다. 따라서 추가 테이블을 빠르게 가져오거나 필요에 따라 테이블을 다시 로드할 수 있습니다.
동일한 테이블 이름을 사용하여 기존 테이블의 데이터를 다시 로드하려면 다음 중 하나를 수행해야 합니다.
  • 테이블의 데이터를 원래 가져올 때 사용한 것과 동일한 라이브러리와 출력 폴더를 사용합니다.
  • 라이브러리와 출력 폴더 모두 테이블의 데이터를 원래 가져올 때와 다르게 지정합니다.
테이블을 다시 로드할 수 없을 때 로그에 오류 정보가 들어 있지 않을 수 있습니다. 이때에는 테이블에 대해 마지막으로 성공한 작업에 대한 정보가 로그에 표시되는 것일 수 있습니다.
주: 단일 테이블을 가져올 때는 작업을 취소할 수 없습니다. 테이블을 여러 개 가져올 때만 작업 취소를 선택할 수 있습니다. 그러나 취소를 실행한 시점에 처리 중이던 테이블은 취소할 수 없으며 해당 테이블에 대해서는 로드가 완료됩니다.
이전 페이지|다음 페이지|페이지 위