이전 페이지|다음 페이지

높은 카디날리티 제약 조건

소개

높은 카디날리티 데이터에는 매우 많은 수의 고유 값을 포함하는 칼럼이 하나 이상 있습니다. 예를 들어, 사용자 이름, 전자 우편 주소 및 은행 계좌 번호가 높은 카디날리티 데이터 항목일 수 있습니다.
SAS Visual Analytics에서 수천 개 값으로 집계되는 수십 억 개의 값을 지원합니다. 테이블의 수십억 개 값이 수백만 개의 고유 식별자를 가질 때, 이러한 식별자를 포함하는 칼럼이 높은 카디날리티 데이터 항목입니다.
사용자가 의미 있는 결과를 신속하게 얻을 수 있도록 특정 시각화 및 리포트 개체에 대해 반환될 수 있는 고유 값 수가 제한됩니다. 사용자가 높은 카디날리티 데이터 항목을 선택할 때, 결과는 해당 임계, 데이터의 고유 값 수 및 사용자 선택에 따라 결정됩니다.
다음 항목에서는 임계의 두 가지 고유 레벨 즉, 클라이언트 측 임계와 Middle Tier 임계에 대한 정보를 제공합니다.

높은 카디날리티 데이터에 대한 클라이언트 측 임계

클라이언트 측 임계는 개별 응용 프로그램(예: Explorer) 또는 응용 프로그램 그룹(예: Designer 및 Viewer)과 관련이 있습니다. 클라이언트 측 임계를 초과하는 일부 요청에서는 오류가 표시되고 결과가 반환되지 않습니다. 클라이언트 측 임계를 초과하지만 Middle Tier 임계는 초과하지 않는 일부 요청에서는 조정된 결과가 반환됩니다.
주: 일반적으로 클라이언트 측 임계는 고정되어 있습니다. 예외적으로 사용자가 Explorer에서 낮음, 중간 또는 높음 임계 레벨을 사용자 우선 설정으로 선택할 수 있습니다. 메모리 가용성이 낮은 컴퓨터에서는 클라이언트 측 임계를 낮음으로 설정하면 시스템 작동 중지와 같은 이벤트를 방지할 수 있습니다.
시각화 및 리포트 개체에 대한 클라이언트 측 임계는 SAS Visual Analytics: 사용 설명서의 부록 데이터 제한에 나와 있습니다. 이 부록에서는 클라이언트 측 임계를 초과하지만 Middle Tier 임계는 초과하지 않는 특정 요청에 대해 클라이언트가 제공하는 조정된 반응을 설명합니다.

높은 카디날리티 데이터에 대한 Middle Tier 임계

Middle Tier 임계는 범위가 넓으며 지정된 시각화 또는 리포트 개체의 모든 인스턴스에 영향을 줍니다. 클라이언트 측 임계에 비해 Middle Tier 임계는 덜 세부적이고 덜 제한적입니다. Middle Tier 임계를 초과하는 요청에서는 오류가 표시되고 결과가 반환되지 않습니다. 기본 임계는 거의 모든 환경에서 작동합니다. 일반적으로 사용자는 높은 카디날리티 데이터 항목을 필터링 또는 그룹화하므로 요청이 Middle Tier 임계를 초과하는 상황은 드뭅니다.
다음 표에서 두 번째 칼럼은 최대 데이터 볼륨이 아니라 최대 고유 값 개수를 나타냅니다.
Middle Tier 임계
시각화 또는 리포트 개체
의사결정트리1
10,000
교차 테이블
50,000
테이블(Designer 및 Viewer)
50,000
상자 도표: 하나 이상의 측도, 범주 없음2
50,000
막대 그래프: 단일 범주
50,000
열지도: 단일 범주
50,000
선 그래프: 하나 이상의 측도, 단일 범주(숫자, 날짜, 시간 또는 문자열)
50,000
버블 도표: 3개의 측도, 그룹화됨
50,000
버블 도표: 3개의 측도, 애니메이션 범주로 그룹화됨
50,000
버블 도표: 3개의 측도, 그룹화되지 않음, 수평 또는 수직 계열(또는 둘 다)
50,000
버블 도표: 3개의 측도, 범주 없음
100,000
산점도
100,000
테이블(Explorer 내)
100,000
1의사결정트리 호출에 대한 타임아웃 기간도 있습니다. 자세한 내용은 vae.DecisionTreeTimeout을 참조하십시오.
2범주가 없을 때 최대 400개 측도까지 각 측도에 대해 상자가 하나씩 적용됩니다.

높은 카디날리티 임계에 대한 구성 속성

주의:
Middle Tier 임계를 늘리면 성능과 안정성에 영향을 줄 수 있습니다.
대부분의 환경에서는 기본 설정이 적합합니다. 임계를 과도하게 높게 설정하지 마십시오. 다음 속성의 조정과 관련하여 궁금한 사항이 있으면 SAS 기술 지원부에 문의하십시오.
주: 자세한 지침은 구성 속성을 설정하는 방법을 참조하십시오.
Middle Tier 임계에 영향을 주는 속성은 다음과 같습니다.
va.DistinctCountServerLimit
그래프에 대한 고유 개수 제한을 설정합니다. 기본적으로 그래프에 대한 고유 개수 제한은 없습니다. 기본값은 -1입니다.
범위: 전체 제품군
va.DistinctCountDataPanelLimit
데이터 패널에 표시되는 데이터에 대한 고유 개수 제한을 설정합니다. 이 속성은 데이터 패널에만 영향을 주며, 그래프 내의 고유 개수 제한에는 영향을 주지 않습니다. 기본값은 5,000입니다.
범위: 전체 제품군
va.CardinalityLimitForGroupByTempTable
지정한 제한(고유한 값의 수)을 초과하는 높은 카디날리티 순위 요청 모두에 대해 처리를 차단하고 오류를 반환합니다. 이 속성은 높은 카디날리티 순위로 인해 SAS LASR Analytic Server가 중단되는 특수한 상황에서만 설정해야 합니다. 예를 들어, 고유한 값이 2억 개를 초과하는 데이터에 대한 순위 요청을 차단하려면 이 속성을 2000000으로 설정하면 됩니다. 이 속성을 설정할 때, 값을 3000000으로 설정하는 것이 좋습니다.
범위: 전체 제품군
va.CardinalityLimitForGroupByCountDistinctTempTable
지정한 제한(고유한 값의 수)을 초과하는 고유 개수 카디날리티 순위 요청 모두에 대해 처리를 차단하고 오류를 반환합니다. 이 속성은 고유 개수 카디날리티 순위로 인해 SAS LASR Analytic Server가 중단되는 특수한 상황에서만 설정해야 합니다. 이 속성은 고유 개수 요청에만 영향을 주며 va.CardinalityLimitForGroupByTempTable 속성을 사용할 때보다 제한 범위를 좁힐 수 있습니다. 이 속성을 설정할 때, 값을 1000000으로 설정하는 것이 좋습니다.
범위: 전체 제품군
va.SortResultServerLimit
정렬과 함께 실행되는 상세 정보 질의에 대해 반환될 수 있는 최대 값 개수를 설정합니다. 이 속성은 상세 정보가 설정되어 있는 리스트 테이블의 결과에만 영향을 미칩니다.
범위: 전체 제품군, Explorer 제외
va.CategoryCardinalityServerLimit
범주 교차에 대한 최대 값 개수를 설정합니다. 고정(및 한정)된 수의 범주 교차만 지원됩니다. 예를 들어, "이름"과 "성"을 미국의 인구로 끌어다 놓으면 서버에서 2억 개의 다른 값을 생성할 수 있습니다. 이 속성은 카디날리티가 얼마나 높을 수 있는지를 결정하면서도 서버가 결과를 처리하고 클라이언트로 반환하도록 허용합니다. 범주 교차 값의 개수가 이 제한을 초과하면 질의가 실행되지 않습니다.
범위: 전체 제품군, Explorer 제외
va.SummaryServerRowLimit
추가 처리를 위해 Middle Tier로 반환될 수 있는 최대 값 개수를 설정합니다. 예를 들어, 이름을 기준으로 정렬된 높은 카디날리티 데이터에서는 계산된 값 개수가 아주 많을 수 있습니다.
범위: 전체 제품군, Explorer(vae.SummaryServerLimit 사용) 제외
va.MidtierCellLimit
교차 테이블의 최대 크기를 설정합니다.
범위: 전체 제품군, Explorer 제외
va.maxPeriodCalculations
기간 계산을 위해 구성된 계산된 칼럼의 최대 개수를 지정합니다. 특정 기간 측도에 대해 이 한계를 초과하면, 초과된 계산은 제외되고 기존 계산(해당 특정 기간 측도에 대한)이 결측값으로 바뀝니다. 사용자에게 계산 수를 줄이기 위한 필터를 적용하라는 창이 나타납니다. 기본값은 800입니다.
주: 소프트웨어 최적화는 이 한계가 적용되기 전에 계산 수를 줄이기 때문에 한계를 초과할 때가 드뭅니다. 이 속성이 적용된 예로 누적 기간을 가진 고유 개수 계산이 있습니다(표시되는 고유한 날짜 값 개수는 지정된 한계를 초과할 수 없음).
범위: Designer, Viewer, Transport Service
va.MaxSparkTables
최대 스파크 테이블 수를 설정합니다. 기본값은 300입니다.
범위: 전체 제품군, Explorer 제외
va.CheckCardinalityBeforeQuery
카디날리티 사전 확인을 수행하는지의 여부를 제어합니다. 기본값은 -1(이 제약 조건 사용 안 함)입니다. 기본적으로 사전 확인이 수행되지 않습니다.
범위: 전체 제품군, Explorer 제외
va.CheckCardinalityWithinQuery
SAS LASR Analytic Server가 카디날리티 제한을 적용하는지의 여부를 제어합니다. 기본적으로 이러한 확인은 수행되지 않습니다.
범위: 전체 제품군, Explorer 제외
vae.BoxPlotServerLimit
측도가 하나 이상이고 범주가 하나 이내인 상자 도표에 대한 Middle Tier 임계를 설정합니다.
범위: Explorer에만 해당
vae.DecisionTreeServerLimit
의사결정트리에 대한 Middle Tier 임계를 설정합니다.
범위: Explorer에만 해당
vae.FetchRowsServerLimit
테이블에 대한 Middle Tier 임계를 설정합니다.
범위: Explorer에만 해당
vae.FrequencyServerLimit
범주가 하나인 막대 그래프에 대한 Middle Tier 임계를 설정합니다. 이 제약 조건은 값의 선택 리스트가 표시되기 전에 적용됩니다.
범위: Explorer에만 해당
vae.modeling.ClassCardinalityLimit
모델에 포함된 고유 레벨의 최대 개수를 설정합니다. 이 속성은 모델에서 분류 효과 및 교호작용 항의 총 누적 개수를 제한합니다. 예를 들어, 이 속성을 800으로 설정하면 사용자는 800개가 넘는 고유 레벨이 포함된 효과 변수를 지정하거나 고유 레벨의 총 개수가 800개를 초과하도록 하는 효과 변수를 추가할 수 없습니다. 초깃값은 2048입니다.
범위: SAS Visual Statistics 애드온(라이선스가 있을 때)
vae.modeling.DecisionTreePredictorBinsCardinalityLimit
의사결정트리에서 측도 변수 구간의 최대 개수를 설정합니다. 초깃값은 1024입니다.
범위: SAS Visual Statistics 애드온(라이선스가 있을 때)
vae.modeling.DecisionTreePredictorCardinalityLimit
의사결정트리에서 범주 변수에 대한 고유 레벨의 최대 개수를 설정합니다. 초깃값은 1024입니다.
범위: SAS Visual Statistics 애드온(라이선스가 있을 때)
vae.modeling.DecisionTreeResponseCardinalityLimit
의사결정트리에서 반응 범주 변수에 대한 고유 레벨의 최대 개수를 설정합니다. 초기 구성에서는 이 속성이 설정되어 있지 않기 때문에 기본값(100)이 적용됩니다.
범위: SAS Visual Statistics 애드온(라이선스가 있을 때)
vae.modeling.GroupByCardinalityLimit
모델에 포함된 그룹화 기준 변수에 대한 고유 레벨의 최대 개수를 설정합니다. 이 속성은 모델에서 그룹화 기준 변수의 총 누적 개수를 제한합니다. 예를 들어, 이 속성의 값을 800으로 설정할 때 사용자는 800개가 넘는 고유 레벨이 포함된 그룹화 기준 변수를 지정하거나 고유 레벨의 총 개수가 800개를 초과하도록 하는 그룹화 기준 변수를 추가할 수 없습니다. 초깃값은 1024입니다.
범위: SAS Visual Statistics 애드온(라이선스가 있을 때)
vae.RealScatterServerLimit
측도가 3개이고 범주가 없는 산점도 및 버블 도표에 대한 Middle Tier 임계를 설정합니다.
범위: Explorer에만 해당
vae.ScatterPlotServerLimit
범주가 정확히 하나인 열지도에 대한 Middle Tier 임계를 설정합니다.
범위: Explorer에만 해당
vae.SummaryServerLimit
다음 시각화 유형에 대한 Middle Tier 임계를 설정합니다.
  • 교차 테이블
  • 측도가 하나 이상이고 범주가 하나(숫자, 날짜, 시간 또는 문자열)인 선 그래프
  • 계열 없이 그룹화되거나, 애니메이션과 함께 그룹화되거나, 계열을 포함하지만 그룹화되지 않은 버블 도표
범위: Explorer에만 해당(다른 응용 프로그램은 va.SummaryServerRowLimit 사용)
이전 페이지|다음 페이지|페이지 위
최종 업데이트: 2018년 10월 24일 (수)