이전 페이지|다음 페이지

단어 클라우드 작업

단어 클라우드 정보

단어 클라우드에는 문자 데이터 항목에 포함된 일련의 단어가 표시됩니다. 단어 클라우드 유형과 데이터 역할에 따라 클라우드에 있는 각 단어의 크기가 단어 중요도(토픽 용어 가중), 단어 빈도 또는 측도 값을 나타낼 수 있습니다.
다음 두 가지 유형의 단어 클라우드를 생성할 수 있습니다.
텍스트 분석을 사용하는 단어 클라우드
텍스트 분석을 사용하는 단어 클라우드에서는 문서 컬렉션 데이터 항목의 각 값을 여러 단어가 포함될 수 있는 텍스트 문서로 분석합니다. 문서 컬렉션에 자주 함께 나타나는 단어가 토픽으로 식별됩니다. 선택한 토픽의 경우, 단어 클라우드에 토픽 용어 가중치 값이 가장 큰 용어가 표시됩니다. 토픽 용어 가중치는 토픽 내의 용어 중요도를 나타냅니다.
텍스트 분석을 사용하는 단어 클라우드에서는 토픽에 있는 문서에서 드러난 성향이 긍정적인지, 부정적인지 아니면 중립적인지 여부도 표시할 수 있습니다.
텍스트 분석 단어 클라우드에 대한 상세 정보 테이블에는 용어, 토픽 및 문서에 대한 추가 정보가 포함됩니다. 자세한 내용은 텍스트 분석 결과 탐색을 참조하십시오.
텍스트 분석을 활성화하려면 고유 행 ID를 설정하고 하나 이상의 범주를 문서 컬렉션으로 정의해야 합니다. 텍스트 분석에 대한 데이터 항목 정의를 참조하십시오.
주: 텍스트 분석은 영어 또는 독일어 텍스트에만 적용할 수 있습니다.
주: 데이터 소스의 행 수와 문서 컬렉션의 값 길이에 따라 텍스트 분석을 사용하는 단어 클라우드를 표시하는 데 상당한 시간이 필요할 수 있습니다.
주: SAS Visual Analytics의 텍스트 분석에서는 SAS Text Miner와 다른 알고리즘을 사용합니다. 따라서 결과가 SAS Text Miner에서 생성되는 것과 다를 수 있습니다.
범주 값을 사용하는 단어 클라우드
범주 값을 사용하는 단어 클라우드에서는 범주 데이터 항목의 각 값을 단일 텍스트 문자열로 분석합니다. 단어 클라우드에는 가장 빈도가 높은 문자열 값이나 가장 측도 값이 큰 문자열 값이 표시될 수 있습니다. 각 단어의 색상이 측도 값을 나타낼 수 있습니다.

단어 클라우드에 대한 데이터 역할

단어 클라우드에 대한 데이터 역할 정보

단어 클라우드에 대한 데이터 역할은 선택하는 단어 클라우드 유형에 종속됩니다.
단어 클라우드 표시 옵션은 단어 클라우드가 텍스트 분석을 사용하여 생성되는지 아니면 범주 값을 사용하여 생성되는지 여부를 선택합니다.

텍스트 분석을 사용하는 단어 클라우드에 대한 데이터 역할

텍스트 분석을 사용하는 단어 클라우드의 경우, 기본 역할은 문서 컬렉션입니다. 문서 컬렉션은 분석할 단어가 포함된 범주 데이터 항목입니다.
주: 텍스트 분석을 활성화하려면 고유 행 ID를 설정하고 하나 이상의 범주를 문서 컬렉션으로 정의해야 합니다. 텍스트 분석에 대한 데이터 항목 정의를 참조하십시오.
기본 역할 외에도 다음과 같은 역할을 지정할 수 있습니다.
문서 상세 정보
상세 정보 테이블의 문서 탭에 칼럼으로 표시되는 데이터 항목을 지정합니다.

범주 값을 사용하는 단어 클라우드에 대한 데이터 역할

범주 값을 사용하는 단어 클라우드의 경우, 기본 역할은 단어입니다. 단어 클라우드에서 사용되는 값의 범주를 지정합니다.
기본 역할 외에도 다음과 같은 역할을 지정할 수 있습니다.
크기
각 단어의 크기를 결정하는 측도를 지정합니다. 측도를 지정하지 않는 경우, 단어 크기는 각 단어의 빈도를 나타냅니다.
색상
각 단어의 색상을 결정하는 측도를 지정합니다.

단어 클라우드에 대한 속성 지정

속성 탭에서 다음과 같은 옵션을 지정할 수 있습니다.
이름
시각화의 이름을 지정합니다.
제목
그래프 위에 나타나는 제목을 지정합니다.
주: 그래프 제목 생성을 선택하면 제목 옵션이 비활성화됩니다.
그래프 제목 생성
시각화에 있는 데이터 항목을 기준으로 그래프 제목이 자동으로 생성되도록 지정합니다.
빈도(범주 값에만 해당)
빈도가 개수로 표시되는지(개수) 아니면 백분율로 표시되는지(백분율) 지정합니다.
주: 빈도 값은 필터 및 기타 데이터 선택 사항이 적용된 후 시각화에 표시되는 데이터를 기반으로 합니다.
주: 측도가 크기 역할에 할당된 경우에는 이 옵션을 선택해도 효과가 없습니다.
단어 표시 제한
단어 클라우드에 표시되는 최대 단어 수를 지정합니다.
글꼴 배율
클라우드에서 가장 큰 단어와 가장 작은 단어 사이의 글꼴 크기 차이를 지정합니다. 숫자 값은 가장 큰 글꼴 크기 대 가장 작은 글꼴 크기의 비율(포인트)을 지정합니다.
범주 값을 사용하는 단어 클라우드의 경우, 다음과 같은 옵션을 추가로 지정할 수 있습니다.
색상 그라데이션
시각화에 대한 그라데이션 색상을 선택합니다.
색상 그라데이션 편집 버튼을 클릭하여 색상을 할당하는 데 사용되는 값을 선택할 수 있습니다. 사용자 정의 데이터 범위 지정을 참조하십시오.
텍스트 분석을 사용하는 단어 클라우드의 경우, 다음과 같은 기본 옵션을 추가로 지정할 수 있습니다.
문서 성향 분석
단어 클라우드에 대한 성향 분석을 사용합니다.
성향 분석은 문서의 내용에 드러나는 성향이 긍정적인지, 부정적인지 아니면 중립적인지 여부를 판단합니다.
성향 분석이 사용되는 경우, 토픽 내의 긍정적, 중립적 및 부정적 문서 수가 단어 클라우드 위쪽에 표시됩니다. 또한 성향 값이 상세 정보 테이블의 토픽문서 탭에 표시됩니다.
용어 역할 식별
품사로 용어를 식별합니다. 또한 이 옵션은 명사 그룹을 단일 용어로 식별하고 이름, 주소, 전화 번호 등의 텍스트 엔터티를 식별합니다.
주: 이 옵션은 고급 옵션인 품사 포함, 명사 그룹 추출엔터티 추출 사용과 같습니다.
최대 토픽
생성할 최대 토픽 수를 지정합니다. 4에서 20 사이의 숫자를 지정합니다.
텍스트 분석을 사용하는 단어 클라우드의 경우, 다음과 같은 고급 옵션을 추가로 지정할 수 있습니다.
문서 성향 분석
단어 클라우드에 대한 성향 분석을 사용합니다.
성향 분석은 문서의 내용에 드러나는 성향이 긍정적인지, 부정적인지 아니면 중립적인지 여부를 판단합니다.
성향 분석이 사용되는 경우, 토픽 내의 긍정적, 중립적 및 부정적 문서 수가 단어 클라우드 위쪽에 표시됩니다. 또한 성향 값이 상세 정보 테이블의 토픽문서 탭에 표시됩니다.
최대 토픽
생성할 최대 토픽 수를 지정합니다. 4에서 20 사이의 숫자를 지정합니다.
해상도
토픽을 식별하는 데 사용되는 해상도를 지정합니다. 낮음 해상도를 선택하면 더 적은 토픽이 식별됩니다. 높음 해상도를 선택하면 더 많은 토픽이 식별됩니다.
셀 가중
해당 용어가 나타나는 모든 문서에 대해 각 용어의 빈도에 가중치를 적용할지 여부를 지정합니다. 로그를 선택하면 비교적 적은 문서에 여러 번 나타나는 용어는 중요시하지 않습니다.
용어 가중
문서 컬렉션에 있는 용어에 대한 가중 알고리즘을 지정합니다. 엔트로피 가중 알고리즘을 선택하면 문서 컬렉션에서 빈도가 낮은 용어가 강조 표시됩니다.
문서 임계
용어가 나타나야 하는 최소 문서 수를 지정합니다. 1에서 20 사이의 숫자를 지정합니다. 용어가 최소 수로 지정된 수만큼의 문서에 나타나지 않으면 단어 클라우드에 포함되지 않습니다.
토픽 레이블 길이
토픽 이름에 포함되는 용어 수를 지정합니다. 2에서 8 사이의 숫자를 지정합니다. 이 속성은 토픽을 선택하는 데 사용되는 용어 수에 영향을 주지 않습니다. 토픽 이름만 변경됩니다.
품사 포함
용어가 품사(예: 명사, 동사 또는 형용사)로 분류되도록 지정합니다. 각 용어의 품사가 용어에 대한 데이터 팁에 표시됩니다.
명사 그룹 추출
명사 그룹을 용어로 식별할지 여부를 지정합니다.
엔티티 추출 사용
이름, 주소, 전화 번호 등의 텍스트 엔터티를 식별할지 여부를 지정합니다. 이 옵션이 비활성화되면 텍스트 엔터티는 다른 텍스트와 다르게 처리되지 않습니다.
어간
해당되는 단어의 모든 형태가 단일 용어로 식별되는지 여부를 지정합니다. 예를 들어, 어간을 선택하면 "sell", "sells", "selling" 및 "sold"가 단일 용어인 "sell"로 식별됩니다.
STOP 리스트 사용(사용 가능한 경우)
용어를 식별할 때 STOP 리스트를 사용하여 "the", "with" 및 "is" 등과 같이 흔히 사용되는 단어를 제외할지 여부를 지정합니다. 사용 가능한 STOP 리스트가 없으면 단어 클라우드 아래쪽에 메시지가 나타납니다.
STOP 리스트
STOP 리스트 사용 옵션을 사용하는 경우, 사용되는 STOP 리스트를 지정합니다.

텍스트 분석 결과 탐색

텍스트 분석을 사용하는 단어 클라우드 시각화의 경우, 상세 정보 테이블에서 다량의 추가 정보를 사용할 수 있습니다. 상세 정보 테이블을 표시하려면 시각화 도구 모음에서 옵션 드롭다운 리스트를 클릭한 다음, 상세 정보 표시를 선택합니다.
텍스트 분석 단어 클라우드에 대한 상세 정보 테이블에는 다음과 같은 탭이 있습니다.
결과
현재 토픽의 모든 용어를 표시합니다. 각 용어에 대한 토픽 용어 가중 값은 현재 토픽 내의 용어 중요도를 나타냅니다.
용어 역할 식별 속성이나 품사 포함 속성을 사용하면 역할 값은 각 용어의 문법적 역할을 식별합니다.
주: 칼럼 머리글을 클릭하여 칼럼을 정렬할 수 있습니다.
토픽
문서 컬렉션의 모든 토픽을 표시합니다. 성향 분석이 사용되는 경우, 각 토픽에 대한 긍정적, 중립적 및 부정적 문서 수가 표시됩니다.
주: 칼럼 머리글을 클릭하여 칼럼을 정렬할 수 있습니다.
문서
선택한 용어가 포함된 문서를 각각 표시합니다. 각 문서에 대한 연관성 값은 문서가 현재 토픽과 연관된 정도를 나타냅니다.
문서의 전체 텍스트를 보려면 문서를 마우스 오른쪽 버튼으로 클릭한 다음, 전체 문서 보기를 선택합니다.
성향 분석이 사용되는 경우, 성향 값은 문서의 긍정적이거나 부정적인 정도를 나타냅니다. 문서를 필터링하여 긍정적, 부정적 또는 중립적 성향의 문서를 제외할 수 있습니다.
주: 칼럼 머리글을 클릭하여 숫자 칼럼을 정렬할 수 있습니다.
분석
텍스트 분석에 대한 핵심 개념의 정의를 제공합니다.

새로운 시각화로 나타나는 선택한 문서 탐색

새로운 테이블 시각화로 나타나는 선택한 문서 집합을 탐색할 수 있습니다. 선택한 문서에서 새로운 시각화를 생성하려면 다음 단계를 따릅니다.
  1. 탐색할 토픽과 용어를 선택합니다.
  2. 상세 정보 테이블의 문서 탭에서 새로운 시각화에서 탐색할 문서를 선택합니다. 모든 문서를 선택하려면 문서 중 하나를 마우스 오른쪽 버튼으로 클릭한 다음, 모두 선택을 선택합니다.
  3. 문서 중 하나를 마우스 오른쪽 버튼으로 클릭한 다음, 선택한 문서에서 시각화 생성을 선택합니다.
선택한 문서 값과 함께 새로운 테이블 시각화가 나타납니다.
이전 페이지|다음 페이지|페이지 위