前のページ|次のページ

ワードクラウドの操作

ワードクラウドについて

ワードクラウドは、文字データアイテムに含まれている単語の集合を表示します。ワードクラウドの種類と指定のデータ役割に応じて、クラウド内の各データのサイズは、単語の重要性(トピック用語の重み)、単語の度数、またはメジャーの値を表します。
次の2種類のワードクラウドを作成できます。
テキスト分析を使用するワードクラウド
テキスト分析を使用するワードクラウドは、ドキュメントコレクションデータアイテム内の各値を、複数の単語を含むテキストドキュメントとして分析します。ドキュメントコレクション内で頻繁に共に現れる複数の単語は、トピックとして識別されます。選択したトピックについて、ワードクラウドは最大のトピック用語の重み値を持つ用語を表示します。トピック用語の重みは、トピック内での用語の重要性を示します。
テキスト分析を使用するワードクラウドは、トピック内のドキュメントが正、負、中性のセンチメントを表すかどうかも表示できます。
テキスト分析ワードクラウドの詳細テーブルには、用語、トピック、ドキュメントに関する追加情報が含まれます。詳細については、テキスト分析結果の探索を参照してください。
テキスト分析を有効化するには、一意の行IDを設定し、1つ以上のカテゴリをドキュメントコレクションとして定義する必要があります。 テキスト分析用のデータアイテムの定義を参照してください。
注: テキスト分析は、英語のテキストまたはドイツ語のテキストにのみ適用できます。
注: データソース内の行数やドキュメントコレクション内の値の長さによっては、テキスト分析を使用するワードクラウドが表示されるまでに、かなりの時間がかかることがあります。
注: SAS Visual Analyticsにおけるテキスト分析では、SAS Text Minerとは異なるアルゴリズムを使用します。このため、SAS Visual Analyticsでのテキスト分析の結果が、SAS Text Minerプロシジャの結果とは異なる場合があります。
カテゴリ値を使用するワードクラウド
カテゴリ値を使用するワードクラウドは、カテゴリデータアイテム内の各値を、単一のテキスト文字列として分析します。ワードクラウドでは、最も高い度数を持つ文字列値か、またはメジャーの最大値を持つ文字列値のどちらかを表示できます。各単語の色は、メジャーの値を表します。
注: ワードクラウドを自動グラフとして表示する場合、役割タブで変更を行うと、ビジュアルがリセットする場合があります。ワードクラウドとして表示することを推奨します。

ワードクラウドのデータ役割

ワードクラウドのデータ役割について

ワードクラウドのデータ役割は、ユーザーが選択したワードクラウドの種類によって異なります。
ワードクラウドの表示オプションは、ワードクラウドを生成する方法としてテキスト分析を使用するかそれともカテゴリ値を使用するかを選択します。

テキスト分析を使用するワードクラウドのデータ役割

テキスト分析を使用するワードクラウドの場合、基本的な役割はドキュメントコレクションになります。ドキュメントコレクションとは、分析対象となる単語を含んでいるカテゴリデータアイテムです。
注: テキスト分析を有効化するには、一意の行IDを設定し、1つ以上のカテゴリをドキュメントコレクションとして定義する必要があります。 テキスト分析用のデータアイテムの定義を参照してください。
基本的な役割以外に、次の役割を指定できます。
ドキュメントの詳細
詳細テーブルのドキュメントタブ内の列として表示されるデータアイテムを指定します。

カテゴリ値を使用するワードクラウドのデータ役割

カテゴリ値を使用するワードクラウドの場合、基本的な役割は単語になります。ワードクラウド内で使用される値を含むカテゴリを指定します。
基本的な役割以外に、次の役割を指定できます。
サイズ
各単語のサイズを決めるメジャーを指定します。メジャーの指定を省略した場合、単語のサイズは各単語の度数を表します。
各単語の色を決めるメジャーを指定します。

ワードクラウドのプロパティの指定

プロパティタブでは、次のオプションを指定できます。
名前
ビジュアルの名前を指定します。
タイトル
グラフの上に表示されるタイトルを指定します。
注: タイトルオプションは、グラフタイトルの作成を選択した場合は無効になります。
グラフタイトルの作成
グラフタイトルがビジュアル内のデータアイテムに基づいて自動的に生成されるように指定します。
度数(カテゴリ値の場合のみ)
度数をカウント(カウント)として表示するかパーセント(パーセント)として表示するかを指定します。
注: 度数値は、ビジュアルに表示されている(フィルタおよび他のデータ選択が適用された後の)データに基づきます。
注: メジャーがサイズ役割に割り当てられている場合、このオプションは無効になります。
単語の表示制限
ワードクラウドに表示される単語の最大数を指定します。
フォントスケール
クラウド内にある最大単語と最小単語間のフォントサイズがどれだけ異なるかを指定します。この数値には、最大フォントサイズ(ポイント単位)の最小フォントサイズに対する割合を指定します。
カテゴリ値を使用するワードクラウドの場合、次のような追加オプションを指定できます。
色のグラデーション
ビジュアルのグラデーション色を選択します。
色のグラデーションの編集ボタンをクリックして、色の割り当てに使用する値を選択できます。 カスタムデータ範囲の指定を参照してください。
テキスト分析を使用するワードクラウドの場合、次のような追加的な基本オプションを指定できます。
ドキュメントセンチメントの分析
ワードクラウドのセンチメント分析を有効にします。
センチメント分析は、ドキュメントのコンテンツに基づき、ドキュメントが正のセンチメント、負のセンチメント、中性のセンチメントを持つかどうかを判断します。
センチメント分析を有効にすると、トピック内で正、負、中性のドキュメントの数がワードクラウドの上部に表示されます。さらに、センチメント値が詳細テーブルのトピックタブとドキュメントタブに表示されます。
用語役割の指定
品詞別に用語を識別します。さらに、このオプションは名詞グループを単一の用語として識別し、名前、住所、電話番号などのテキストエンティティを識別します。
注: このオプションは、詳細オプションの品詞を含める名詞グループの抽出エンティティ抽出の使用と同等です。
最大トピック数
作成するトピックの最大数を指定します。4 - 20の範囲の数値を指定します。
テキスト分析を使用するワードクラウドの場合、次のような追加的な詳細オプションを指定できます。
ドキュメントセンチメントの分析
ワードクラウドのセンチメント分析を有効にします。
センチメント分析は、ドキュメントのコンテンツに基づき、ドキュメントが正のセンチメント、負のセンチメント、中性のセンチメントを持つかどうかを判断します。
センチメント分析を有効にすると、トピック内で正、負、中性のドキュメントの数がワードクラウドの上部に表示されます。さらに、センチメント値が詳細テーブルのトピックタブとドキュメントタブに表示されます。
最大トピック数
作成するトピックの最大数を指定します。4 - 20の範囲の数値を指定します。
精度
トピックの識別に使用される精度を指定します。精度が低い場合、識別できるトピックの数は少なくなります。精度が高い場合、より多くの数のトピックを識別できます。
セルの重み
ある用語が出現するすべてのドキュメントで、その用語を重み付けするかどうかを指定します。対数を選択すると、比較的少数のドキュメントに多く現れる用語が重視されなくなります。
用語の重み
ドキュメントコレクション内の用語に適用される重み付けアルゴリズムを指定します。エントロピー重み付けアルゴリズムは、ドキュメントコレクション全体で低い度数を持つ用語を重視します。
ドキュメントしきい値
用語が現れるドキュメントの最小数を指定します。1 - 20の範囲の数値を指定します。最小数のドキュメント内に用語が現れない場合、その用語はワードクラウドには含められません。
トピックラベル長
トピック名に含まれている用語の数を指定します。2 - 8の範囲の数値を指定します。このプロパティは、トピックの選択に使用される用語の数には影響しません。トピック名のみが変更されます。
品詞を含める
用語が品詞別(名詞、動詞、形容詞など)に分類されることを指定します。各用語の品詞は、用語のデータチップに表示されます。
名詞グループの抽出
名詞のグループを用語として識別するかどうかを指定します。
エンティティ抽出の使用
名前、住所、電話番号などのテキストエンティティを識別するかどうかを指定します。このオプションを無効にすると、テキストエンティティは他のテキストと同様に扱われます。
単語の語幹処理
与えられた単語が取りえるあらゆる形式を単一の用語として識別します。たとえば、単語の語幹処理を選択すると、"sell"、"sells"、"selling"、"sold"などの単語はすべて、単一の用語である"sell"として識別されます。
停止リストの使用 (使用可能な場合)
用語を識別する際に、停止リストを使用して、“the”、“with”、“is”などのよく使われる単語を除外するかどうかを指定します。利用できる停止リストが存在しない場合、ワードクラウドの最下部にメッセージが表示されます。
停止リスト
使用される停止リストを指定します(停止リストの使用オプションが有効な場合)。

テキスト分析結果の探索

テキスト分析を使用するワードクラウドビジュアルの場合、多数の追加情報が詳細テーブルに表示されます。詳細テーブルを表示するには、ビジュアルツールバーからオプションドロップダウンリストをクリックした後、詳細を表示するを選択します。
テキスト分析ワードクラウドの詳細テーブルには、次のタブが含まれます。
結果
現在のトピックの用語をすべて表示します。用語ごとに、トピック用語の重みは、現在のトピックでの用語の重要性を示します。
用語役割の指定プロパティまたは品詞を含めるプロパティが有効な場合、役割値は各用語の文法的な役割を指定します。
注: 列ヘッダーをクリックして、列を並べ替えることができます。
トピック
ドキュメントコレクションのすべてのトピックを表示します。センチメント分析が有効な場合、各トピックの正、負、中性のドキュメントの数が表示されます。
注: 列ヘッダーをクリックして、列を並べ替えることができます。
ドキュメント
選択した用語を含む各ドキュメントを表示します。ドキュメントごとに、関連性の値は、そのドキュメントが現在のトピックにどのように関連しているかを示します。
ドキュメントの全テキストを表示するには、ドキュメントを右クリックして、ドキュメントの完全表示を選択します。
センチメント分析が有効な場合、センチメントの値は、ドキュメントがどのように正または負であるかを示します。ドキュメントをフィルタリングして、センチメントが正、負または中性であるドキュメントを除外できます。
注: 列ヘッダーをクリックして、数値列を並べ替えることができます。
分析
テキスト分析の重要な概念の定義を提供します。

新規ビジュアルとしての選択したドキュメントの探索

新規のテーブルビジュアルとして選択した一連のドキュメントを探索できます。選択したドキュメントからビジュアルを新規作成するには、次の手順に従います。
  1. 探索するトピックと用語を選択します。
  2. 詳細テーブルのドキュメントタブで、新しいビジュアルで探索するドキュメントを選択します。すべてのドキュメントを選択するには、任意のドキュメントを右クリックして、すべて選択を選択します。
  3. 任意のドキュメントを右クリックして、選択済みドキュメントからビジュアルを作成を選択します。
新しいテーブルビジュアルが選択したドキュメント値で表示されます。
前のページ|次のページ|ページの先頭へ
最終更新: 2019/12/12