內容
|
使用視覺效果
上一頁
|
下一頁
使用文字雲
關於文字雲
文字雲的資料角色
關於文字雲的資料角色
使用文字分析之文字雲的資料角色
使用類別值之文字雲的資料角色
指定文字雲的屬性
瀏覽文字分析結果
瀏覽選取的文件作為新的視覺效果
關於文字雲
文字雲會顯示字元資料項目中的一組文字。根據文字雲的類型和您的資料角色,雲端中各個文字的大小可以指出文字的重要性 (歸類詞語權數)、文字的出現次數,或是量值的值。
您可以建立兩種類型的文字雲:
使用文字分析的文字雲
使用文字分析的文字雲可將文件集合資料項目中的每個值分析成可以包含多個文字的文字文件。時常一起出現在文件集合中的文字會識別為主題。對於選取的主題,文字雲顯示包含最大歸類詞語權數值的詞語。歸類詞語權數表示詞語在主題中的重要性。
使用文字分析的文字雲也可以顯示主題中的文件是表達正面、負面或中性情緒。
文字分析文字雲的詳細資料表格包含其他關於文字雲中詞語、主題和文件的資訊。
若需要更多資訊,請參閱
瀏覽文字分析結果
。
若要啟用文字分析,您必須設定唯一列識別碼,並將一或多個類別定義為文件集合。
請參閱
定義文字分析的資料項目
。
附註:
文字分析僅套用在英文或德文文字。
附註:
使用文字分析的文字雲在顯示時可能需要較長的時間,這視您資料來源中的列數和文件集合中值的長度而定。
附註:
SAS Visual Analytics 中的文字分析使用的演算法不同於 SAS Text Miner。其結果可能會與 SAS Text Miner 產生的結果不同。
使用類別值的文字雲
使用類別值的文字雲會將類別資料項目中的每個值分析成單一文字字串。文字雲可顯示次數最高的字串值,或是量值的值最高的字串值。各個文字的顏色可以表示量值的值。
文字雲的資料角色
關於文字雲的資料角色
文字雲的資料角色取決您選取的文字雲類型。
[
顯示文字雲
] 選項可以選取文字雲是使用文字分析還是使用類別值產生。
使用文字分析之文字雲的資料角色
使用文字分析的文字雲使用
文件集合
作為基本角色。文件集合是一個包含您分析文字的類別資料項目。
附註:
若要啟用文字分析,您必須設定唯一列識別碼,並將一或多個類別定義為文件集合。
請參閱
定義文字分析的資料項目
。
除了基本角色以外,可以指定下列角色:
文件詳細資料
指定的資料項目已作為欄顯示在詳細資料表格中的 [
文件
] 標籤上。
使用類別值之文字雲的資料角色
使用類別值的文字雲使用
文字
作為基本角色。請指定值文字雲中使用的類別。
除了基本角色以外,您還可以指定下列角色:
大小
指定一個量值決定各文字的大小。如果您沒有指定量值,則使用文字大小表示每個文字的出現次數。
顏色
指定一個量值決定各文字的顏色。
指定文字雲的屬性
在 [
屬性
] 標籤上可以指定下列選項:
名稱
指定視覺效果的名稱。
標題
指定出現在圖形上方的標題。
附註:
如果您選取 [
產生圖形標題
],則停用
標題
。
產生圖形標題
指定根據視覺效果中的資料項目自動產生的圖形標題。
次數
(僅限類別值)
指定要將次數顯示為計數 (
計數
) 或百分比 (
百分比
)。
附註:
次數值是根據視覺效果中顯示的資料 (套用篩選和其他資料選取項目之後)。
附註:
如果已為
大小
角色指定量值,則此選項沒有作用。
文字顯示限制
指定顯示在文字雲中的最大字數。
字型縮放比例
指定雲端中最大和最小文字之間的字型大小差異量。數字值會指定最大字型大小和最小字型大小的比率。
對於使用類別值的文字雲,您還可以指定下列選項:
顏色漸層
選取視覺效果的漸層顏色。
按一下
可以選取指派顏色使用的值。
請參閱
指定自訂資料範圍
。
對於使用文字分析的文字雲,可以指定下列其他基本選項:
分析文件情緒
能夠進行文字雲的情緒分析。
情緒分析確定文件的內容是否有正面情緒、負面情緒或中性情緒。
啟用情緒分析之後,主題中的正面、中性和負面文件數目顯示在文字雲的頂端。此外,情緒值顯示在詳細資料表格的 [
主題
] 和 [
文件
] 標籤。
識别詞語角色
依詞性識别詞語。此外,此選項可將名詞群組視為單一詞語和識別文字實體,例如:名稱、地址、電話號碼等等。
附註:
這個選項等同於下列進階選項:
包含詞性
、
擷取名詞群組
和
使用實體擷取
。
最大主題數目
指定要建立的最大主題數。請指定 4 到 20 之間的數字。
對於使用文字分析的文字雲,您可以指定下列其他進階選項:
分析文件情緒
能夠進行文字雲的情緒分析。
情緒分析確定文件的內容是否有正面情緒、負面情緒或中性情緒。
啟用情緒分析之後,主題中的正面、中性和負面文件數目顯示在文字雲的頂端。此外,情緒值顯示在詳細資料表格的 [
主題
] 和 [
文件
] 標籤。
最大主題數目
指定要建立的最大主題數。請指定 4 到 20 之間的數字。
解析度
指定識別主題使用的解析度。
低
解析度會識別出較少主題。
高
解析度會識別出較多主題。
儲存格權數
指定是否要對於每份出現某詞語的文件,為此詞語的出現次數加權。選取 [
對數
],會對在相對較少的文件中出現多次的詞語降低權數。
詞語權數
指定文件集合中的詞語加權演算法。
熵
加權演算法會對在文件集合中較少出現的詞語增加權數。
文件臨界值
指定必須出現某個詞語的最小文件數目。請指定 1 到 20 之間的數字。若出現某詞語的文件數目未達最小值,則不會將此詞語包含在文字雲中。
主題標籤長度
指定包含在主題名稱中的詞語數目。請指定 2 到 8 之間的數字。此屬性不會影響到選取主題使用的詞語數目;只有主題名稱會變更。
包含詞性
指定依詞性 (例如:名詞、動詞或形容詞) 將詞語分類。各詞語的詞性顯示在詞語的資料提示中。
擷取名詞群組
指定是否要將名詞群組識別為詞語。
使用實體擷取
指定是否要識別文字實體,例如:名稱、地址、電話號碼等。如果已停用此選項,則文字實體的處理方式將會與其他文字相同。
詞幹文字
指定是否指定文字的所有形式識別為單一詞語。例如:如果您選取 [
詞幹文字
],則 sell、sells、selling 和 sold 等文字都會識別為單一詞語 sell。
使用停止清單 (如果可以使用)
指定在識別詞語時是否要使用停止清單排除常見文字,例如:the、with 和 is 等等。如果沒有可用的停止清單,文字雲底部會出現訊息。
停止清單
指定已啟用 [
使用停止清單
] 選項時使用的停止清單。
瀏覽文字分析結果
對於使用文字分析的文字雲視覺效果,在詳細資料表格中可以取得大量的其他資訊。若要顯示詳細資料表格,請從視覺效果工具列按一下
下拉式清單,然後選取 [
顯示詳細資料
]。
文字分析文字雲的詳細資料表格包含下列標籤:
結果
顯示目前主題中的所有詞語。對於每個詞語而言,
歸類詞語權數
值表示詞語在目前主題中的重要性。
如果已啟用 [
識别詞語角色
] 屬性或 [
包含詞性
] 屬性,則
角色
值識別每個詞語的文法角色。
附註:
按一下欄標題可以排序任何欄。
主題
顯示文件集合中的所有主題。如果已啟用情緒分析,則顯示各主題的正面、中性、負面文件數目。
附註:
按一下欄標題可以排序任何欄。
文件
顯示每份包含選取詞語的文件。對於每份文件,
相關性
值表示文件與目前主題有何相關。
若要檢視文件的完整文字,請在文件上按一下滑鼠右鍵,然後選取 [
檢視完整文件
]。
如果已啟用情緒分析,則
情緒
值識別文件有多正面或負面。篩選文件可以排除包含正面、負面或中性情緒的文件。
附註:
按一下欄標題可以排序任何數值欄。
分析
提供文字分析的重要概念定義。
瀏覽選取的文件作為新的視覺效果
您可以瀏覽一組選取的文件作為新的表格視覺效果。若要從選取的文件建立新的視覺效果,請遵循下列步驟:
選取想要瀏覽的主題和詞語。
在詳細資料表格的 [
文件
] 標籤上選取要在新的視覺效果中瀏覽的文件。若要選取所有文件,請在任何文件上按一下滑鼠右鍵,然後選取 [
全部選取
]。
在任何文件上按一下滑鼠右鍵,然後選取 [
從選取的文件建立視覺效果
]。
新的表格視覺效果隨即使用您選取的文件值顯示。
上一頁
|
下一頁
|
頁面頂端
Copyright © SAS Institute Inc. All rights reserved.