上一頁|下一頁

SAS Text Miner

SAS Text Miner 14.2

SAS Text Miner 14.2 執行於 SAS 9.4M4 和後續版本。SAS Text Miner 14.2 可在執行節點及檢視結果時提供更高的效能。此外,高效能 HPTMINE 程序現在可讓您以另一種語言剖析文字資料:瑞典文。
如需 SAS Text Miner 14.2 新功能和增強功能的詳細資訊,請參閱 SAS Text Miner 的軟體產品頁面。

SAS Text Miner 14.1

SAS Text Miner 14.1 執行於 SAS 9.4M3 和後續版本。
以下是 SAS Text Miner 14.1 的部分新功能和增強功能:
  • 新的 HPBOOLRULE 程序取代了 [文字規則產生器] 節點中的巨集。
  • HPTMINE 程序的增強功能可讓您選取或忽略詞類、特性和實體,以及建置搜尋索引。
  • [HP Text Miner] 節點現在使用 PROC HPTMINE 來執行主題輪換及建立主題表格。
  • [HP Text Miner] 節點中的 [語言] 屬性中加入了 11 種剖析語言。剖析語言的完整清單包含中文、荷蘭文、英文、芬蘭文、法文、德文、義大利文、日文、韓文、葡萄牙文、俄文、西班牙文和土耳其文。
  • 新的巨集變數 EM_TERM_LOC 可讓使用者指定 SAS Text Miner 節點要將輸出資料集寫入到的位置。這些資料集必須做為 SAS Text Miner 評分程式碼的輸入。
  • 從 [文字主題] 節點和 [文字篩選] 節點匯出的交易輸出,已加入具有詞語 | 角色資訊的 _item_ 變數。在處理流程圖中使用 [資料分割區] 節點時 (例如,[輸入資料] 節點 (如 NEWS) > [資料分割區] 節點 > [文字剖析] 節點 > [文字篩選] 節點),此變數會加入至交易表格 valid_trans 和 test_trans 中。
    在交易表格中匯出詞語 | 角色資訊的好處之一是,[關聯] 節點在本身用於處理流程圖中 (例如,[輸入資料] 節點 (如 ABSTRACT) > [文字剖析] 節點 > [文字篩選] 節點 > [關聯 節點) 時,將會在它所產生的規則中顯示這項資訊。
以下是 SAS Text Miner 高效能程序的部分新功能和增強功能:
  • 新的 HPBOOLRULE 程序可讓您從大型交易資料中擷取布林規則。PROC HPBOOLRULE 對監督規則型模型的高效能文字採礦加入了重要功能。在目前的版本中,HPBOOLRULE 程序只能用來在單機模式中讀取資料和擷取規則。HPBOOLRULE 程序可分析已由 HPTMINE 程序處理、並以交易格式呈現的文字主體,而自動產生一組布林規則。
  • HPTMINE 程序支援下列新的語言、陳述式和選項:
    • 您可以剖析下列新支援語言的文字資料:中文、荷蘭文、芬蘭文、法文、義大利文、日文、韓文、葡萄牙文、俄文、西班牙文和土耳其文。
    • 您可以使用 HPTMINE 程序產生文字主體的搜尋索引。使用 TMUTIL 程序中的索引,可查詢文字主體。
    • 您可以使用新的 SELECT 陳述式,指定您要在分析中納入或排除的詞類、實體或特性。
    • 您可以在使用僅限 SVD 模式執行 HPTMINE 程序時指定詞語表。進行主題探索時需要詞語表。

SAS Text Miner 13.2

SAS Text Miner 13.2 執行於 SAS 9.4M2。
以下是 SAS Text Miner 高效能程序的部分新功能和增強功能:
  • HPTMINE 程序支援下列新功能:
    • 您可以剖析德文的文字資料,而且可以指定在文件的輸入資料集中使用哪一種語言。
    • 您可以剖析包含超過 32K 字元的文件。
    • 您可以在僅限 SVD 模式中執行,以便剖析文件,而且當您想要在文件剖析後嘗試以不同的參數進行 SVD 計算時,可以在兩個程序呼叫中分開計算奇異值分解 (SVD)。
    • 您可以探索文字主體中的現有主題。
    • 您可以用 Base64 編碼疏鬆列 (BESR) 格式儲存詞語 - 文件矩陣。
    • 您可以使用預設座標清單 (COO 或交易式) 格式或 Base64 編碼疏鬆列 (BESR) 格式來儲存詞語 - 文件矩陣。
    • 您可以指定自訂實體和名詞群組擷取的自訂 LITI 檔案。
    • 您可以指定是否將具有 _keep=N 的詞語納入 OUTTERMS= 資料集和 OUTCHILD= 資料集中。
  • HPTMSCORE 程序支援下列新功能:
    • 您可以剖析德文的文字資料。
    • 您可以剖析包含超過 32K 字元的文件。
    • 支援自訂實體和名詞群組擷取的自訂 LITI 檔案。

SAS Text Miner 13.1

SAS Text Miner 13.1 是主要版本,執行於 SAS 9.4M1 和後續版本。這些版本包含新的 [文字設定檔] 節點、節點效能和結果的增強功能,以及高效能 HPTMINE 程序的增強功能。
  • 新的 [文字設定檔] 節點可讓您使用在文件中找到的詞語,來設定目標變數的設定檔內容。
  • [文字剖析] 節點包含新的 [選取語言] 屬性,可讓您指定要保留在文件集合中的語言。
  • [文字主題] 節點的結果包含下列新項目:
    • [詞語] 表格,會顯示詞語及其對於每個主題的權重
    • [主題詞語] 矩陣圖形,會顯示各個詞語的主題值。
  • 高效能 HPTMINE 程序現已可在 SVD 陳述式的 OUTDOCPRO= 選項中支援 NONORMDOC 關鍵字,以控管是否要將文件投影常態化。

SAS Text Miner 12.3

SAS Text Miner 12.3 包含節點效能和結果的增強功能。當在多個對話方塊中匯入表格資訊,已使用 [取代表格] 和 [新增表格] 按鈕取代 [匯入] 按鈕。您可以選擇是否取代目前選取的表格,或新增至目前選取的表格。[文字規則產生器] 節點的結果包含新的「文件規則」表格和「規則成功」圖形。
在已適當啟用的 SAS 伺服器上,您可以在 SAS 9.4 中使用 SMP 模式,以在處理流程圖中部署 HP Text Miner 節點,並使用 HPTMINE 和 HPTMSCORE 程序。在許多情況下,在處理流程圖中使用 HP Text Miner 節點可能造成多執行緒處理增加。如需詳細資訊,請參閱 SAS Enterprise Miner High-Performance Data Mining Node Reference 中的 HP Text Miner Node 章節。
上一頁|下一頁|頁面頂端
上次更新時間:2017年7月28日