停用词列表是您希望在文本分析中忽略的词语表。通过剔除某些常用词,如动词“to be”的各种变化形式,您可以从分析中过滤掉干扰词。SAS Visual Analytics
支持英语和德语的文本分析,还包含这两种语言的停用词列表。
要加载停用词列表,请执行以下步骤:
-
选择
工具加载文本分析停用词列表。
-
按需修改位置和逻辑库。每个停用词列表必须储存在各自的元数据文件夹中。
一个名为 ENGSTOPL 或 GRMSTOPL 的表会在您指定的位置和逻辑库中注册。
-
SAS Visual Analytics 支持对每个 SAS LASR Analytic Server 使用一个停用词列表。通过执行以上步骤将停用词列表(是一个表)加载至内存。若向
SAS LASR Analytic Server 注册了多个逻辑库,则可以使用任一逻辑库。若多次加载停用词列表或使用了多个逻辑库,则服务器会使用加载至内存的最后一个停用词列表。