上一页|下一页

如何使用表?

输入表

将事实表和维表拖放到工作区中后,即可在星形模式中使用这些表。默认情况下,数据生成器将您在工作区中放入的第一个表视为事实表。点击工具栏中的 编辑星形模式表,选择不同的事实表。
由于星形模式是服务器在内存中形成的,所以第一步是要确保将这些表加载到内存中。请注意,每次运行星形模式时都会传输这些表,所以这会降低性能。反之,若表已经加载到服务器上的内存中,则星形模式运行和生成输出的速度会更快。
在使用相同的 HDFS 逻辑库中的表创建星形模式时,若星形模式中的一个或多个表经过加密,但 HDFS 逻辑库没有加密,星形模式将无法运行。这时,您会收到一条错误信息,提示需要为加密的表提供密码。当您的管理员为之前加密的逻辑库取消加密时,就可能出现这种情况。之前逻辑库中的任何表都会保持加密状态。您的管理员可以通过为逻辑库重新启用加密来解决此问题。详细信息,请与您的管理员联系。

列前缀

维表名称中的前 15 个字符和下划线字符最初会设置为维表中列名的前缀。输出表的列名是该前缀与初始列名的组合。
不过,您可以在从输入选项卡顶部的菜单中选择表名后指定不同的前缀值。
事实表的列名不用前缀来修饰。
提示
列名的字符上限为 32 个字符。若列名较长,则缩短前缀可帮助您尽量长地保留初始列名。

输出表和节省内存

为高效使用内存,模式的默认输出是一个视图。默认选定输出选项卡上的以视图形式创建输出复选框,以创建视图。若清除该复选框,则输出的是表。
若输出的是视图,将从访问视图时所对应的原始表中创建行。这是视图的主要优势,因为视图不会创建整个输出表,也不会将其全部保存在内存中。
若清除以视图形式创建输出复选框以便从星形模式创建表,则系统必须具有足够的可用内存来储存该表。若运行星形模式时系统内存不足,则将释放用于输出表的内存,同时您会收到错误消息。
若使用 SAS LASR Analytic Server 表作为模式的输入,则星形模式的输出表必须使用相同的逻辑库。
在使用 HDFS 逻辑库中的表创建星形模式时,若 HDFS 逻辑库路径与 LASR 输出逻辑库的标记不匹配,星形模式将无法保存。这时,您会收到一条错误信息,称逻辑库路径与 SAS LASR Analytic Server 标记不匹配。请尝试将输出表更改为一个其标记与 HDFS 逻辑库路径相匹配的 LASR 逻辑库。您可以在 SAS Management Console 中查看 LASR 逻辑库的标记。详细信息,请与您的管理员联系。

性能注意事项

将 LASR 星形模式创建为视图比创建表更方便,但通过视图访问数据可能会降低性能。影响程度取决于维表大小。不过,数据通过次数更为重要。例如,请求百分位数、箱线图或拟合统计模型要求多次通过数据。对这些请求的影响要比对汇总统计量请求的影响更大。
请谨记以下注意事项:
  • 最初创建视图要比创建表快。不过,访问视图中的数据要比访问表中数据慢。
  • 创建表所需的物理内存量比创建视图要多。若您的系统有足够的内存容量,则创建表会提供最佳的数据访问性能。
上一页|下一页|页首