上一页|下一页

分区表

若将 SAS LASR Analytic Server 或 HDFS 中的 SAS 数据 逻辑库指定为输出逻辑库,则可以为表指定分区键。您可以从分区依据菜单中选择要使用的列。
分区使用分区键的格式化值对含有相同键值的行分组。含有相同键值的所有行将加载至群集中的一台机器。对于 SAS LASR Analytic Server逻辑库,这意味着含有相同键值的行位于一台机器上的内存中。对于 HDFS 中的 SAS 数据 逻辑库,含有相同键值的所有行都写入一台机器上的一个文件块。(该块复制到其他机器以实现冗余。) 当分区表加载至服务器时,分区还像在内存中一样得以保留。
若选择了某个分区键,同时在列编辑器选项卡上为列指定了排序选项,则排序选项将在 ORDERBY= 选项中传递至当前引擎。该增强功能适用于 SAS LASR Analytic Server 和 HDFS 中的 SAS 数据 逻辑库,并且可以在数据加载到内存后改进性能。
指定分区键时,应避免使用唯一值不多的变量。例如,使用布尔值类型的标记列进行分区将导致所有行分布在两台机器上,因为仅有两个值可用。另一极端情况是,按几乎唯一的键对大型表分区将导致很多分区,但每个分区只有数行。
确定最佳分区键这项任务可能极具挑战性;但分区会改进性能,比如,若您需要基于客户 ID 访问数据,则按客户对数据分区可能会改进性能。

另见

SAS LASR Analytic Server: Reference Guide
上一页|下一页|页首