上一页|下一页

分布式服务器:并行加载

简介

SAS Visual Analytics 会尽可能并行加载数据。本主题概述 SAS Visual Analytics 支持的并行加载方法。
注: 并非所有方法和提供程序在所有部署中都已配置并且可用。请参见 SAS Visual Analytics: Installation and Configuration Guide (Distributed SAS LASR)

方法:并置存储

拓扑:
存储和分析节点必须在同一机器上。
提供程序:
模式:
对称。存储节点和分析节点之间必须是一对一映射。
SASHDAT:
在并置 HDFS 中,数据以 SASHDAT 格式暂存。
HDFS 源路径采用逗点分隔的格式或旧的逻辑库引用名。
使用情况:
请参见 管理员加载 或使用数据生成器。

方法:NFS-Mounted 存储

拓扑:
存储聚类可以与分析聚类分隔开。1
提供程序:
MapR。请参见 SAS LASR Analytic Server: Reference Guide 中的 MapR Distribution for Apache Hadoop
模式:
不对称。不要求存储节点和分析节点之间是一对一映射。
SASHDAT:
数据以 SASHDAT 格式暂存。
NFS 源路径采用逗点分隔的格式。
使用情况:
请参见 管理员加载 或使用数据生成器。
1无论何种拓扑结构,SAS LASR Analytic Server 访问数据时都假定数据是并置存储的。

方法:SAS Embedded Process

拓扑:
存储聚类可以与分析聚类分隔开。
提供程序:
多种。2
模式:
不对称。不要求存储节点和分析节点之间是一对一映射。
SASHDAT:
数据不会以 SASHDAT 格式暂存。
任何有效的逻辑库引用名。
使用情况:
请参见管理员加载,使用数据生成器或使用导入操作。1
1若嵌入式处理可用、LASR 表名称与源表名称匹配且服务器标记为有效的 SAS 逻辑库引用名,则采用并行加载。
2请参见 SAS High-Performance Analytics Infrastructure: Installation and Configuration Guide

描述示例

下图展示了暂存到并置 HDFS 以及从中加载:
暂存至并置存储
将 tableA 添加至并置 HDFS
从并置存储加载
从并置 HDFS 加载 tableA
对于 NFS-mounted MapR,暂存和加载过程与之前的示例相似,下列除外:
  • 存储群集与分析群集可能是单独的。
  • 元数据对象将有不同的名称。
下图展示了使用 SAS Embedded Process 的导入操作:
使用 SAS Embedded Process 导入
使用 SAS Embedded Process 并行导入
上一页|下一页|页首
上次更新时间: 2018年10月24日