SAS Visual Analytics 提供了自助项用于导入 BigInsights、Cloudera、Cloudera Impala、Pivotal HAWQ、Hortonworks、MapR
和 Pivotal HD 中的数据。其中每个数据库都需要您的管理员单独进行设置。
对以上所有数据库都通用的一种连接类型是先连接到 Hive 或 HiveServer2,然后导入表。
若 Hadoop 群集是使用 SAS Embedded Process 配置的,则您可以并行加载至 SAS LASR Analytic Server。在此情况下,在导入数据窗口中指定以下之一:
-
在 SAS 系统选项字段中,指定 SAS_HADOOP_CONFIG_PATH 环境变量。若管理员已指定该值,则无需再次指定。
-
在配置字段中,指定指向 Hadoop 配置文件的路径。
您的软件安装点还可能需要您指定更多选项。有关设置从 Hadoop 进行并行加载的信息,请参见SAS Visual Analytics: Installation and Configuration Guide (Distributed SAS LASR)的“Where Do I Locate My Analytics Cluster”。