要导入数据库表,针对该数据库的
SAS/ACCESS 产品必须经过许可并针对 SAS Workspace Server 进行配置。您可从以下数据库导入数据:
-
服务器数据库 — SAS Data Set、Aster, DB2、Greenplum、MySQL、Netezza、ODBC、Oracle、PostgreSQL、Salesforce、SAP
HANA、SQL Server、Teradata、Vertica
-
Hadoop 数据库 — BigInsights、Cloudera、Cloudera Impala、Hortonworks、MapR、Pivotal HD
注: 尽管菜单选择项不同,BigInsights、Cloudera、Hortonworks、MapR 和 Pivotal HD 都使用 SAS/ACCESS Interface to Hadoop。
要导入数据库表,请执行下列操作:
-
从
导入数据窗口的服务器或 Hadoop 数据库列表中选择数据库名称。这些列表只包括满足下述条件的数据源:针对数据源的
SAS/ACCESS 产品经过许可和配置,并且您的管理员授予了您使用相关数据源的权力。
-
指定连接信息。以下是关于指定连接信息的一些要点:
-
服务器字段对应于服务器的主机名称。有些数据库会使用数据源名称而不是服务器与端口的组合来进行连接。
-
在 DBMS 表名字段中,您可以同时导入多个表。为此,需要在按下 Ctrl 键的同时在选择表窗口中选择表名。在导入过程中,状态列中的图标可以指示表是被成功导入、导入失败还是您选择了取消导入。通过点击注释列中的链接,您可以查看其他信息,如日志或错误消息。
大部分字段区分大小写。例如,在数据库字段中指定一个值 products
可能与指定 PRODUCTS
不同。是否区分大小写取决于数据库供应商。此外,有些数据库使用模式。在没有明确指定模式的情况下,有些数据库自动使用用户 ID 作为模式。请注意用户 ID 和模式字段是区分大小写的。若您不确定的话,请与您的数据库管理员核实。
-
-
(可选)展开
选项以指示其他连接选项。以下是关于指定其他连接选项的一些要点:
-
有关 Database 选项字段有效值的详细信息,请参见SAS/ACCESS for Relational Databases: Reference。请查看“数据集选项”主题了解您使用的数据库的类型(例如,ODBC 的数据集选项)。
-
您可以使用
SAS 系统选项字段指定环境变量,例如:
set=SAS_HADOOP_JAR_PATH="/path/to/files"
options
关键字提交时会包含您在该字段中指定的任何选项。
-
(可选)通过点击
高级检查逻辑库和位置设置。做出必要的更改。
若您从探索器或设计器导入数据,但却不具备“生成数据”权力,则您无法访问高级部分;但您可以将数据导入通用区域,或选择将表储存在专用位置防止其他用户访问这些数据。
-
成功导入某个表后,除密码之外的连接信息随之保存。这样您就可以快速导入其他表或根据需要重新加载该表。
若希望使用相同的表名为现有的表重新加载数据,您必须执行以下某个操作:
若未能重新加载表,日志中可能不会包含任何错误信息。这时,日志很可能会显示上次对表成功进行操作的信息。
注: 若导入单个表,就无法执行取消。若导入多个表,则可以选择取消。但是,提交取消请求时正被处理的表无法取消导入,而且会结束加载。