SAS 9.4 In-Database 产品

从 SAS 9.4 开始，由于增加了 SAS In-Database Code Accelerator，in-database 处理得到了增强。SAS In-Database Code Accelerator 允许您将 DS2 线程程序发布至数据库，并在数据库内并行执行线程程序。

新增的 SAS Embedded Process 使 Netezza 的 in-database 评分得到了增强。SAS Embedded Process 是在 Netezza 内运行的读写数据的 SAS 服务器过程。

在 2013 年 7 月发布的版本中，SAS Scalable Performance Data Server 的 in-database 评分得到了支持。

在 2013 年 9 月发布的版本中，新增的 SAS Scoring Accelerator for Hadoop 使 Hadoop 的 in-database 处理得到增强。同样还是在 2013 年 9 月的版本中，所有 DBMS 均不再需要用来初始化发布宏的自动调用宏。不过，仍支持自动调用宏。

在 2013 年 12 月发布的版本中，SAS In-Database Code Accelerator for Teradata 现在可以在数据库内运行 DS2 数据程序和线程程序。此外，SAS In-Database Code Accelerator 的默认行为自 9.4 版本已更改。DS2 代码默认情况下不再于数据库内部执行。DS2ACCEL 系统选项和 PROC DS2 DS2ACCEL 选项可以控制该行为。Hadoop 中的 DATA 步处理尚属试用功能，因此受限制的 DATA 步程序可以在 Hadoop 内部运行以评分。

在 2014 年 8 月发布的版本中，SAS Scoring Accelerator for SAP HANA 现在可用，并且在 Hadoop 中运行受限制的 DATA 步评分程序现已正式投入使用。另外，SAS Embedded Process for Hadoop 的安装和配置脚本也进行了大量更改。

在 2015 年 2 月发布的版本中，SAS In-Database Code Accelerator for Hadoop 使用 HCatalog 处理复杂的无分隔符文件。使用 HCatalog，SAS In-Database Code Accelerator for Hadoop 可支持多种类型的文件，如 Avro、ORC、RCFile 和 Parquet。此外，您现在可以使用 DBCREATE_TABLE_OPTS 表选项来指定输出 SerDe、Hive 表的输出分隔符、输出 ESCAPED BY 字符和任何其他 HIve 允许的 CREATE TABLE 语法。

在 2015 年 7 月发布的版本中，SAS In-Database Scoring Accelerator for Hadoop 现在支持 SPD Engine HDFS 文件格式。所有 SAS In-Database Code Accelerators 均支持带嵌入 SQL 的 SET 语句、带多个输入表的 SET 语句，以及 MERGE 语句。运行并发布 SAS Scoring Accelerator for Hadoop 模型宏现在支持 SAS_HADOOP_CONFIG_PATH 环境变量。这一支持不需要合并后的配置文件。SAS Scoring Accelerator for Hadoop、SAP HANA 和 Teradata 通过使用项存储支持模型评分。

SAS Embedded Process for Hadoop 的安装和配置有所改善和简化：

对于 Cloudera 和 Hortonworks，Cloudera Manager 和 Ambari 用于安装 SAS Embedded Process 和 SAS Hadoop MapReduce JAR 文件。
对于 IBM BigInsights、MapR 和 Pivotal HD，in-database 部署包从 SAS 安装软件库交付给客户。

另外，安装 SAS Embedded Process 和 SAS Hadoop MapReduce JAR 文件使用的是一段脚本而不是两段单独的脚本。新过程占用客户端空间更小，安装更快。

SAS Embedded Process for Hadoop 已重写，不再作为 Linux 服务运行。SAS Embedded Process for Hadoop 现在支持 IBM BigInsights、MapR 和 Pivotal HD Hadoop 分布。SAS Embedded Process for Teradata 的安装和配置有所改善和简化。In-database 部署包从 SAS 安装软件库交付给客户。新过程占用客户端空间更小，安装更快。

从 SAS 9.4M4 （于 2016 年 11 月推出）开始，新增了以下功能：

在配置 Base SAS 和 SPD 引擎用于 Hadoop 时，现在可以使用 SAS Deployment Manager 来提取 Hadoop JAR 和配置文件。以往提取这些文件是个手动过程。
SAS Embedded Process for Aster、DB2、Greenplum、SAP Hana、Oracle 和 Netezza 的安装和配置已经改善和简化。In-database 部署包从 ZIP 文件中的 SAS 安装软件库交付给客户。新过程占用客户端空间更小，安装过程更快。
若您有 SAS Data Loader for Hadoop、SAS Data Quality Accelerator for Teradata 或 SAS Contextual Analysis In-Database Scoring for Hadoop 的许可，这些组件会分别包含在 Hadoop 和 Teradata 的 in-database 部署包中。
针对 in-database 处理增强的 Base SAS 过程现在可在 PostgreSQL、Redshift 和 Microsoft SQL Server 内部运行。
PROC RANK 和 PROC SORT 现在支持在 Hadoop Hive .13 或更高版本上进行 in-database 处理。
如果您使用 SAS In-Database Code Accelerator for Hadoop，SPD Engine SerDe 可用于访问 Hive 表。
针对 SAS Embedded Process 新增了若干支持您调整性能的配置属性。
对于 SAS Embedded Process，部署期间安装的 JAR 文件数已从 6 个减少到 1 个。
SAS in-database 处理支持使用 Kerberos 身份验证通过单点登录方式访问 Teradata。

详细信息，请参见 SAS In-Database Products: User’s Guide 中的 What’s New in the SAS 9.4 In-Database Products。