从 SAS 9.4 开始,由于增加了 SAS In-Database Code Accelerator,in-database 处理得到了增强。SAS In-Database
Code Accelerator 允许您将 DS2 线程程序发布至数据库,并在数据库内并行执行线程程序。
新增的 SAS Embedded Process 使 Netezza 的 in-database 评分得到了增强。SAS Embedded Process 是在 Netezza
内运行的读写数据的 SAS 服务器过程。
在 2013 年 7 月发布的版本中,SAS Scalable Performance Data Server 的 in-database 评分得到了支持。
在 2013 年 9 月发布的版本中,新增的 SAS Scoring Accelerator for Hadoop 使 Hadoop 的 in-database 处理得到增强。同样还是在 2013
年 9 月的版本中,所有 DBMS 均不再需要用来初始化发布宏的自动调用宏。不过,仍支持自动调用宏。
在 2013 年 12 月发布的版本中,SAS In-Database Code Accelerator for Teradata 现在可以在数据库内运行 DS2 数据程序和线程程序。此外,SAS In-Database
Code Accelerator 的默认行为自 9.4 版本已更改。DS2 代码默认情况下不再于数据库内部执行。DS2ACCEL 系统选项和 PROC DS2 DS2ACCEL
选项可以控制该行为。Hadoop 中的 DATA 步处理尚属试用功能,因此受限制的 DATA 步程序可以在 Hadoop 内部运行以评分。
在 2014 年 8 月发布的版本中,SAS Scoring Accelerator for SAP HANA 现在可用,并且在 Hadoop 中运行受限制的 DATA 步评分程序现已正式投入使用。另外,SAS
Embedded Process for Hadoop 的安装和配置脚本也进行了大量更改。
在 2015 年 2 月发布的版本中,SAS In-Database Code Accelerator for Hadoop 使用 HCatalog 处理复杂的无分隔符文件。使用 HCatalog,SAS
In-Database Code Accelerator for Hadoop 可支持多种类型的文件,如 Avro、ORC、RCFile 和 Parquet。此外,您现在可以使用
DBCREATE_TABLE_OPTS 表选项来指定输出 SerDe、Hive 表的输出分隔符、输出 ESCAPED BY 字符和任何其他 HIve 允许的 CREATE
TABLE 语法。
在 2015 年 7 月发布的版本中,SAS In-Database Scoring Accelerator for Hadoop 现在支持 SPD Engine HDFS 文件格式。所有 SAS
In-Database Code Accelerators 均支持带嵌入 SQL 的 SET 语句、带多个输入表的 SET 语句,以及 MERGE 语句。运行并发布
SAS Scoring Accelerator for Hadoop 模型宏现在支持 SAS_HADOOP_CONFIG_PATH 环境变量。这一支持不需要合并后的配置文件。SAS
Scoring Accelerator for Hadoop、SAP HANA 和 Teradata 通过使用项存储支持模型评分。
SAS Embedded Process for Hadoop 的安装和配置有所改善和简化:
-
对于 Cloudera 和 Hortonworks,Cloudera Manager 和 Ambari 用于安装 SAS Embedded Process 和 SAS
Hadoop MapReduce JAR 文件。
-
对于 IBM BigInsights、MapR 和 Pivotal HD,in-database 部署包从 SAS 安装软件库交付给客户。
另外,安装 SAS Embedded Process 和 SAS Hadoop MapReduce JAR 文件使用的是一段脚本而不是两段单独的脚本。新过程占用客户端空间更小,安装更快。
SAS Embedded Process for Hadoop 已重写,不再作为 Linux 服务运行。SAS Embedded Process for Hadoop
现在支持 IBM BigInsights、MapR 和 Pivotal HD Hadoop 分布。SAS Embedded Process for Teradata
的安装和配置有所改善和简化。In-database 部署包从 SAS 安装软件库交付给客户。新过程占用客户端空间更小,安装更快。
从 SAS 9.4M4 (于 2016 年 11 月推出)开始,新增了以下功能:
-
在配置 Base SAS 和 SPD 引擎用于 Hadoop 时,现在可以使用 SAS Deployment Manager 来提取 Hadoop JAR 和配置文件。以往提取这些文件是个手动过程。
-
SAS Embedded Process for Aster、DB2、Greenplum、SAP Hana、Oracle 和 Netezza 的安装和配置已经改善和简化。In-database
部署包从 ZIP 文件中的 SAS 安装软件库交付给客户。新过程占用客户端空间更小,安装过程更快。
-
若您有 SAS Data Loader for Hadoop、SAS Data Quality Accelerator for Teradata 或 SAS Contextual
Analysis In-Database Scoring for Hadoop 的许可,这些组件会分别包含在 Hadoop 和 Teradata 的 in-database
部署包中。
-
针对 in-database 处理增强的 Base SAS 过程现在可在 PostgreSQL、Redshift 和 Microsoft SQL Server 内部运行。
-
PROC RANK 和 PROC SORT 现在支持在 Hadoop Hive .13 或更高版本上进行 in-database 处理。
-
如果您使用 SAS In-Database Code Accelerator for Hadoop,SPD Engine SerDe 可用于访问 Hive 表。
-
针对 SAS Embedded Process 新增了若干支持您调整性能的配置属性。
-
对于 SAS Embedded Process,部署期间安装的 JAR 文件数已从 6 个减少到 1 个。
-
SAS in-database 处理支持使用 Kerberos 身份验证通过单点登录方式访问 Teradata。