上一页|下一页

SAS 9.4 In-Database 产品

从 SAS 9.4 开始,由于增加了 SAS In-Database Code Accelerator,in-database 处理得到了增强。SAS In-Database Code Accelerator 允许您将 DS2 线程程序发布至数据库,并在数据库内并行执行线程程序。
新增的 SAS Embedded Process 使 Netezza 的 in-database 评分得到了增强。SAS Embedded Process 是在 Netezza 内运行的读写数据的 SAS 服务器过程。
2013 年 7 月发布的版本中,SAS Scalable Performance Data Server 的 in-database 评分得到了支持。
2013 年 9 月发布的版本中,新增的 SAS Scoring Accelerator for Hadoop 使 Hadoop 的 in-database 处理得到增强。同样还是在 2013 年 9 月的版本中,所有 DBMS 均不再需要用来初始化发布宏的自动调用宏。不过,仍支持自动调用宏。
2013 年 12 月发布的版本中,SAS In-Database Code Accelerator for Teradata 现在可以在数据库内运行 DS2 数据程序和线程程序。此外,SAS In-Database Code Accelerator 的默认行为自 9.4 版本已更改。DS2 代码默认情况下不再于数据库内部执行。DS2ACCEL 系统选项和 PROC DS2 DS2ACCEL 选项可以控制该行为。Hadoop 中的 DATA 步处理尚属试用功能,因此受限制的 DATA 步程序可以在 Hadoop 内部运行以评分。
2014 年 8 月发布的版本中,SAS Scoring Accelerator for SAP HANA 现在可用,并且在 Hadoop 中运行受限制的 DATA 步评分程序现已正式投入使用。另外,SAS Embedded Process for Hadoop 的安装和配置脚本也进行了大量更改。
2015 年 2 月发布的版本中,SAS In-Database Code Accelerator for Hadoop 使用 HCatalog 处理复杂的无分隔符文件。使用 HCatalog,SAS In-Database Code Accelerator for Hadoop 可支持多种类型的文件,如 Avro、ORC、RCFile 和 Parquet。此外,您现在可以使用 DBCREATE_TABLE_OPTS 表选项来指定输出 SerDe、Hive 表的输出分隔符、输出 ESCAPED BY 字符和任何其他 HIve 允许的 CREATE TABLE 语法。
2015 年 7 月发布的版本中,SAS In-Database Scoring Accelerator for Hadoop 现在支持 SPD Engine HDFS 文件格式。所有 SAS In-Database Code Accelerators 均支持带嵌入 SQL 的 SET 语句、带多个输入表的 SET 语句,以及 MERGE 语句。运行并发布 SAS Scoring Accelerator for Hadoop 模型宏现在支持 SAS_HADOOP_CONFIG_PATH 环境变量。这一支持不需要合并后的配置文件。SAS Scoring Accelerator for Hadoop、SAP HANA 和 Teradata 通过使用项存储支持模型评分。
SAS Embedded Process for Hadoop 的安装和配置有所改善和简化:
  • 对于 Cloudera 和 Hortonworks,Cloudera Manager 和 Ambari 用于安装 SAS Embedded Process 和 SAS Hadoop MapReduce JAR 文件。
  • 对于 IBM BigInsights、MapR 和 Pivotal HD,in-database 部署包从 SAS 安装软件库交付给客户。
另外,安装 SAS Embedded Process 和 SAS Hadoop MapReduce JAR 文件使用的是一段脚本而不是两段单独的脚本。新过程占用客户端空间更小,安装更快。
SAS Embedded Process for Hadoop 已重写,不再作为 Linux 服务运行。SAS Embedded Process for Hadoop 现在支持 IBM BigInsights、MapR 和 Pivotal HD Hadoop 分布。SAS Embedded Process for Teradata 的安装和配置有所改善和简化。In-database 部署包从 SAS 安装软件库交付给客户。新过程占用客户端空间更小,安装更快。
从 SAS 9.4M4 (于 2016 年 11 月推出)开始,新增了以下功能:
  • 在配置 Base SAS 和 SPD 引擎用于 Hadoop 时,现在可以使用 SAS Deployment Manager 来提取 Hadoop JAR 和配置文件。以往提取这些文件是个手动过程。
  • SAS Embedded Process for Aster、DB2、Greenplum、SAP Hana、Oracle 和 Netezza 的安装和配置已经改善和简化。In-database 部署包从 ZIP 文件中的 SAS 安装软件库交付给客户。新过程占用客户端空间更小,安装过程更快。
  • 若您有 SAS Data Loader for Hadoop、SAS Data Quality Accelerator for Teradata 或 SAS Contextual Analysis In-Database Scoring for Hadoop 的许可,这些组件会分别包含在 Hadoop 和 Teradata 的 in-database 部署包中。
  • 针对 in-database 处理增强的 Base SAS 过程现在可在 PostgreSQL、Redshift 和 Microsoft SQL Server 内部运行。
  • PROC RANK 和 PROC SORT 现在支持在 Hadoop Hive .13 或更高版本上进行 in-database 处理。
  • 如果您使用 SAS In-Database Code Accelerator for Hadoop,SPD Engine SerDe 可用于访问 Hive 表。
  • 针对 SAS Embedded Process 新增了若干支持您调整性能的配置属性。
  • 对于 SAS Embedded Process,部署期间安装的 JAR 文件数已从 6 个减少到 1 个。
  • SAS in-database 处理支持使用 Kerberos 身份验证通过单点登录方式访问 Teradata。
详细信息,请参见 SAS In-Database Products: User’s Guide 中的 What’s New in the SAS 9.4 In-Database Products
上一页|下一页|页首
上次更新时间: 2017年7月28日