從 SAS 9.4 開始,已透過增加 SAS In-Database Code Accelerator 來增強 in-database 處理。SAS In-Database
Code Accelerator 可讓您將 DS2 執行緒程式發行到資料庫,並平行地在資料庫中執行執行緒程式。
已透過增加 SAS Embedded Process 來增強 Netezza 的 In-database 評分。SAS 內嵌程序是在 Netezza 中執行以讀取和寫入資料的
SAS 伺服器程序。
在 2013 年 7 月的版本中,SAS Scalable Performance Data Server 可支援 In-Database 評分。
2013 年 9 月的版本中加入了適用於 Hadoop 的 SAS Scoring Accelerator,而強化了 Hadoop 的 In-Database 處理。此外,在 2013 年
9 月的版本中,任何 DBMS 都已不需要將發行巨集初始化的自動呼叫巨集。但自動呼叫巨集仍受支援。
在 2013 年 12 月的版本中,適用於 Teradata 的 SAS In-Database Code Accelerator 現已可在資料庫內執行 DS2 資料程式和執行緒程式。此外,SAS
In-Database Code Accelerator 的預設行為也從 9.4 版起有所變更。DS2 程式碼依預設已不會在資料庫內執行。此行為會由 DS2ACCEL
系統選項和 PROC DS2 DS2ACCEL 選項控制。Hadoop 中的 DATA 步驟處理現已提供試用,所以可以在 Hadoop 內部執行有限的 DATA 步驟程式,以進行評分。
在 2014 年 8 月版本中,SAS Scoring Accelerator for SAP HANA 現在已可使用,而在 Hadoop 中執行有限 DATA 步驟評分程式現已可正式使用。此外,SAS
Embedded Process for Hadoop 的安裝和設定指令碼已大幅變動。
在 2015 年 2 月的版本中,SAS In-Database Code Accelerator for Hadoop 使用 HCatalog 來處理複雜的非定界檔案。使用 HCatalog,可讓
SAS In-Database Code Accelerator for Hadoop 支援 Avro、ORC、RCFile 和 Parquet 等檔案類型。此外,現在您可以使用
DBCREATE_TABLE_OPTS 表格選項來指定輸出 SerDe、Hive 表格的輸出分隔符號、輸出 ESCAPED BY 字元,以及 Hive 所允許的任何其他
CREATE TABLE 語法。
在 2015 年 7 月的版本中,適用於 Hadoop 的 SAS In-Database Scoring Accelerator 現已支援 SPD 引擎 HDFS 檔案格式。所有的 SAS In-Database
Code Accelerator 皆支援使用內嵌 SQL 的 SET 陳述式、使用多個輸入表格的 SET 陳述式,以及 MERGE 陳述式。適用於 Hadoop 的
SAS Scoring Accelerator 的執行和發行模型巨集現已支援 SAS_HADOOP_CONFIG_PATH 環境變數。藉由此支援得以免除合併組態檔的需求。適用於
Hadoop、SAP HANA 和 Teradata 的 SAS Scoring Accelerator 可支援使用項目儲存區的模型評分。
SAS Embedded Process for Hadoop 的安裝和設定已改良並簡化:
-
針對 Cloudera 和 Hortonworks,會使用 Cloudera Manager 和 Ambari 來安裝 SAS Embedded Process
與 SAS Hadoop MapReduce JAR 檔案。
-
針對 IBM BigInsights、MapR 和 Pivotal HD,會從 SAS Install Depot 將 in-database 部署套件傳遞至用戶端。
此外,SAS Embedded Process 和 SAS Hadoop MapReduce JAR 檔案會以單一指令碼安裝,而不是兩個不同的指令碼。新程序的用戶端資源耗用較少,且安裝速度較快。
SAS Embedded Process for Hadoop 已重寫,不會再以 Linux 服務的形式執行。SAS Embedded Process for Hadoop
現已支援 IBM BigInsights、MapR 和 Pivotal HD Hadoop 分布。SAS Embedded Process for Teradata
的安裝和設定已改良並簡化:會從 SAS Install Depot 將 in-database 部署套件傳遞至用戶端。新程序的用戶端資源耗用較少,且安裝速度較快。
從 SAS 9.4M4 (發行於 2016 年 11 月) 開始,已提供下列新功能:
-
現在,在設定 Base SAS 和 SPD 引擎以用於 Hadoop 時,可以使用 SAS 部署管理程式來提取 Hadoop JAR 和組態檔。過去,這些檔案必須以手動程序提取。
-
適用於 Aster、DB2、Greenplum、SAP Hana、Oracle 和 Netezza 的 SAS Embedded Process 的安裝和設定已改良並簡化。In-database
部署套件會透過 ZIP 檔案,從 SAS Install Depot 傳遞至用戶端。新程序的用戶端資源耗用較少,且安裝程序速度較快。
-
如果您為 SAS Data Loader for Hadoop、SAS Data Quality Accelerator for Teradata 或 SAS Contextual
Analysis In-Database Scoring for Hadoop 授權,這些元件將分別包含在 Hadoop 和 Teradata 的 In-database
部署套件中。
-
針對 In-database 處理而強化的 Base SAS 程序,現在可以在 PostgreSQL、Redshift 和 Microsoft SQL Server
內執行。
-
PROC RANK 和 PROC SORT 現在可以支援在 Hadoop with Hive .13 或更新版本上進行 In-database 處理。
-
如果您使用 SAS In-Database Code Accelerator for Hadoop,您可以使用 SPD 引擎 SerDe 來存取 Hive 表格。
-
SAS Embedded Process 已新增數個可讓您調整效能的組態屬性。
-
針對 SAS Embedded Process,在部署期間安裝的 JAR 檔案數已從六個降為一個。
-
SAS In-database 處理支援使用 Kerberos 驗證對 Teradata 進行單一登入。