SAS 9.4から、SAS In-Database Code Acceleratorが追加されて、In-Database処理が拡張されました。SAS In-Database
Code Acceleratorを使用して、DS2スレッドプログラムをデータベースにパブリッシュし、データベース内で並列にスレッドプログラムを実行できます。
NetezzaのIn-DatabaseスコアリングはSAS Embedded Processの追加により拡張されました。SAS Embedded Processは、Netezza内で実行されてデータを読み書きするSASサーバープロセスです。
2013年7月のリリースでは、SAS Scalable Performance Data ServerのIn-Databaseスコアリングがサポートされています。
2013年9月のリリースでは、HadoopのIn-Database処理がSAS Scoring Accelerator for Hadoopの追加により拡張されました。また、2013年9月のリリースでは、パブリッシュマクロを初期化していた自動呼出しマクロは、いずれのDBMSでも不要になりました。ただし、自動呼出しマクロは引き続きサポートされています。
2013年12月のリリースでは、SAS In-Database Code Accelerator for Teradataが、データベース内部のスレッドプログラムだけでなく、DS2データプログラムを実行できるようになりました。また、SAS
In-Database Code Acceleratorのデフォルトの動作が9.4リリースから変更されました。デフォルトでは、データベース内部ではDS2コードは実行されません。DS2ACCELシステムオプションとPROC
DS2 DS2ACCELオプションがこの動作を制御します。HadoopでのDATAステップ処理は現在プリプロダクション版のため、制限付きDATAステッププログラムがHadoop内で実行されてスコアリングされます。
2014年8月のリリースでは、SAS Scoring Accelerator for SAP HANAが使用可能になり、Hadoopでの制限付きDATAステップスコアリングプログラムの実行がプロダクション版になりました。また、SAS
Embedded Process for Hadoopのインストールおよび構成スクリプトに多数の変更が加えられました。
2015年2月のリリースでは、SAS In-Database Code Accelerator for HadoopはHCatalogを使用して複雑な非区切りファイルを処理しています。HCatalogを使用すると、SAS
In-Database Code Accelerator for HadoopでAvro、ORC、RCFile、Parquetなどのファイルの種類のサポートが可能になります。さらに、現在ではDBCREATE_TABLE_OPTSテーブルオプションを使用して、出力SerDe、Hiveテーブルの出力区切り記号、出力ESCAPED
BY文字、およびHiveで許可されたその他のCREATE TABLE構文を指定できます。
2015年7月のリリースでは、SAS In-Database Scoring Accelerator for Hadoopが、SPD Engine HDFSファイル形式をサポートするようになりました。すべてのSAS
In-Database Code Acceleratorsで、埋め込みSQLを使用したSETステートメント、複数の入力テーブルを使用したSETステートメント、およびMERGEステートメントがサポートされています。SAS
Scoring Accelerator for Hadoopのモデルの実行およびパブリッシュマクロで、SAS_HADOOP_CONFIG_PATH環境変数がサポートされるようになりました。このサポートによって、マージ済み構成ファイルが不要になります。SAS
Scoring Accelerator for Hadoop、SAP HANA、およびTeradataは、アイテムストアを使用してモデルスコアリングをサポートします。
SAS Embedded Process for Hadoopのインストールと構成の改善と単純化が行われました。
-
ClouderaおよびHortonworksについては、SAS Embedded ProcessおよびSAS Hadoop MapReduce JARファイルのインストールにCloudera
ManagerおよびAmbariが使用されます。
-
IBM BigInsights、MapR、およびPivotal HDについては、In-Database配置パッケージが、SAS Install Depotからクライアントに配布されます。
さらに、SAS Embedded ProcessとSAS Hadoop MapReduceのJARファイルは、2つの別々のスクリプトではなく1つのスクリプトでインストールされます。新しいプロセスでは、クライアントフットプリントが小さくなり、インストールが高速化されます。
SAS Embedded Process for Hadoopは書き直されたので、今後はLinuxサービスとして実行されることはありません。SAS Embedded
Process for Hadoopでは、IBM BigInsights、MapR、およびPivotal HD Hadoopの配布がサポートされるようになりました。SAS
Embedded Process for Teradataのインストールと構成の改善と単純化が行われました。In-Database配置パッケージが、SAS Install
Depotからクライアントに配布されます。新しいプロセスでは、クライアントフットプリントが小さくなり、インストールが高速化されます。
SAS 9.4M4 (2016年11月に出荷)から、次の新機能が追加されます。
-
SAS Deployment Managerを使用して、Base SASおよびSPD EngineをHadoop用に構成する際にHadoop JARおよび構成ファイルをプルできるようになりました。以前は、これらのファイルのプルは手動プロセスでした。
-
SAS Embedded Process for Aster、DB2、Greenplum、SAP Hana、Oracle、Netezzaのインストールと構成の改善と単純化が行われました。In-Database配置パッケージが、ZIPファイルでSAS
Install Depotからクライアントに配布されます。新しいプロセスでは、クライアントフットプリントが小さくなり、インストールプロセスが高速化されます。
-
SAS Data Loader for Hadoop、SAS Data Quality Accelerator for Teradata、またはSAS Contextual
Analysis In-Database Scoring for Hadoopのライセンスがある場合、そのコンポーネントが、HadoopとTeradataのそれぞれに対してIn-Database配置パッケージに含められます。
-
In-Database処理用に拡張されたBase SASプロシジャが、PostgreSQL、Redshift、およびMicrosoft SQL Server内で実行できるようになりました。
-
PROC RANKとPROC SORTでは、Hadoop上のHive 0.13以降でのIn-Database処理がサポートされるようになりました。
-
SAS In-Database Code Accelerator for Hadoopを使用する場合、SPD Engine SerDeを使用してHiveテーブルにアクセスできます。
-
パフォーマンスの調整を可能にする複数の新しい構成プロパティが、SAS Embedded Process用に追加されました。
-
SAS Embedded Processについては、配置時にインストールされるJARファイルの数が6から1に減少しています。
-
SAS In-Database処理では、Kerberos認証によるTeradataへのシングルサインオンがサポートされています。