前のページ|次のページ

SAS 9.4 In-Database製品

SAS 9.4から、SAS In-Database Code Acceleratorが追加されて、In-Database処理が拡張されました。SAS In-Database Code Acceleratorを使用して、DS2スレッドプログラムをデータベースにパブリッシュし、データベース内で並列にスレッドプログラムを実行できます。
NetezzaのIn-DatabaseスコアリングはSAS Embedded Processの追加により拡張されました。SAS Embedded Processは、Netezza内で実行されてデータを読み書きするSASサーバープロセスです。
2013年7月のリリースでは、SAS Scalable Performance Data ServerのIn-Databaseスコアリングがサポートされています。
2013年9月のリリースでは、HadoopのIn-Database処理がSAS Scoring Accelerator for Hadoopの追加により拡張されました。また、2013年9月のリリースでは、パブリッシュマクロを初期化していた自動呼出しマクロは、いずれのDBMSでも不要になりました。ただし、自動呼出しマクロは引き続きサポートされています。
2013年12月のリリースでは、SAS In-Database Code Accelerator for Teradataが、データベース内部のスレッドプログラムだけでなく、DS2データプログラムを実行できるようになりました。また、SAS In-Database Code Acceleratorのデフォルトの動作が9.4リリースから変更されました。デフォルトでは、データベース内部ではDS2コードは実行されません。DS2ACCELシステムオプションとPROC DS2 DS2ACCELオプションがこの動作を制御します。HadoopでのDATAステップ処理は現在プリプロダクション版のため、制限付きDATAステッププログラムがHadoop内で実行されてスコアリングされます。
2014年8月のリリースでは、SAS Scoring Accelerator for SAP HANAが使用可能になり、Hadoopでの制限付きDATAステップスコアリングプログラムの実行がプロダクション版になりました。また、SAS Embedded Process for Hadoopのインストールおよび構成スクリプトに多数の変更が加えられました。
2015年2月のリリースでは、SAS In-Database Code Accelerator for HadoopはHCatalogを使用して複雑な非区切りファイルを処理しています。HCatalogを使用すると、SAS In-Database Code Accelerator for HadoopでAvro、ORC、RCFile、Parquetなどのファイルの種類のサポートが可能になります。さらに、現在ではDBCREATE_TABLE_OPTSテーブルオプションを使用して、出力SerDe、Hiveテーブルの出力区切り記号、出力ESCAPED BY文字、およびHiveで許可されたその他のCREATE TABLE構文を指定できます。
2015年7月のリリースでは、SAS In-Database Scoring Accelerator for Hadoopが、SPD Engine HDFSファイル形式をサポートするようになりました。すべてのSAS In-Database Code Acceleratorsで、埋め込みSQLを使用したSETステートメント、複数の入力テーブルを使用したSETステートメント、およびMERGEステートメントがサポートされています。SAS Scoring Accelerator for Hadoopのモデルの実行およびパブリッシュマクロで、SAS_HADOOP_CONFIG_PATH環境変数がサポートされるようになりました。このサポートによって、マージ済み構成ファイルが不要になります。SAS Scoring Accelerator for Hadoop、SAP HANA、およびTeradataは、アイテムストアを使用してモデルスコアリングをサポートします。
SAS Embedded Process for Hadoopのインストールと構成の改善と単純化が行われました。
  • ClouderaおよびHortonworksについては、SAS Embedded ProcessおよびSAS Hadoop MapReduce JARファイルのインストールにCloudera ManagerおよびAmbariが使用されます。
  • IBM BigInsights、MapR、およびPivotal HDについては、In-Database配置パッケージが、SAS Install Depotからクライアントに配布されます。
さらに、SAS Embedded ProcessとSAS Hadoop MapReduceのJARファイルは、2つの別々のスクリプトではなく1つのスクリプトでインストールされます。新しいプロセスでは、クライアントフットプリントが小さくなり、インストールが高速化されます。
SAS Embedded Process for Hadoopは書き直されたので、今後はLinuxサービスとして実行されることはありません。SAS Embedded Process for Hadoopでは、IBM BigInsights、MapR、およびPivotal HD Hadoopの配布がサポートされるようになりました。SAS Embedded Process for Teradataのインストールと構成の改善と単純化が行われました。In-Database配置パッケージが、SAS Install Depotからクライアントに配布されます。新しいプロセスでは、クライアントフットプリントが小さくなり、インストールが高速化されます。
SAS 9.4M4 (2016年11月に出荷)から、次の新機能が追加されます。
  • SAS Deployment Managerを使用して、Base SASおよびSPD EngineをHadoop用に構成する際にHadoop JARおよび構成ファイルをプルできるようになりました。以前は、これらのファイルのプルは手動プロセスでした。
  • SAS Embedded Process for Aster、DB2、Greenplum、SAP Hana、Oracle、Netezzaのインストールと構成の改善と単純化が行われました。In-Database配置パッケージが、ZIPファイルでSAS Install Depotからクライアントに配布されます。新しいプロセスでは、クライアントフットプリントが小さくなり、インストールプロセスが高速化されます。
  • SAS Data Loader for Hadoop、SAS Data Quality Accelerator for Teradata、またはSAS Contextual Analysis In-Database Scoring for Hadoopのライセンスがある場合、そのコンポーネントが、HadoopとTeradataのそれぞれに対してIn-Database配置パッケージに含められます。
  • In-Database処理用に拡張されたBase SASプロシジャが、PostgreSQL、Redshift、およびMicrosoft SQL Server内で実行できるようになりました。
  • PROC RANKとPROC SORTでは、Hadoop上のHive 0.13以降でのIn-Database処理がサポートされるようになりました。
  • SAS In-Database Code Accelerator for Hadoopを使用する場合、SPD Engine SerDeを使用してHiveテーブルにアクセスできます。
  • パフォーマンスの調整を可能にする複数の新しい構成プロパティが、SAS Embedded Process用に追加されました。
  • SAS Embedded Processについては、配置時にインストールされるJARファイルの数が6から1に減少しています。
  • SAS In-Database処理では、Kerberos認証によるTeradataへのシングルサインオンがサポートされています。
詳細については、What’s New in the SAS 9.4 In-Database Products (SAS In-Database Products: User’s Guide)を参照してください。
前のページ|次のページ|ページの先頭へ
最終更新: 2017/07/28