シンプル化を促進するSAP HANAの最新版SPS9
作成者:松舘 学 投稿日:2014年12月12日
2014年12月2日にSAP HANAの最新版SPS9をリリースしました。SAP HANAは半年に一度最新機能のアップグレードをサービスパックとして提供しています。今回は、SPS9の新機能についてご紹介をしていきたいと思います。マルチテナントなどのさまざまな新機能が採用されており、SAPが提唱しているITランドスケープのシンプル化を促進するための強力なプラットフォームとしての機能を成熟させています。
SAP HANA SPS9には、SAP ERPのインメモリーデータベース基盤としてはもちろん、クラウドやビッグデータ、センサーデータを活用するM2M、IoTで利用するための多岐にわたるプラットフォーム機能が追加されています。センサーデータのストリーミング収集、クレンジング・欠損値補完からデータ変換、高速処理分析から統計解析モデルの適用、モバイルアプリケーションを利用したデータへのアクセスと、SAP HANAプラットフォームさえあればもう他に何も必要ありません。どのようなシナリオで活用するかは、ご利用になる方の想像力にかかっています。
マルチテナント機能
複数のデータベースのワークロード管理を可能にする、マルチテナントに対応しました。これにより、データベース管理者によっては、管理作業のシンプル化が可能となり、お客様はシステムリソースをより有効活用し、全体的な設備投資の低減が可能となりました。CPUやメモリーといったシステムリソースに加え、ユーザー管理を完全に分離することも可能です。バックアップ・リストアもテナント単位で行うことができます。
マルチテナント機能を利用すると、 次のようなシナリオでランドスケープのシンプル化が可能となります。これまで、SAP HANAを分析プラットフォームとして利用したり、SAP Business Warehouse powered by SAP HANAとSAP Business Suite powered by SAP HANAを別のシステム上で稼働していたお客様は、これを統合して単一のシステムのマルチテナントデータベースとして稼働させることができます。また、本番機、検証機、開発機を同一のシステム上のマルチテナントデータベースとして稼働させれば、ハードウェアの集約も可能になります。
ダイナミックティアリング機能
インメモリーに最適化されたテーブルに加えて、ディスクに最適化されたテーブルの利用が可能になります。
SAP HANAは、データをすべてメモリー上で処理する完全なインメモリーデータベースプラットフォームです。すべてのデータをメモリー上に展開するため、データベース管理者やユーザーは、どのテーブルをメモリー上に展開させるか考慮する必要がまったくありません。インメモリーを謳っている他社のデータベースの場合、わざわざデータベース管理者が、アクセスが多いテーブルを、アクセス統計情報を提供するウィザードを使いながら、どのテーブルをメモリー上に展開するか検討しながら作業するという手間がかかります。頻繁にアクセスするテーブルなら問題ないかもしれませんが、もしユーザーがメモリーにないテーブルをSQLに含めたら、クエリーはいつまで待っても返ってこないでしょう。
とはいえ、ペタバイト級のデータボリュームに対応する場合、インメモリーカラム圧縮の効率性のおかげで、データ容量を大幅に削減できるものの、すべてをメモリー上にロードすることが現実的でないケースも存在しました。そこで、SAP HANAではこれまで、スマートデータアクセス機能を提供して、Hadoopなどのビッグデータ分散基盤へのアクセスを提供していました。
SPS9では、ダイナミックデータティアリング機能を利用することで、テーブルの保存先として従来型のディスクを選択することが可能になりました。SAPはSybaseの持つカラム型の特許を多数保有しており、これを活用してディスクに最適化されたテーブルも高速に、かつインメモリーテーブルともシームレスにテーブル結合を行うなどの連携が可能になります。SPS9時点では、インメモリーテーブルとディスクテーブルは別々のテーブルですが、将来のリリースでは、ハイブリッドテーブルなども計画しています。
スマートデータインテグレーション/スマートデータクオリティ機能
データのロード、変換、クレンジング、エンリッチメントの機能を追加しました。これまで、SAP HANAへのデータロードはSAP Data Servicesに代表されるETLツールを利用して行っておりました。今回、SAP HANAへのデータロードに、このスマートデータインテグレーション機能を利用することでSAP HANAプラットフォームで一貫してデータロードも行えるようになりました。リアルタイムのプッシュによる差分データ受信、バッチプルモードによる差分データロードが可能です。
データソースとして、SAP ERP、一般的なデータベース、Hadoop、HIVE、oData、Twitterに対するアダプターを提供しアクセスが可能なほか、対応していないデータベースに対してはアダプターSDKを提供します。
同時に、データクオリティ機能も提供され、住所情報のクレンジングや、地理空間情報機能の拡張として、住所から緯度経度情報を付加するジオコーディング機能にも対応しました。
スマートデータストリーミング機能
大量のストリーミングデータをリアルタイムで処理・分析する機能を追加しました。Sybase Complex Event Processingで作成したプロジェクトファイルに対しても、マイグレーションウィザードを提供し、移行をサポートします。
ACID準拠の高性能グラフストレージ/エンジン機能
エンタープライズデータや、相互関連性の高いソーシャルネットワークやサプライチェーンのデータ処理に利用できます。たとえば、SAP子会社のSuccessFactorsのソリューションの場合、SAP HANAのグラフ機能を使用することで、トランザクションとグラフのデータを統合管理し、これまで隠れていた洞察や複雑すぎて計算できなかった洞察を見出すことで、学習者の特定や学習材料の推奨に役立っています。
統計解析機能(Predictive Analysis Library)
新規アルゴリズムのサポートとして下表の解析手法に対応し、合計60を超える解析手法が利用可能になりました。また、既存アルゴリズムの拡張も行われています。また、ユーザーインターフェースであるApplication Function Modelerのデザインも一新され、SAP HANAのデータインテグレーションやストリーミングなどの拡張機能と共有のデザインを採用し、生産性を向上させています。
カテゴリ | 手法 |
分類 | ニューラルネットワーク |
クラスタリング | K-medians |
多変量解析 | 主成分分析 |
時系列分析 | ARIMA-X、2次指数平滑化、単純線形回帰による予測、季節性を考慮した線形回帰、クロストン法、ブラウンの単純指数平滑化 |
アソシエーション | KORD(K-optimal Rule Discovery) |
系列データ
スマートメーターや、プローブデータ、センサーデータなどの30秒毎、15分毎といった一定間隔毎に送られてくる系列データに専用のテーブルを提供します。系列データ専用のカラム型辞書圧縮アルゴリズムを利用することで、タイムスタンプデータを効率的に圧縮して格納可能です。これにより、日次、週次といった、時系列データ特有の集計に対応します。SPS9では、共分散分析、スピアマンの順位相関などに対応し、将来のリリースでは時系列予測手法にも対応を予定しています。
テキストマイニング機能
大量のドキュメントから関係性とパターンの発見を可能にするテキストマイニング機能を提供します。たとえば、科学技術系の論文や研究開発におけるさまざまなドキュメントに対して、キー用語を抽出し、キー用語によるグループ化が可能になります。SPS9では英語のドキュメントにのみ対応します。
Hadoop連携機能
SAP HANAのHadoop対応ユーザー定義関数(UDF)によりSAP HANAがマップリデュースにアクセスすることで、Hadoop内のジョブを直接実行できます。従来はスマートデータアクセス機能や、HIVEを利用してアクセス可能でしたが、ユーザー定義関数をSAP HANAからJavaコードを直接定義して実行することでより高度な連携シナリオが可能になりました。
運用管理機能
SAP HANAが、従来旧Sybase製品だけに対応していたSAP Database Control Center(SCC)に新たに対応し、SAP製のデータベースである、SAP ASEやSAP IQを含めて、ランドスケープ内のデータベース管理が統一されシンプルになります。
個々のSAP HANAインスタンスとテナントデータベースは、SAP HANA Cockpitで行います。SAP Fiori Launchpadベースで提供され、タイルを利用した直感的なデザインになっています。クエリーパフォーマンス分析ツールのPlan Visualizerも改良されています。
ワークロード管理
エマージェンシーサポートモードを新たに導入し、システムが無応答になった場合にも、第3のコネクションを通じてSAP HANAサーバーにアクセスが可能となり、不要な再起動を回避できます。OLTP/OLAPの併用時にはOLTP優先モードを設定してトランザクション系の処理を優先することが可能です。OLAPにおいて、特定のヘビーユーザーが重たいクエリーを実行した際に、その他のユーザーへ影響を与えないように、個別のユーザー単位でメモリー使用上限が設定可能です。各種SAP HANAプロセスのCPUバインディングなども可能です。SQLクエリーの優先度も設定可能になりました。これらのワークロード管理機能により、システムの安定性をより強固にします。
プラットフォームライフサイクル管理
SPS8まで部分的に分かれていたツール群が、SAP HANA Database Lifecycle Managerに統一されました。SAP Fioriを利用してデザインされており、SAP HANAのアップグレード、追加コンポーネントのインストール、さまざまな設定の変更を行うことができます。
アプリケーションライフサイクル管理
SAP HANAの開発オブジェクトの移送管理など、アプリケーションのライフサイクルを管理します。従来JAVAスタックが必要だったCTS+での移送は、HTTPで行うことにより、SAP HANAのみで実施が可能になりました。アプリケーションのアセンブルが可能となり、パートナー企業が開発したSAP HANAアドオンアプリケーションの配布インストールがよりシンプルになりました。
以上、SAP HANA SPS9の最新機能をご紹介させていただきました。SPS10はまた、半年後にリリースを予定しており、その際にまたアップデートをお届けしたいと思います。
ご質問はチャットやWebからも受け付けております。お気軽にお問い合わせください。
●お問い合わせ先
チャットで質問する
Web問い合わせフォーム
電話: 0120-554-881(受付時間:平日 9:00~18:00)