The SAP HANA Effect


SAPジャパンでリアルタイムコンピューティング事業本部およびCo-Innovation Labを担当しております馬場です。新連載の公式ブログ「超リアルタイムビジネスが変える常識」、お楽しみいただけておりますでしょうか?

2年ほど前、現在のCo-CEOが就任した際に「イノベーションを全ての戦略の中心に据える」と表明して以降、私どものお客様・パートナー企業・社員が歓喜する製品が投入されるようになり、それらがお客様の元で稼働を迎えるとお客様はもちろん、その先のお客様、時には一般消費者までが歓喜するということが生まれるようになってまいりました。

そのイノベーションの中心、SAP自身のリニューアルの中心となっているSAP HANA(インメモリ・コンピューティング時代の新データベース)について私自身の本ブログ初投稿として取り上げさせていただきたいと思います。

5月3日、日本ではゴールデンウィークだった時、私の携帯電話に「+1 650…」、パロアルトから電話がきました。私どものエグゼクティブ・ボードメンバーでテクノロジー&イノベーション・プラットフォームを担当するCTO、ビシャル・シッカからの電話でした。私のような個人に直接度々電話してくる現場好きの彼は、SAP HANAソフトウェアのプログラム・コードも自分で未だにレビューする叩き上げのサイエンティストでもあります。

その同じ日に彼が投稿したブログをご紹介したいと思います。スタンフォード大学でコンピューター・サイエンスの博士号を持つ彼らしく、ブログタイトルは「The SAP HANA Effect」。物理学における「ドップラー効果(the Doppler Effect)」のように、コンピューター業界の普遍のサイエンスであると主張するがごとく名付けられた彼のこのブログの内容は、全てが事実に忠実に書かれており、このビジネス・イノベーションのブログをご覧になっている皆様に、それを可能とする技術パラダイムをご理解いただく上で、ぜひお読みいただきたいと思います。

生まれてから30年、大きな変化が起こっていないデータベース管理ソフトウェアが、基本アーキテクチャーの転換によって、多くの人の常識、発想を転換させている様が見て取れます。まさに時代の変わり目だと思います。コンピューター・サイエンス史の教科書にこの「The SAP HANA Effect」が掲載されることになるかはわかりませんが、ぜひ彼の主張とそれを信じるお客様と共に実証している「事実」をお読みいただければと思います。”人生は、間違った情報にとらわれて過ごすには短すぎますから。(ビシャル・シッカ、CTO、SAP AG)”

出典: https://www.experiencesaphana.com/community/blogs/blog/2012/05/03/the-sap-hana-effect

(以下日本語訳)

とある競合企業は、最近公開されたWebinarで、SAP HANAについて正しい情報を持っていないことを露呈したうえに、不十分かつ不正確な認識をIT業界と金融アナリストに示しています。

我々SAPは通常、この手の話は取り合いません。しかし今回は「私たちは正しいことを成さねばならない」と考えました。こともあろうに、データベース業界の立役者でありリーダーであるあの会社が、次世代データベース技術のトレンドについてここまで根源的に無関心でよいのだろうか?それとも彼らはただ単に現実を認めたくないがために、間違った情報を広めることで乗り切ろうとしているのだろうか?

私たちSAP HANAチームは、3つのことに情熱をかたむける人たちのグループです--SAP HANAのお客様を成功に導く、仕事を楽しむ、そして現状を疑う。この精神にのっとり、SAP HANAチームを代表して、競合某社が提示している不正確な情報を訂正し、かつそれを楽しんでみたいと思います。

■SAP HANAのアドバンテージ

はじめに、3つのポイントについて申し上げます。(a) 某社が提示している“昨日までの技術やアプローチ”との比較は、そもそもまるで的外れです。(b) SAP HANAのお客様は“今日の技術”の驚異的なメリットを(なんの混乱もなく)享受しています。(c) SAP HANAは、次世代のエンタープライズ・コンピューティングとくにデータベース技術を代表しています。

SAP HANAは、リアルタイム分析とリアルタイムアプリケーションのための最新のデータプラットフォームです。SAP HANAにより、膨大な量および種類のデータをリアルタイムで、つまりデータが発生すると同時に、分析することが可能になります。業務系と情報系というシステムの重複や、業務系から情報系へのデータコピーに伴う遅れを排除し、“真の”リアルタイムが実現するのです。

SAP HANAの優位性は、さまざまなコンポーネントがひとつに統合されており、完全なトランザクション処理能力を備え、かつシステムオプティマイザーとも緊密に統合されている点にあります。OLTP、OLAP、テキスト、計画、その他すべてのアプリケーション・コンポーネントに対して、スケールアップとスケールアウトはシームレスに働きます。したがって(某社製品のような)“サーバー動物園(多種多様なサーバーの乱立)”なし、内部レプリケーションなし、かさばるデータ集約なし、複数エンジンの詰め込みなし、のシンプルな構造が実現するのです。

以下の私の解説では、こうしたすべての情報を詳細にお伝えしていきます。またSAP HANAの真実を継続的にお伝えするため、このブログは定期的に更新していきます。では、某社の誤った情報を訂正していきましょう。

■#1 将来のデータベース・アーキテクチャーの中心

誤:「将来インメモリDBMSが、リレーショナルDBMSのほとんどあるいはすべてに置き換わることはないだろう」

正:インメモリDBMSは、将来のデータベース・アーキテクチャーの中心に位置しています。OLAPとOLTPの両方をサポートするように設計されており、学界での盛んな研究もそれを裏付けています。すでにデータベース市場の大きなパートを占めつつありますが、とくに分析、計画、シミュレーション、リアルタイムアプリケーション(例えばオンラインゲーム)などのパフォーマンスが重要な市場において顕著です。インメモリーDBMSは、クラウドやOLTPアプリケーションがしたのと同様に、エンタープライズ市場を変革していくでしょう。

■#2 データベース・プラットフォームの役割

誤:「インメモリー・データベースは限定的なことしかできない--例えばMOLAP、ERPレポーティング、クエリーと分析、計画と予算策定、非構造化情報の発見など」

正:SAP HANAは汎用的なインメモリーデータベース・プラットフォームです。業務系の最新データを扱い、ACID特性に完全準拠しつつトランザクションを処理し、データ発生と同時にそれらを分析することができます。ビジネス/予測/計画ロジックをデータベース側にプッシュダウンして処理し、またアナリティクス/クラウド/モバイル・アプリケーションなどのサーバーとなってクライアントにデータを提供することもできます。

某社が自らのインメモリー製品について述べている上記のような限定的なユースケースとは異なり、SAP HANAはメインストリーム・データベースであり、それひとつで幅広い用途に適用可能です。某社製品のように複数の技術と重複したエンジン(例:テキストのEndeca、計画のEssbase、キャッシングと分析のTimesTen)を買い、ひとつのボックスに詰め込む必要はありません。

■#3 データ量の増加&NUMAをサポートするスケールアウト

誤:「SAP HANAはスケールアウトできず、データマートやデータウェアハウスとしての用途には制約がある」

正:SAP HANAのコア数/ノード数は事実上無制限にスケールアウト可能であり、また(HWパートナー7社から提供されているSAP HANAサーバーの)ハードウェア価格は下落し続けています。昨年5月のSAPPHIRE NOWカンファレンスの時点ですでに、SAPのハッソー・プラットナーは32ノード/コア数1,000以上のSAP HANAシステムをプレゼンテーションしていましたが、現在ではコア数1,000以上のシステムが世界に3つ稼働しています。またすでにIBMとHPを含む複数のHWパートナーがスケールアウト構成のアプライアンスを販売しており、実際に多数のお客様がマルチノードのスケールアウト構成で稼働中です。

また我々が最近行った100TBベンチマークでは、16ノードのIBM X5サーバーにノードあたり0.5TB(合計8TB)のメインメモリを積んだ構成で100TBのBWデータを処理し、ERPレポーティングシナリオでは300ミリ秒~500ミリ秒、アドホック分析クエリでは800ミリ秒~2秒という結果を出しています。さらにデータは、エイジング基準などSAP HANAの標準メカニズムを使ってスワップアウトすることができます。SAP HANAはNUMAアーキテクチャーをサポートしています。

一方オラクル社Exalyticsに関する公開ドキュメントは、Exalyticsの1TBの制限を強調しています。さらに彼らは公然と、この1TBのうちの大きな割合がExalyticsに積み込まれているEssbase+Endeca+TimesTenのワーキングメモリとして消費されると認めています。

■#4 OLTP&OLAP

誤:「SAP HANAには“書き込みパフォーマンスの制約”がある」

正:SAP HANAは、1つのハードウェア・1つのOS上でOLTP+OLAPを動かすことができるデータ基盤です。スケールアップとスケールアウトに対応しており、(小型システムから1,000コア以上のマルチノードに至るまで)高い拡張性があります。またSAP HANAは、列ストアでありながらインサートが可能な唯一のインメモリーデータベースであり、高い書き込み性能と高い分析性能を併せ持っています。これはSAP HANAの大きな差別化要因のひとつです。

■#5 行、列、テキスト

誤:「SAP HANAは非構造化データをサポートしておらず、また行・列の圧縮を提供していない」

正:SAP HANAは1つのデータベース内に行、列、テキストを格納しており、非構造化データもネイティブでサポートしています。さらに、これらが統合されていますので、全ての格納データ種類にまたがるトランザクション処理や分析もシンプルになります。

実際、SAP HANAの要素技術となったT-Rexは非構造化テキスト検索エンジンでした。標準的なテキスト検索やテキストマイニングはもちろん、構造化データに対する検索も可能です。

また形態素解析エンジンInxightが提供するタグ付け、特徴抽出、エンティティ抽出、感情分析などの言語処理機能がSAP HANAに含まれます。 Inxightは、市場で最高のテキスト解析ソフトウェアです。

SAP HANAは、列ストアに対しては高い圧縮率をサポートしています。一方、行ストアについては高圧縮は必要ありません。なぜなら、行ストアは列ストアのバッファとして使われるか、圧縮が必要ないテーブルに対してのみ使用されるからです。アプリケーションスタックとのインテリジェントな統合により行ストア圧縮を無関係にできるのは、SAP HANAの大きな利点のひとつです。

■#6 データのキャッシングとクエリの最適化

誤:「SAP HANAとTimesTenはどちらもデータをキャッシュする」

正:前世代のデータベースは、パフォーマンスを向上させるためにキャッシュを使用しています。しかしSAP HANAは、新しいアーキテクチャーパラダイムに基づく、純粋なインメモリーDBです。データベース全体がメモリー上にあるため、SAP HANAはデータをキャッシュしません。

またSAP HANAは世界トップクラスのクエリオプティマイザーを備えており、大規模並列クエリ(単一演算はもちろん複数演算の並列処理を含む)の実行をネイティブでサポートしています。

■#7 ACID特性とトランザクション整合性

誤:「SAP HANAはトランザクション整合性やMVCC(マルチバージョン同時実行制御)を欠いている」

正:SAP HANAはACID完全準拠です。永続性の保証およびバックアップのため、SSDとHDDを組み合わせた永続的なストレージシステムを備えています。またMVCCにも完全準拠しており、文レベル分離/スナップショット分離などの標準的な機能を備えています。

■#8 集計およびマテリアライズド・ビュー

誤:「高いパフォーマンスを出すためには、集計データのマテリアライズド・ビュー(実際にデータを集計し保持する物理的なビュー)が必要だ」

正:またもや「アハ!」です。電気自動車にはガソリンエンジンのスパークプラグは必要ありません。SAP HANAはマテリアライズド・ビューは持たず、メモリー上に明細データを保持しつつその都度オンザフライ(即時)集計するやり方で、はるかに高いパフォーマンスを発揮します。作成・重複データの格納・変更の管理に多くの労力を要とする「集計」は、もはや古い技術です。

SAP HANAには、旧来型データベースの考え方やパフォーマンス指標はあてはまりません。インメモリー・データベース全体に渡り、データセットのすべてのディメンションがインデックスのように動作します。

■#9 ビジネス・インテリジェンス・クライアント

誤:「SAP HANAは、一部のBIクライアントを限定的にサポートしているだけだ」

正:SAP BusinessObjectsはSAP HANAでの実行に最適化されています。しかしそれに加えて、多数のサードパーティー製のクライアント(例えばタブロー、TIBCO Spotfire)からも接続可能です。サードパーティー製のBIクライアントとSAP HANAの組み合わせについて、SAPは将来にわたり完全にオープンであり続けます。

■#10 Planningアプリケーションおよび分析機能

誤:「SAP HANAは、一部の計画・予算策定アプリケーションを限定的にサポートしているだけだ」

正:SAP HANAは計画アプリケーションを完全にサポートしています。多数のSAP EPM(エンタープライズ・パフォーマンス・マネジメント)アプリケーションがすでにSAP HANA上で稼働しています。またSAP HANAは計画エンジンを搭載しており、DB内での計画計算をネイティブサポートしています。さらにSAP HANAは分解やコピーなどの演算子を含むリレーショナル代数を内蔵しており、またSAPの計画言語FOXをネイティブサポートしています。

限定的どころか、計画はSAP HANAにとって大きな要点のひとつです。SAP HANAはオンザフライ(即時)に計算を行うため、ありがちなキューブ操作を必要としません。またSAP HANAは、数学関数、通貨換算、単位変換、例外的な集計、時系列分析、階層処理および予測関数などの主要な分析関数およびビジネス関数をライブラリとして持っており、さらに他のライブラリへのサポートも拡張しました。

SAP BW on HANAでは、計画計算をアプリケーション側からSAP HANA DB側にプッシュダウンし、さらにパフォーマンスを高めています。今後SAP HANAは、SAPのすべての業務系アプリケーション、BW、BI、クラウドアプリケーションをサポートしていきます。また多数のサードパーティーパートナーが、SAP HANA上でネイティブに作動する計画アプリケーションを開発しています。

■#11 ERPレポーティング&データソース

誤:「SAPのERPレポーティング機能は限定的である。なぜなら同社のレプリケーション/ETL技術は一部のデータソースにしか対応していないからだ」

正:SAPは「CO-PAアクセラレーター」をはじめとする非常に優れたリアルタイムERPレポーティングソリューション群を持っています。そのほとんどがSAPアプリケーション以外のデータソースにも対応しています。

SAP Data ServicesとSAP Sybase Replication Server、SAP Landscape Transformationは、SAPおよび非SAPデータソースからデータを移送する、ETL/レプリケーション市場のリーダーです。

またSAP HANAは大規模並列処理により、1時間あたり2TB以上と非常に高いバルク挿入速度を実証しています。

■#12 価格設定

誤:「SAP HANAはExalyticsより5~50倍高価。1TBのSAP HANAは、ハードウェアに36.2万ドル、ソフトウェアに375万ドルかかるだろう」

正:1TBのSAP HANAのハードウェアコストは4万~6万ドルでしょう(36.2万ドルではない)し、ソフトウェアコストもまた上記で喧伝されているよりはるかに安価です。また、SAP HANAは、さまざまな市場セグメントの価格帯でご利用いただけます。

中小企業向けのSAP HANA Edge Editionはそれに見合った価格(例えばハードウェアはシングルノードで1.2万ドル+SAP BusinessOne Analytics用HANAライセンスは2千ドル)ですし、一方でメモリが100TBを超える大規模シナリオまで幅広くあります。

SAP HANAをアプリケーション(BW、BPC、CO-PA、スマートメーターアナリティクスなど)向けに購入されるお客様もいらっしゃるでしょうし、データマートやデータウェアハウス用途で購入する方もいるでしょう。40TBのデータウェアハウスとしてのBW on HANAは非常に競争力があります。

またSAP HANAの価格には、本番、開発、テストおよびQA環境とサポートなど、お客様が必要なものがすべて含まれています。データのロードや移動、ストレージ加速(例えばExadata)などのために他のソフトウェアを購入する必要はありません。これらを考慮すると、たとえば512 GBの構成で、SAP HANAの総コストは、競合製品の総コストの50%以下です。

■#13 標準規格とオープン性

誤:「SAP HANAはSAP製ツールでのみ動作し、また標準的なSQLに対応していない」

正:SAP HANAユーザーのかなりの割合が、SAP/非SAP両方のアプリケーションのデータを使ったユースケースにSAP HANAを使用しています。SAP HANAは標準SQLおよびMDXに準拠し、あらゆるアプリケーションのための標準インタフェースを備えています。SAP HANAはすべてのレイヤにおいてオープンです。

・オープンなハードウェアベンダー選択

・オープンなBIクライアント選択

・オープンなアプリケーションおよびプラットフォーム選択

・数百ものカスタム(非SAP)アプリケーションがSAP HANA上で開発中

例えばOracleのアプリケーションとOracle BIは、SAP HANA上で変更することなく実行できます。既存のOracleストアドプロシージャは(知的財産面の理由により)SQLscriptに変換するだけで実行可能となります。これはSAP HANAの完全な開放性を示しています。

■#14 ディスク上のSAP HANA

誤:「SAP HANAは、ディスクに格納されているデータをサポートしていない」

正:SAP HANAはディスクに保存されているデータをサポートしており、LRU(Least Recently Used)のような優先順位付け手法を利用できます。メモリー上に利用頻度の高いデータを維持しておき、ディスク上のデータは要求に応じてロードすることができます。

■#15 クエリの速度

誤:「SAP HANAは、他のデータベースよりも高速にクエリーを実行しない」

正:SAP HANAは、列ストア内のすべてのデータを整数形式で保持し、またベクトル演算のCPUの開発などインテルの最新技術革新を最大限に活用できるよう最適化されています。SAP HANAの次世代アーキテクチャーとチップレベルのイノベーションの組み合わせにより、SAP HANAは市場にあるどのデータベースよりも高速です。その一例として、SAP HANAユーザーのうち4社はすでに(演算レベルでなく)ビジネス・プロセスのレベルでの速度を100,000倍以上改善させました。最速は物流/小売データ分析で408,000倍の改善を達成したMKI社です。

■#16 SAP HANAは、Exadata&Exalyticsよりも遅い

誤:「SAP HANAは、Exadataよりも遅い。もちろんExalyticsよりも」

正:ある顧客企業の実環境における「信用チェックと与信限度の検証」というビジネス・プロセスでの比較では、SAP HANAは、Oracle Exadataに比べ15,000倍以上速かったという事実があります。

このリアルタイムのパフォーマンスと比較してみてください--トランザクション用(Exadata)、インメモリーではない分析用(EssBase)、インメモリー・アクセラレーション用(TimesTen)、テキスト処理用(Endeca)とそれぞれ別のモジュールを複数の冗長な箱に詰め込み、それらの間でデータを重複して持ち、また当然モジュール間のデータコピーに伴う遅延が発生する、というアーキテクチャーを。実際には、我々はこうしたお客様をいくつも見ています。

市場における現在のアプローチ
SAP HANAの新しいアプローチ

■#17 インストールおよび導入

誤:「SAP HANAはインストールするのに数日かかり、導入するには数か月あるいは数年かかる」

正:SAP HANAをデータセンターにインストールするのにかかる時間は数分から1時間以内です。また間もなく、当社または当社のパートナーが提供するクラウドからの利用も可能になります。イタリアのProvimi社では、収益性分析を稼働させるのに3週間しかかかりませんでした。

 ■#18 タイム・トラベル

誤:「データベースは一般に、オーバーヘッドを発生させずに時系列のレポートを表示することが苦手である」

正:SAP HANAでは、レポート(例えば、日次の予実比較)に対して時間軸の横断を行うことができます。例えばスライダーを使用して時間軸を移動すると、オンザフライ(即時)にレポートが作成され表示されます。いちいちインデックスやビューを作り直す必要はありません。

 ■まとめ

ここまで、私は「事実」だけを提示してきました。SAP HANAの真の姿を理解いただけたものと思います。

SAP HANAのパフォーマンスは、従来の「データベース市場」を揺さぶっています。SAP HANAは1つのハードウェアと1つのOS上で稼働するOLTP + OLAPのための単一基盤であり、Mac-miniから1000コア以上のサーバークラスタまで幅広いハードウェア上で実行可能です。その技術的な特長のうち、我々がとくに重視しているのは次の5点です。

  1. 爆発的に拡大するデータボリュームに対応 (ええ、御社の成長とともにスケールし、またディスクベースのストレージとも連動します)
  2. 構造化および非構造化データの両方に対応 (ええ、テキストおよびマシンデータを含みます)
  3. 最新データのリアルタイム解析 (ええ、真のリアルタイムです)
  4. 高速なインタラクション (ええ、人の思考の速度で、です)
  5. データベースをチューニングする努力は不要 (ええ、シンプルで安価です)

これらは、ケタ違いなパフォーマンスの改善を実現します。SAP HANAは、顧客とのインタラクション、財務やサプライチェーンのパフォーマンスなど、さまざまな分野に革命を起こし、ビジネス競争上の圧倒的な優位性を企業にもたらしています。たとえば中国最大手のミネラルウオーター会社Nongfu Spring(Oracle DB比で22,000倍のパフォーマンス改善を達成)のような顧客は、Oracleのスイッチをオフにしつつあります。

我々は今、新たなフロンティアを形成しつつあります--たとえば医療分野ではゲノム解析に革命を、また世界中の何億人もの顧客にEコマースとリアルタイムバンキングを、あるいは現代のさまざまな大きな課題に対しても。

時代はこのあらたな地平を追求することを求めています。「世界を過去の増分として考えるのではなく、すでに可能であることは分かっているテクノロジーによって形作られる驚異」として。

人生は、間違った情報にとらわれて過ごすには短すぎますから。

●お問い合わせ先
チャットで質問する
Web問い合わせフォーム
電話: 0120-554-881(受付時間:平日 9:00~18:00)