「30時間一本勝負」でビッグデータ活用のヒントをつかんだ英国航空


Bafleet上司から「○○ができるか実機で検証してこい、ただし30時間以内に」との指示が来たら、あなたならどうするだろう?30時間で何ができるというのか!?

■InnoJamとは

SAPはTech ED(テクノロジー・エデュケーション)という、技術者向けの大規模なイベントを年に数回、世界各地で開催しているが、その中に「InnoJam」というセッションがある。InnovationとJamセッションを組み合わせた造語だ。一般用語でいえば、プロトタイピングのコンテスト、というところか。

出場チームは、あらかじめ「解決してみせたい課題」と「その前提となるデータ」を提示してノミネートされている。各チームに対してはSAP HANAサーバーや分析ツール「SAP BusinessObjects」のテスト環境、それにこれらツールに精通したSAPのエキスパート技術者がアサインされる。

各チームはそれぞれが持ち込んだデータをSAP HANAにアップロードし、SAP HANAのスーパーパワーを活かして課題解決につながるプロトタイプを作ろうとする。ただし与えられる時間は30時間きっかり。朝8時に一斉に開始し、翌日14時からはもう参加者と審査員の前でその結果を披露しなくてはならない、というコンテストである。寝ずの30時間でどこまで「クールな」データ分析モデルが作れるかを競う、いかにも“技術者の祭典”らしいコンペティションだ。

Innojam03

基本的にはエンジニアのための技術コンテストであるため、持ち込まれる「課題」や「データ」は架空のものである。当然、各人の所属企業の問題意識からヒントを得ていることが大半であるが、技術コンテストという“お遊び”のために実データを持ち出すことを許可する企業はこれまでなかった。

ところが。2011年11月のTech Edマドリード(スペイン)には、世界最大の航空会社のひとつ、英国航空(ブリティッシュ・エアウェイズ)が、実データと実課題を持ち込んで参戦した。そして若者チームに交じってSAP HANAをブン回し、たった30時間で初期的なモデリングを作ってのけたのである。

■英国航空が実データとともに参戦

航空業界用語にrunway excursion 「滑走路逸脱」というのがある。航空機が制御されていない状態で、または予期しない形で滑走路を外れる事象を指す。

過去14年間、航空業界全体では毎年30回前後の滑走路逸脱が報告されており、これは全航空事故の25%以上を占めている。近年、航空業界全体の安全性は高水準で安定している中、トラフィックの増加に引っ張られる形で滑走路逸脱はおよそ年率6%の割合で増加している。

言うまでもなく航空会社にとって安全性は経営の根幹である。しかし安全とは、「墜落などの重大事故を起こさない」ということに限られるのではない。それよりはるかに多い軽微な事故あるいは事故未満に終わった事象、いわゆるヒヤリ ハットを抑制することが、結局は重大事故のリスクをも軽減させる。その意味で、滑走路逸脱への取り組みは、地味ではあるが重要なのだ。

英国航空(ブリティッシュ・エアウェイズ)の運航リスク管理部門も、もちろん、従来からこの取り組みを続けている。しかしさらに、SAPと共同で新たなアプローチを加えることにした。それがInnoJam参戦である。

Innojam09

英国航空が持ち込んだのは、以下の3種類のデータである。

(1) フライトレコーダー(いわゆるブラックボックス)からの飛行状況データ

(2) 過去5年分のインシデント(事故に繋がる恐れがあった事象)レポート

(3) Excelで200万行におよぶ航空機の検査・整備データ

英国航空とSAPのチームは、これらをSAP HANAにロードし、SAP BusinessObjectsの非定型分析ツールExplorerでかき回した。とにかく手探りでデータマイニングを行って、どこにどんな因果関係が存在しているか?を片っ端から探っていったのである。

とはいえ、では実際に何がリスクにつながる要因なのか?を探し当てて、利用に耐える「リスク・モデル」を構築するのは容易なことではない。なぜなら、容易に仮説が立つようなこと=明らかなリスク要因であれば、とっくに対応策は打たれているからだ。航空機に対する定期点検や整備はすでに念入りを極めている。そこからさらなる高みを目指すとすれば、これまでとは異なるアプローチを取る必要がある。

そしてそのひとつが、InnoJam参加=インメモリー・コンピューティングの能力を最大限に振り回すプロトタイピング実験だったのだ。

■SAP HANAのシンプルなハイパワーで非定型分析

通常の非定型分析では、「データ量」「精度」「分析効率(速度)」の3つがトレードオフになる。解析元となるデータ量を増やせば、それだけ精度は上がるが、分析効率(速度)は加速度的に遅くなっていく。What-if分析を1回かけるごとに、数時間、あるいは一晩待たされたのでは仕事にならない。したがって分析効率を上げようと思えば、データ量を絞り込み、精度をある程度犠牲にするしかない。

あらかじめ分析の切り口が決まっている「定型分析」の場合には、その方向に沿ったサマリーテーブル(中間テーブル)を作ることで、精度を落とさずに分析結果を出すことができる。たとえば、営業成績を「店舗単位」でなく「都道府県単位」でしか集計しない、と決まっている分析であれば、あらかじめデータを都道府県単位で集計した中間テーブルを作ることで解決できる。(ただし、後からやっぱり店舗単位も見たい、というわけにはいかない。その場合には、中間テーブルを設計しなおし、作り直す必要がある)

その点、SAP HANAには、インメモリーのハイパワーに裏打ちされた柔軟性が備わっている。素データをロードして、あとは分析ツール上で仮説検証を繰り返すだけ。キューブいらず、インデックスいらず、中間テーブルいらずでも回せる。シンプルそのものだ。だから30時間でなんとか形になる。

初期仮説すら立たないような状態では、キューブなど作っていられない。だから素データをそのまま振り回せるハイパワーが生きるわけである。

Innojam04
InnoJam会場の様子(30時間のトライアル後の発表会)

■あえてInnoJam

もちろん、InnoJamという形態自体は、どちらかというとお祭りでありイベントである。30時間ですべてができるわけでもない。見落としもあるだろうし、出来上がったものはラフな原型にすぎず、ブラッシュアップの余地もいくらでもあるだろう。

しかし、この英国航空のチャレンジを、技術オタクたちの遊び、と片づけられるものだろうか?

英国航空はSAPの大手顧客であり、当然、InnoJamではなく英国航空専用に環境を用意することもできた。が、あえてこの枠に載ってみることで、ノーコスト、ノーリスクでSAP HANAの可能性を”試して”みることができたわけである。

もしInnoJamでなく通常の「仕事」として取り組んだらどうなっていたか?伝統ある大企業のこと、SAP HANAの環境を用意し、専門家を揃え、事前検討に6週間+データマイニングに6週間かけ、費用も(SAPと英国航空のどちらが負担したかは別にして)1500万円くらいはかかったのではないか。そしてその稟議を通すために、さらに6週間?

ちなみに英国航空は、単にリスク要因を事後的にあぶり出すことだけを考えているわけではない。InnoJamに参加したパトリック・デイヴィス氏は以下のように述べている。

「運航乗務員のパフォーマンス、天気、空港、航空管制、航空機の種類、メンテナンス履歴など、の多くの要因を分析対象としています。そして、なんらかの要因が重なって滑走路逸脱などの事故のリスクが相対的に高いという状況が発生したら、リアルタイムに介入することも狙っています。たとえばモバイルデバイスに対してリアルタイムに通知したり、さらに是正措置を取ったりすることも含まれるかもしれません。」

Innojam06
英国航空のパトリック・デイヴィス氏(中央)とSAPのスタッフ

■ビッグデータへのシンプルな取り組み

今回英国航空が持ち込んだ3種類のデータは、テキスト情報などの非構造化データも含む、いわゆる「ビッグデータ」だ。

昨今のビッグデータ流行りを受けて、みなさんの勤務先の中にも「手持ちのビッグデータを活用せよ」という号令がかかっているところもあるのではないだろうか。

すでに大量に所有している、さまざまな種類の“ビッグ”なデータを、とりあえず一か所に集め、仮説検証を繰り返して「リスク・モデル」をつくり、次にそれにしたがって対応処置をリアルタイムに行っていく、というアプローチは、あらゆる業界、あらゆる企業において考えられるはずだ。

とはいえ、初期仮説すら立っていない段階では、最終的にどんな効果が出るのかもわからない。ビッグデータ時代に対応するにはビッグなIT投資が必要、と唱えているのはITベンダーだけで(苦笑)、大きな初期投資などできないのが普通だ。

となると、それをスマートに試してみた英国航空の取り組みはなんらかのヒントになるのではないか?

—–

英語という言語の壁もあり、日本企業にとってはInnoJamの「30時間一本勝負」はさすがに厳しいかもしれない。マドリードに技術者を3人派遣したら、それだけで数百万はかかってしまう。

しかしSAPジャパンのようなベンダーでは、たとえばProof of Concept(概念実証)と呼ばれる、実機検証サービスを実費程度のコストで実施している。要するにプライベート版InnoJamだ。30時間、寝ずに取り組む必要もない(笑)。

※当記事の情報は、公開情報をもとに筆者が構成したものであり、英国航空のレビューを受けたものではありません

■(1)SAP InnoJam Madrid: Sustainable Business (※要アカウント登録(無料))
http://www.sapvirtualevents.com/teched/sessiondetails.aspx?sId=634

各チームの成果プレゼン。全体では約96分のビデオだが、英国航空チームはトップバッターだったので、6分50秒~16分50秒のほぼ10分間でプレゼンしている。ただし画像はあまりよくなく、プレゼンテーションもいまひとつ(苦笑)

■(2)SAP InnoJam Madrid 2011 – Team British Airways
http://www.youtube.com/watch?v=iHfrgwrCgmM

英国航空チームのリーダー、パトリック・デイヴィス Patrick Davis 氏へのインタビュー。

■(3)SAP InnoJam ホームページ
http://scn.sap.com/community/events/innojam

—–

■以下、上記(1)ビデオのスクリーンショットを紹介。

Innojam01
今回の英国航空チームのソリューション全体像。SAP HANAにロードしたリスク、コントロール、インシデント、フライトレコーダー(ブラックボックス)、エンジニアリング(整備)データ、等を、(左上から)Sybase Event Insight (CEP)、SAP BusinessObjects Explorer、モバイルからそれぞれアクセスする。

Innojam05
SAP BusinessObjects Explorer上に集約されたデータ項目。

Innojam08
英国航空チームが作った「リスク・モデル」。

Innojam02_2
SAP HANAモデラー。SAP HANA上のデータをモデリングするツール。

●お問い合わせ先
チャットで質問する
Web問い合わせフォーム
電話: 0120-554-881(受付時間:平日 9:00~18:00)