「振る舞い」を学習してアノマリーを検出
2015年9月2日に開催された「SoftLayer Bluemix Summit 2015」のセッションでサイオステクノロジー 執行役員シニアアーキテクトの山﨑靖之が仮想分析プラットフォーム「SIOS iQ」の特徴や今後のロードマップについて説明しました。
テクノロジー2015年10月21日
仮想化環境を取り巻く実情とSIOS iQで解決できること
ビジネスを支える業務アプリケーション基盤が稼働するデータセンターや企業の情報システムに、仮想化技術が急ピッチで浸透しています。大規模なシステムになると、数百のホスト、数千の仮想マシン、数十万のオブジェクトが稼動することも。同時に、システム環境の複雑化が見過ごせなくなってきました。
「もしもの場合に人手で問題を解決することは『もはや限界』とも指摘されています」と山﨑は述べます。
問題を解決するには、まず原因を正しく把握する必要があります。しかし、一見、単純な事象であっても複数の原因が絡み合っていることが珍しくありません。何らかの不具合事象の結果が他の事象の原因になっている、といったケースです。
「このように複雑に絡み合ったシステムトラブルの原因究明や解決および再発防止策の立案におけるインテリジェンス化で注目されるのが、ITOA(IT Operation Analytics)というアプローチです。サイオスでは、このITOAの考え方をいち早く具現化する製品を発表しました。それがSIOS iQです」(山﨑)
SIOS iQは、VMware 仮想環境に存在する物理ホスト、ストレージ、ネットワーク、アプリケーションといった個々のオブジェクトの振る舞いと、それらの間にある相関関係を学習する高度な機能を備えます。
仮想環境分析プラットフォーム「SIOS iQ」
サイオスでは2015年2月に開発環境向けおよび実験・評価用のSIOS iQ Free Editionを発表。さらに7月には性能問題の原因分析および解決の推奨策を提示するレコメンデーション機能を追加したSIOS iQ Standard Editionをリリースしました。
オブジェクト間の因果関係を機械学習でモデル化
SIOS iQを支えている主なテクノロジーは、「vGraphグラフ理論」「機械学習エンジン」「PERCダッシュボード」。申請中の特許を含む3つの技術です。
「『vGraph』は、物理的なホスト、ストレージ、ネットワーク、仮想マシン、仮想ストレージ、仮想ネットワーク、アプリケーションなど、システム環境に存在するすべてのオブジェクトをノードとエッジでグラフ化し、SIOS iQにおける内部的なモデルとして表現する技術です。SIOS iQを一定時間稼動させていた状況からノード間、エッジ間がどのように依存しているのか、システムの振る舞いやオブジェクト間の関連性を分析・学習するための根幹の技術です」(山﨑)
次に、SIOS iQに組み込まれている「機械学習エンジン」とは、上述のvGraphによって表現されたシステム・モデルをベースに、各種のアルゴリズムを用いて分析・蓄積する機能に位置付けられます。
様々なアルゴリズムや技術が用いられていますが、その一例として山﨑は、振る舞いのパターンのクラスタ化(グループ化)にはk-means法、クラスタ間の境界線抽出にはSVM(Support Vector Machine)、既知の標本(既存クラスタに属するデータ)と新たな標本(新たに収集されたライブ・データ)における類似性の比較・分析には、データの共分散、2変量間の相関関係を考慮しているマハラノビス距離などが用いられていると述べました。
「既存の監視ツールは、あらかじめ設定した閾値から外れたものを『異常』と捉えますが、SIOS iQはそのような閾値やポリシーを一切使いません。まずは、仮想環境で一定時間システムを動作させる中で得られたデータを前述の各種アルゴリズムで分析し、『定常状態』を把握します。この常態から逸脱するオブジェクト(ノード)の振る舞いや数値を『アノマリー』として捉えることでオブジェクト間の複雑な因果関係をモデル化することができるのです」(山﨑)
vGraphで表現されたシステム・モデルを機械学習エンジンで分析し、アノマリーを検出する
その上で、機械学習に基づく分析結果を一覧化するのが、「PERCダッシュボード」です。 PERCとは、Performance(性能)、Efficiency(効率性)、Reliability(信頼性)、Capacity(容量)の頭文字を表すもの。ダッシュボードの一つ、PERC Map画面では、原因を作ったオブジェクトと、影響を受けたオブジェクトをそれぞれ一覧化することが可能です。従来の監視系ツールと異なり、アラート・ストームに襲われることなく、原因や問題解決策がシンプルに表示されるため、運用管理者が真因を見過ごしたり、経験や見解の差で対応策がまとまらなかったりする現場の混乱を避けることにつながります。
PERCダッシュボード
製品の拡充・機能強化を継続
山﨑はSIOS iQを用いた具体例として、「仮想環境においてアプリケーションの性能問題が発生した場合に原因をいち早く突き止めて解決するケース」、また「フラッシュ・リード・キャッシュ(FRC)を適切な設定値にして性能を改善するケース」、さらに「アイドルVMの検出、不要なスナップショットの検出により無駄に割り当てられていたリソースの最適化に対応する効率性分析のケース」について説明しました。
なお、現時点でSIOS iQに対応するのは、市場で高いシェアを持つVMwareをハイパーバイザーとする仮想環境に限られます。ただ、SIOS iQはOVAファイルとして提供されるためvCenterが稼動するVMware環境があれば、クラウドサービス(IaaS)であるIBM SoftLayerのベア・メタル・サーバーにも導入することが可能です。SIOS iQは監視対象のオブジェクトに手を加えず、情報収集用のエージェント不要で導入できることも特徴のひとつです。
また、SoftLayerの仮想サーバーは現時点で未サポートですが、「今後適用できるハイパーバイザー製品や対象とするクラウドを拡充することを視野に入れています」と山﨑は展望を示しました。
サイオステクノロジー 執行役員シニアアーキテクトの山﨑靖之
そのSIOS iQですが、2015年末に新バージョンが発表される予定です。現バージョンでは市場からのニーズの高い性能(パフォーマンス)問題を検出・解決するための機能強化が図られていますが、2015年第4四半期以降は、過度なリソースを割り当て最適化などの機能を追加した効率性分析をはじめ、信頼性、キャパシティーに関する分析機能が拡充される見通しです。
「学習した結果をどう分析して問題の未然防止などの予測機能に役立てるか、といった人の思考を代替できる機能に到達するのは、実はそう簡単ではありません。より精度を高めるための研究課題もあります。しかしサイオスではお客様の課題解決に向けた製品・機能のさらなる強化に挑戦していく方針です」と山﨑は新たなチャレンジに向けた意気込みを見せ、講演を締めくくりました。
(上)セミナー会場の様子 、(下)SIOS iQのブースでスタッフに質問する来場者の姿も目立った