異常検知から予知保全へ

機械学習やビッグデータを活用し、そこから本当の価値を得るには「異常検知」だけでは不十分です。予定外のシステム停止や過剰なメンテナンスコストを減らし、できる限りサービスを安定的に運用する。システムの変更によるリスクを可能な限り取り除きたい。そのようなニーズに対応できるのが予知保全です。

異常検知と予知保全

異常検知と予知保全はシステムをモニタリングするという部分は同じですが目的が異なります。すでに発生した問題を見つけるのが異常検知(Anomaly Detection)、まだ問題の起きていない状態から問題の発生を予測するのが予知保全(Predictive Maintenance)です。異常検知という言葉に、予知保全の意味合いも含めて使われていることもよくあるので、混同しないように気をつけましょう。

この異常検知や予知保全は、分野を問わず、近年よく耳にするようになりましたが、課題も多く、なかなか運用が定着しないというケースも多く見られます。

「いつもと違う」 ≠ 「異常検知」

一度に大量のデータを扱うことができるようになった現在では、機械学習などを利用することで、簡単に「通常と違う状態」を検出できるようになりました。その一方で、大量のアラートが発生し、本当に知りたい情報が埋もれてしまうという問題も起きるようになりました。これは通常稼働時のデータだけを利用して判断をしようとしている場合に起こる問題で、少しでも通常と異なれば、それらをすべて異常とみなしてしまうためです。シンプルなデータだけで、判断できるというメリットこそありますが、逆に言えば、これ以上精度を高めるすべがないと言うことにもなります。

このような従来型の異常検知の問題点を解決し、その利用シーンを更に推し進める技術の一つとして注目されているのが、AIOpsです。

AIOpsプラットフォームが提供する本当に使える異常検知

  • 騒々しい異常通知(アラートノイズ)をブロックし、必要なものだけをインシデントに変換
  • 閾値の自動計算と閾値変更の影響シミュレーション(What-IF分析)
  • 重大なインシデントを判断し優先度を設定
  • 発生したインシデントに関する解決の糸口や根本原因の特定
  • インシデントの自動回避と問題解決処理の自動実行(セルフ・ヒーリング)
  • 機械学習モデルのアップデートおよびデプロイマネージメント
  • グラフィカルな開発プラットフォーム

なぜ いま AIOps なのか?

これまでもビジネスデータやアプリケーションのログ、マシンログをモニタリングして、例外データや異常を検知するような取り組みは行われてきました。

しかし、増え続けるデータや複雑化を続けるシステムに対して、特定の情報だけを監視していても、検知できる問題には限度があるということはわかりきった事実です。

大量に検知されるアラート、増え続けるノイズ、増え続ける運用コスト、溜まり続ける従業員のストレス。そのような状況を改善するのがAIOpsの役目です。

AIの力を活用し、大量のデータから重要情報を取り出します。人間では気づけないような変化をとらえ、トラブルを未然に防ぐことができます。近年ではAIOpsの成熟度もあがり AIに適切なタスクを自動実行させトラブルを収束させることもできるようになってきました。

増え続けるデータ、複雑化を続けるシステムに比例して運用の負担・ストレスが増えていく。そのような運用方式ではいずれ破綻してしまうことは誰もがわかっています。いま AIOps に取り組まなければ 数年後には IT運用は更に大きな負担となっていることでしょう。AIOpsは、「デジタルトの重要性が一般に認められてきた」ことと「IT環境の複雑化・高度化」という 2つの要因によっていままさに推進されている取り組みです。

AIOps には どのようなデータが必要か?

あらゆる場所の

実際にどのようなデータが必要かは、目指すステージにより異なります。一般的に、AIOpsでは、アプリケーションのトレース情報やログ、インフラストラクチャの各種メトリクス、トランザクションの情報、SNMP、ネットワークの情報、デバイスやセンサーの情報、システム利用者の情報、さまざまなデータを利用します。

あらゆるデータを

このようなデータは従来の監視ツールでも利用していましたが、人間が運用しているときには、捨ててしまっていたデータでも、AIOpsでは有効なインプットになります。また、複数のシステムやドメインにまたがるデータを統合し、イベントの相関を検出できるのもAIOpsの特徴です。

まとめ

AIOps の導入は従来の監視・管理ツールを置き換えるということではありません。AIOpsツールが、従来の監視ツールの中心となり、データを統合・整理し、ビジネスや運用改善に利用可能な情報として提供します。AIOpsは、比較的新しい取り組みですが、すでに検証段階から本格的な運用に乗り出している企業も少なくありません。「AIとデータのちからを駆使して、組織のパワーを最大化し、生産性を上げてビジネスの価値を向上し続ける。」 AIOps に踏み出してみませんか。