UptimeX は、サイト信頼性エンジニアリング(SRE)、DevOps、およびプラットフォームチーム向けに設計された AIOps プラットフォームであり、インフラストラクチャのインシデントを自動的に検出し、診断し、解決することを目的としています。ログ取り込み、機械学習に基づく異常検知、自動修復プレイブック、大規模言語モデル(LLM)を活用した根本原因分析を統合することで、ダウンタイムと運用負荷を削減します。
このプラットフォームは、クラウド、Kubernetes、ハイブリッド環境をサポートしています。リアルタイムの信号分析とポリシー駆動型の自己修復アクション(サービスの再起動、ロールバック、リソースのスケーリングなど)を組み合わせることで、ユーザーへの影響を最小限に抑え、インシデント対応を効率化することを目指しています。
UptimeX は多様なソースからログを取り込み、リアルタイムでインデックス化します。その機械学習モデルは適応しきい値とパターン認識を適用して、日常的な変動から有意義な異常を区別し、アラートノイズを低減して対処すべきイベントに注力できるようにします。
異常が検出されると、UptimeX はサービスおよびインフラストラクチャ層にまたがって信号を相関付け、LLM を使用して説明可能な根本原因分析を生成します。事前に定義されたポリシーとワークフローに基づき、サービスの再起動、デプロイのロールバック、またはリソースのスケーリングなど、修復アクションを自動的に実行してシステムを安定化させることができます。
修復後、プラットフォームは RBAC 制御付きの監査ログとともに一連のイベント全体を記録し、インシデント後の要約を提供します。チームは自然言語でデータをクエリでき、過去のパターンとトレンド分析から導かれた将来の潜在的リスクを強調する予測を確認できます。
| レベル | 価格 | 用途 | 主な制限/機能 |
|---|---|---|---|
| スターター | $0/月 | AIOps 導入を検討している小規模チーム | 5GB/月のログ取り込み;基本的な異常検知;月5回の自動修復;コミュニティサポート |
| グロース | $299/月 | 本番ワークロード | 500GB/月のログ取り込み;高度なAI検知;無制限の自己修復;LLM 根本原因分析;Slack および Jira 統合;メールおよびチャットサポート |
| エンタープライズ | カスタム | コンプライアンス要件 | 無制限の取り込み;予測的防止;オンプレミス展開;カスタムAIトレーニング;専任サポート;SLA 保証 |
注:クレジットカード不要で14日間の無料トライアルを利用できます。