ガーディアンエージェント：AI監視・制御の新パラダイムとGartner AI TRiSMフレームワーク

「AIをAIで監視する」——これは比喩ではなく、Gartnerが2025年に「Market Guide for Guardian Agents」として正式に定義した新しいカテゴリだ。ガーディアンエージェント（Guardian Agent）とは、他のAIエージェントの動作を継続的に観察・評価し、ポリシー違反や異常動作を検知した際に自動介入する専用エージェントのことだ。AIエージェントが自律化・大規模化するほど、人間による監視は限界を迎える。その解決策が「AIによるAI監視」だ。

Figure 1 — ガーディアンエージェントのOERAサイクル

OERAサイクルはガーディアンエージェントが「AIエージェントを継続的に保護する」4段階プロセス（出典：Gartner, G00836388）

40%

2028年までにガーディアンエージェントが必要になるGenAI展開の割合（Gartner予測）

6.5倍

2025〜2028年のガーディアンエージェント市場の成長倍率予測

72%

AI TRiSM対策を導入した企業がAIインシデントを削減できた割合（Gartner調査）

Gartnerの定義：ガーディアンエージェントとは

Gartnerはガーディアンエージェントを次のように定義している：「AI TRiSMフレームワークにおけるAIガバナンスとAIランタイム制御を融合させた、自律的・信頼性・安全性を持つAIエージェント活動と成果を支援するエージェント」。

この定義が示す重要な点は3つだ。第一に「AIガバナンス」と「ランタイム制御」の融合——設計時のポリシー策定だけでなく、実行時にリアルタイムで動作すること。第二に「自律的」——人間の介在なしに対応できること。第三に「AI TRiSM（AI Trust, Risk and Security Management）フレームワークの一部」——点の対策ではなく統合的なガバナンス体系の構成要素であること。

AI TRiSMフレームワークとの関係

AI TRiSM（エーアイ・トリズム）はGartnerが提唱するAI信頼性・リスク・セキュリティ管理の統合フレームワークだ。4つのコンポーネントから構成される。

AI TRiSM Framework — 4コンポーネント

AI Trust（信頼性）

モデルの説明可能性、公平性、透明性の確保。「なぜそのアウトプットが出たか」を追跡できる仕組み。XAI（Explainable AI）ツールを活用。

AI Risk（リスク管理）

幻覚（ハルシネーション）、バイアス、プロンプトインジェクション等のリスクを特定・定量化。リスクベースのエージェント展開承認フロー。

AI Security（セキュリティ）

エージェントへの攻撃（プロンプトインジェクション、モデル汚染、データポイズニング）からの防御。IAM・ネットワーク分離・監視の統合。

AI Management（管理）

エージェントのライフサイクル管理、パフォーマンス監視、コスト最適化、コンプライアンス報告。ガーディアンエージェントはここに直接貢献。

ガーディアンエージェントはAI TRiSMの全4コンポーネントに横断的に機能する（出典：Gartner AI TRiSM Framework）

OERAサイクルの詳細：4段階の機能

ガーディアンエージェントの中核機能はOERA（Observe-Evaluate-Respond-Adapt）サイクルとして整理される。

フェーズ	機能内容	典型的な検知・対応例
Observe 観察	全エージェントのAPIコール、データアクセスパターン、出力内容をリアルタイムに収集・記録	エージェントが通常の10倍のAPIコールを実行していることを検知
Evaluate 評価	収集データをポリシールール・ベースラインと照合し、リスクスコアを算出。異常度を定量化	過去パターンとの乖離が閾値を超え、「異常な大量データアクセス」と判定
Respond 対応	リスクレベルに応じた自動対応を実行。軽微：警告ログ。中程度：処理を一時停止。重大：即時停止＋人間へ通知	エージェントへのアクセストークンを失効させ、セキュリティチームにSlack通知を送信
Adapt 適応	インシデント事例をポリシーエンジンに反映し、検知精度を継続的に向上。False Positiveの削減も含む	誤検知だったパターンをホワイトリストに追加し、次回からの警告を抑制

ガーディアンエージェントが防ぐ5つの脅威

ガーディアンエージェントが実際に防ぐリスクは多岐にわたる。Gartnerが特定した主要脅威は以下の5つだ。

プロンプトインジェクション：悪意のある入力によってエージェントの動作を乗っ取る攻撃。ガーディアンが入力・出力をリアルタイムサニタイズ
ハルシネーション連鎖：一つのエージェントの誤った出力が次のエージェントへの入力となり、誤りが増幅されるカスケード障害。出力の事実確認レイヤーを挟む
過剰なリソース消費：ループ状態に陥ったエージェントがAPIコストを爆発的に消費する。コスト閾値トリガーによる自動停止
機密データの不正外部送信：エージェントが意図せずPII・営業秘密を外部サービスへ送信するリスク。出力フィルタリングによる検知・遮断
権限昇格（Privilege Escalation）：エージェントが設計外の方法で権限を拡大しようとする動作。IAMシステムと連携した異常権限リクエストの自動拒否

主要ベンダーの比較

ベンダー	カテゴリ	ガーディアン機能の特徴
Cisco AI Defense	ネットワークセキュリティ	ネットワークレベルでのAIトラフィック監視、プロンプトインジェクション検知、データ漏洩防止
Palo Alto Networks	セキュリティプラットフォーム	AI Access Security、エージェント通信の可視化、CASB統合でのSaaS AIアクセス制御
Protect AI	AI/MLセキュリティ専業	MLモデルのスキャン・監視、サプライチェーン攻撃対策、OSSモデルの脆弱性検知
Credo AI	AIガバナンスプラットフォーム	ポリシーエンジンによる自動コンプライアンス確認、EU AI Act対応、リスクスコアリング
Arthur AI	AI監視・パフォーマンス	LLMの出力品質監視、バイアス検知、ドリフト検知、ガードレール実装

Caution — ガーディアンエージェント自体のガバナンス

ガーディアンエージェントは「他のエージェントを止める権限」を持つ。つまり、ガーディアンエージェント自体が最も厳密に管理・監視される必要がある。誰がガーディアンを管理するのか——この「Quis custodiet ipsos custodes（誰が守護者を守るのか）」問題に対応するには、ガーディアンエージェントには人間の管理者による直接監督と、詳細な監査ログが必須だ。

日本企業への適用：段階的導入アプローチ

ガーディアンエージェントの完全な自律動作（自動停止権限付き）は、組織内で相当の信頼が築かれた後に導入すべきだ。日本のエンタープライズでは以下の3段階が現実的だ。

導入ロードマップ — 3段階

Observe Only（観察のみ）

まず全エージェントのログ収集・可視化のみを実施。介入は行わない。「何が起きているか」を把握するフェーズ。期間：3ヶ月。

Notify & Review

異常検知時に人間へ通知し、人間が介入を判断。ガーディアンは「警告機」として機能。FalsePositiveのチューニング期間。期間：3〜6ヶ月。

Autonomous Response

高リスクパターンに対して自動介入を有効化。自動停止の権限は最初はサブセットのみ（外部送信系）から開始し、段階的に拡大。

Wing's View

ガーディアンエージェントは「AIをコントロールする最後の砦」ではなく、「AIを信頼して使うための基盤」として位置づけるべきだ。監視体制が整っているからこそ、より多くの業務をエージェントに委任できる。Wingでは、ガーディアンエージェントの導入を「AIエージェント活用の加速器」として捉え、ガバナンスと活用拡大を同時に設計するアプローチを推奨している。

ガーディアンエージェント：
AI監視・制御の新パラダイムとGartner AI TRiSMフレームワーク

Gartnerの定義：ガーディアンエージェントとは

AI TRiSMフレームワークとの関係

OERAサイクルの詳細：4段階の機能

ガーディアンエージェントが防ぐ5つの脅威

主要ベンダーの比較

日本企業への適用：段階的導入アプローチ

AI TRiSM設計とガーディアンエージェント
導入を Wing がご支援します

ガーディアンエージェント：AI監視・制御の新パラダイムとGartner AI TRiSMフレームワーク

Gartnerの定義：ガーディアンエージェントとは

AI TRiSMフレームワークとの関係

OERAサイクルの詳細：4段階の機能

ガーディアンエージェントが防ぐ5つの脅威

主要ベンダーの比較

日本企業への適用：段階的導入アプローチ

AI TRiSM設計とガーディアンエージェント導入を Wing がご支援します

ガーディアンエージェント：
AI監視・制御の新パラダイムとGartner AI TRiSMフレームワーク

AI TRiSM設計とガーディアンエージェント
導入を Wing がご支援します