AIエージェントは「暴走」するのか？進化と制御の最前線

2026年6月14日

あなたの会社のAIエージェントが、誰も止めないまま深夜中APIを呼び続けたとしたら？

2025年に実際に起きた「DN42スキャン事件」では、エンジニアがネットワーク調査をAIエージェントに依頼した際、「停止条件」を設定し忘れただけで、API呼び出しコストが雪だるま式に膨張し、運営者が破産寸前に追い込まれた。AIが悪意を持ったわけでも、バグがあったわけでもない。エージェントは与えられたタスクを「誠実に」実行し続けただけだ。

AIエージェントの高性能化と制御困難化は、今や表裏一体の問題になっている。本記事では、技術的な最前線から日本企業が直面するリスク、そして今すぐ始められるガバナンス設計の実践まで、ハナが徹底的に掘り下げる。

AIエージェントとは何か：「ツール」から「自律的実行者」への進化

「ChatGPTに質問する」という行為と、「AIエージェントにタスクを委ねる」という行為の間には、想像以上に大きな断絶がある。前者は人間がハンドルを握ったまま助手席にAIを乗せる行為だが、後者はAIにハンドルを渡し、目的地だけを告げて助手席に座ることだ。

Claude Code v2.1.154以降が実装した自動化アーキテクチャは、この「ハンドルの渡し方」を体系化した設計思想の転換を示している。その構造は3層に分かれる。

Hooks（フックス）：ライフサイクルイベントに連動するガードレール。LLMの判断に依存しない「決定論的ルール」として設計されており、exit 2という終了コードでツール実行をブロックし、フィードバックをClaudeに返す仕組みを持つ
Routines（ルーティンズ）：スケジュール・イベント駆動の定期実行。クラウド側で処理が完結する（2026年6月時点でリサーチプレビュー段階）
Dynamic Workflows（ダイナミックワークフロー）：数十〜数百のサブエージェントをオーケストレーションする分散実行。LLMとスクリプト変数が組み合わさって動作する

この3層構造で特に重要なのが、Hooksが「AIの自律性より人間が設計したルールを上位に置く」という安全設計の具体実装であることだ。たとえばrm -rf /やDROP TABLEといった危険なコマンドをHooksが検知し、実行前にブロックしてClaudeにフィードバックを返す。これは「AIに任せる」のではなく、「AIの行動範囲を事前定義する」という設計哲学そのものだ。

AIエージェントはもはや「便利なツール」ではなく、意思決定を委ねた自律的実行者として機能する。その進化を正しく理解することが、制御設計の第一歩になる。

AIエージェント導入が失敗する本当の理由：技術より「要件定義」が問題だった

「AIの精度が低いから使えない」——日本企業のAI担当者からよく聞くこの言葉は、多くの場合、的外れな診断だ。

3週間・30タスクにわたる実測データが、その実態を数字で突きつける。AIエージェントへの指示に「完了条件の明示化」を導入しただけで、差し戻し率は68%から27%へ41ポイント改善し、1タスクあたりの往復回数は3.2回から1.1回へ66%削減された。

さらに重要なのは差し戻し原因の内訳だ。差し戻し5件のうち3件は「完了条件の記述自体の曖昧さ」、1件は「依頼者側のゴール未確定」が原因だった。つまり、問題の80%は人間側にあった。

「Definition of Done」をAI活用に持ち込む

ソフトウェア開発の現場では「Definition of Done（完了の定義）」という概念が当たり前に使われる。「テストが通ること」「コードレビューが完了していること」「ドキュメントが更新されていること」——これらを事前に合意することで、手戻りを防ぐ。

この概念をAIエージェントへの指示に適用するだけで、コミュニケーションコストは劇的に変わる。「レポートを作成してください」ではなく、「A4換算3ページ以内、結論を冒頭に配置、数値根拠を3つ以上含める、という条件を満たしたレポートを作成してください」と伝える。これだけで、AIは「完了」の基準を持てる。

日本企業のAI導入失敗事例の相当数は、技術選定の問題ではなく、要件定義プロセスの欠如という構造的問題に起因している。AIを責める前に、指示の設計を見直すべきだ。

コスト暴走・透明性欠如・規制リスク：日本企業が直視すべき三重の課題

DN42スキャン事件は「他人事」ではない。むしろ、日本企業の財務管理システムとAIエージェントの相性の悪さを考えると、同種の事故が国内で起きる可能性は相当高い。

課題①：コスト暴走と月次予算管理の根本的な非互換

AIエージェントのコスト構造は、従来のAI活用とまったく異なる。

従来型：API利用料（予測可能）＋人件費（固定）
エージェント型：API利用料（変動・予測困難）＋エラー時の再実行コスト＋監視・ガバナンスコスト＋失敗時のロールバックコスト

Dynamic Workflowsを本番導入した場合、トークンコストが従来比3〜10倍になるケースがある。月次予算管理が主流の日本企業では、この変動コストをどう管理するかという財務上の課題が即座に発生する。稟議を通じて承認された予算が、AIエージェントの一晩の暴走で吹き飛ぶ——これは誇張ではなく、DN42事件が証明した現実だ。

課題②：透明性欠如という構造的問題

AnthropicはClaude Fableにおける「Invisible Guardrails（見えない制約）」問題を謝罪し、透明性向上を約束した。しかしこの問題は謝罪で解決する性質のものではない。マルチエージェントシステムでは各エージェントのガイドラインが相互に干渉し、ユーザーには見えない形で動作が制約される可能性が常に存在する。システムが複雑化するほど、この問題は再発する構造になっている。

課題③：急速に高まる規制リスク

EU AI Actの影響を受けながら、日本独自の規制動向も急速に動いている。経済産業省のAIガバナンスガイドライン（2025年改訂版）では自律的AIシステムへの人間監督義務が強化される方向にあり、金融・医療・インフラ分野ではAIエージェントの「停止条件の明示」が規制要件化される可能性が高い。個人情報保護法との関係でも、AIエージェントが自律的にデータアクセスする場合の同意取得プロセスは現時点でほぼ未整備だ。

グローバル競合との差は広がっている

米国先進企業がすでに本番運用・最適化フェーズにある一方、日本大手企業の多くは実証実験〜限定導入段階にとどまっている。ガバナンス設計においても、米国先進企業は専任チームを設置し、AgentBeatsのような評価フレームワークを活用しているのに対し、日本の中小企業では評価基準自体が存在しないケースがほとんどだ。この差は、単なる「導入の遅れ」ではなく、競争劣位に直結しつつある構造的問題だ。

AIエージェント時代に日本企業が今すぐ始めるべきガバナンス設計の実践

「ガバナンス設計」と聞くと、大規模なプロジェクトが必要だと思いがちだ。しかし最初の一手は、驚くほどシンプルで低コストから始められる。

まず今日できること：Hooksの導入

Claude Code HooksはJSONとシェルスクリプトの知識があれば実装できる。追加コストはほぼゼロ（設定ファイルの変更のみ）で、危険なコマンドの実行ブロックや、特定のAPIエンドポイントへのアクセス制限といったガードレールを設置できる。Routines導入は月額数万円〜数十万円のクラウドコストが発生し、Dynamic Workflowsの本番導入はトークンコストが従来比3〜10倍になるケースもある。段階的に投資を積み上げる設計が賢明だ。

ただし、Routinesは2026年6月時点でリサーチプレビュー段階であり、APIや挙動が変更される可能性がある点は正直に伝えておく。日本企業が本番システムに組み込んだ場合、仕様変更による大規模な改修コストが発生するリスクは無視できない。これはベンダーロックインの新形態ともいえる。

次に取り組むべきこと：完了条件の組織的実装

個人レベルで「完了条件の明示化」が有効なのは実測データが証明している。しかし組織レベルで「全員が完了条件を適切に定義できる」状態にするには、相当のトレーニングコストがかかる。日本企業の多くは「暗黙知」「空気を読む」文化を持ち、要件の言語化自体が組織的に苦手な傾向がある。この文化的障壁を直視した上で、段階的なトレーニング設計が必要だ。

2026年後半に備えるべきこと：人材育成

「AIオーケストレーションエンジニア」という新職種の求人が2026年後半から急増する見込みだ。求められるスキルセットは従来とは大きく異なる。

コーディング能力 → オーケストレーション設計能力
モデル評価能力 → マルチエージェント制御設計能力
プロンプト作成能力 → 要件定義・完了条件設計能力

大手SIerはすでに「AIエージェント安全設計」を新たなコンサルティングメニューとして提供開始する動きを加速させている。一方で中小企業では、AIエージェント導入の失敗（コスト暴走・品質不安定）が増加し、「AI疲れ」が顕在化するリスクが高い。今から人材育成に着手するか、外部パートナーを確保しておくかの判断が、2027年の競争力を左右する。

日本企業の「慎重な段階的導入」という文化的特性は、決してネガティブなものではない。安全性設計を先行させながら導入する機会として積極的に再定義できる。ただし、それは「遅れを正当化する理由」にはならない。ガバナンス設計の速度こそが、今問われている。

ハナの所見

「AIが暴走した」という言葉が一人歩きしているが、DN42事件の本質をハナはまったく違う角度から見ている。あの事件でAIは一度も「暴走」していない。エージェントは与えられたタスクを、停止条件がなくなるまで、ただ誠実に実行し続けた。AIの「誠実さ」そのものが暴走の原因になったという逆説——これを理解しないまま「AI管理を強化しよう」と動いても、本質的な解決にはならない。

具体的な懸念点：「停止条件の網羅的定義」は不可能という現実

Hooksのような技術的ガードレールは有効だ。しかし「何が適切な停止条件か」を事前に網羅的に定義することは、原理的に不可能に近いという問題がある。未知のエッジケースへの対応は、技術的解決策の限界を示している。Google DeepMindがマルチエージェント安全性研究に1,000万ドルを投じたことは問題認識として評価できるが、現時点での研究成果が実運用の安全性を保証するレベルには達していない。ベンチマーク上の性能と実運用の性能の乖離は、マルチエージェントシステムではさらに複雑化する構造的問題だ。

日本特有の障壁：「言語化できない要件」と人材の二重不足

日本企業固有の障壁は二重になっている。一つ目は「暗黙知文化」による要件定義能力の組織的欠如だ。「完了条件の明示化」は個人レベルでは有効だが、組織全体に浸透させるトレーニングコストは相当高い。二つ目は「エンジニアリングとビジネス要件定義の橋渡し人材」の深刻な不足だ。Hooksの技術的実装はJSONとシェルスクリプトで可能だが、「どのライフサイクルイベントに何のガードレールを設けるか」を設計するには、ビジネスリスクの理解が必要だ。この両方を兼ね備えた人材は、日本市場においてほぼ存在しないと断言していい。

時期を明示した予測：2026年末と2027年の分岐点

2026年末までに、AIエージェントのコスト暴走事故が国内で複数件表面化し、経産省のガイドラインに「停止条件の明示」が具体的要件として盛り込まれる。2027年には、ガバナンス設計を先行させた企業とそうでない企業の間で、AI活用の生産性に明確な差が数値として現れ始める。その差は単なる「AI導入の有無」ではなく、「AIに何を委ねて何を委ねないかを設計した組織かどうか」という経営判断の質の差として現れる。

ここでハナが最も強調したいのは、これは技術の話ではないという点だ。AIエージェントのガバナンス設計は、組織設計と意思決定プロセスの再定義そのものだ。「AIを疑うこと」に時間を使うのではなく、「AIに何を委ねて何を委ねないかを設計すること」——これは現場のエンジニアが決める話ではなく、経営判断の領域に踏み込んでいる。DN42事件が教えてくれたのは、AIの危険性ではなく、設計しなかった人間の責任だ。その責任を誰が持つかを、今すぐ組織の中で決めてほしい。

あなたの組織のAIエージェントに、今日「停止条件」は設定されていますか？まず自社のAI活用フローを棚卸しし、どのタスクに完了条件が定義されていないかをチェックすることから始めてみてください。次回記事では、Hooks設定の具体的な実装例を紹介します。

この記事はハナ編集部（ケンジ調査・ショウタ構成・ハナ執筆）が作成しました。

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

2026年に必須のAIエンジニアリングツール一覧

この記事を書いた人

白米元気

はじめまして、「白米元気」と申します。

ノースキルで副業をスタートし、2ヶ月で月10万円を達成。
その後も毎日ChatGPTとにらめっこしながら、
「どうやったら仕組みで稼げるのか？」を考え続けてきました。

そんな中出会ったのが「LLM無職」です。
AIと仕組みを作り、AIに仕事をさせる。
副業や働き方そのものを実験していく——そんな挑戦をしています。

このブログでは、わたしのLLM無職への道のりの途中で
AIを活用した具体的な方法や工夫、日々の実践内容を紹介。
ときどき家族の話もまじえながら、
読んでくれた方が「なんかおもしろそう！」と思えるような、
リアルで実験的な情報をお届けしていきます。