AI開発チーム3体制の落とし穴──コンテキスト管理の失敗から学んだ5つのルール

ドイツのインディー開発者が、Claude・Codex・Grokの3つのAIを「開発チーム」として運用した実体験を共有しています。RUP/SCRUMの原則に基づいて各AIに異なる役割を割り当てる野心的な試みでしたが、コンテキスト管理の失敗により、Codexが本来不要な900行のGDScriptコードを生成するという事態が発生。この「GDScript事件」から得られた教訓は、AI時代の開発ワークフローにおける人間の役割を改めて問い直すものです。

この記事のポイント
GDScript事件──何が起きたのか
事件から生まれた5つのルール
AIコーディングアシスタントの本質的な危うさ
知っておくと便利なTips
まとめ

この記事のポイント

Claude・Codex・Grokを役割分担させたAI開発チーム運用の実例
コンテキストの欠落が原因で、Codexが900行の不要コードを生成した失敗談
「人間がループに入ること」はオプションではなくアーキテクチャそのものである

GDScript事件──何が起きたのか

Forge4Dプロジェクトにおいて、SMLパーサーはすでにC#からC++への移植が完了していました。元のC#版と比較して15倍の高速化を達成し、順調に見えた開発でした。

しかし問題はセッションの切り替え時に発生します。著者は新しいセッションでCodexに「古いC#パーサーを削除してほしい」と指示しました。ここで致命的な省略がありました。「新しいC++版がすでに存在している」という情報を伝え忘れたのです。

著者の頭の中では「古いものを削除する＝新しいものがすでにある」は自明でした。しかしCodexのコンテキストウィンドウにはその情報がありません。Codexは「SMLパーサーをC++で書く必要がある」と判断し、結果として900行のGDScriptコードを生成してしまいました。

重要なのは、Codexのロジック自体は正しかったということです。前提が間違っていただけです。Codexが間違えたのではなく、コンテキストが間違っていたのです。

事件から生まれた5つのルール

この失敗から、著者は5つの運用ルールを確立しました。

ルール1: 新しいセッション開始時には、何が存在するかを伝える。これから作りたいものだけでなく、すでに完成しているものをCodexに共有することが不可欠です。AIにはセッション間の記憶がないため、現在の状態を明示する必要があります。

ルール2: 「古いものを削除して」は「新しいものが存在する」を意味しない。人間同士なら暗黙に通じることも、AIには明示的に両方を伝えなければなりません。省略は最大の敵です。

ルール3: 問題が起きたら、Codexの前にClaudeを呼ぶ。実装（Codex）の前に診断（Claude）を行うという原則です。これはRUP/SCRUMにおける「分析→設計→実装」の流れとも一致します。

ルール4: コンテキストは記憶ではない。記憶はコンテキストではない。コンテキストは人間が能動的に維持しなければならないものです。AIが前回のセッションを「覚えている」と思い込むのは危険です。

ルール5: 失敗は起こる。問題は回復の速さだ。今回の事件も1セッションで回復できました。完璧を求めるよりも、素早い回復力を重視する姿勢が重要です。

AIコーディングアシスタントの本質的な危うさ

著者が指摘する最も重要な洞察は、AIの「自信」に関するものです。人間の開発者が混乱した場合、「ちょっと確認させてください」と言います。しかしCodexが混乱した状態では、同じ自信を持って900行のGDScriptを出力します。

AIコーディングアシスタントは極めて強力であると同時に、極めて字義通りに動作します。曖昧な指示を受けても「わからない」とは言わず、与えられたコンテキストの中で最善と判断した結果を出力します。その結果が正しいかどうかは、コンテキストの正確さに完全に依存しています。

だからこそ、「人間がループに入ること」はオプションではなく、アーキテクチャそのものなのです。これはAI開発チームを運用する上での根本原則です。

知っておくと便利なTips

AIとの新しいセッション開始時には、プロジェクトの現在の状態を簡潔にまとめた「ステータスブリーフィング」を毎回提供する習慣をつけると効果的
複数のAIを役割分担させる場合、「診断担当」と「実装担当」を分けることで、誤った前提に基づく大量コード生成を防げる
「削除」「変更」「移行」などの指示を出す際は、現在の状態と目標の状態の両方を必ず明記する

まとめ

3つのAIによる開発チーム運用は、適切なコンテキスト管理さえ行えば十分に実用的であることが示されました。しかし、セッション間でのコンテキストの断絶は、AIが「自信を持って間違える」という危険な状況を引き起こします。AIの能力が向上するほど、人間によるコンテキスト管理の重要性はむしろ増していきます。この記事は、AIツールの活用が進む現在において、人間の役割が「コードを書くこと」から「正しいコンテキストを維持すること」へと変化しつつあることを示唆しています。

📎 元記事: https://dev.to/artanidos/i-run-a-dev-team-of-3-ais-heres-what-almost-broke-it-1dab

関連記事