【失敗事例】AIマルチエージェントで全員が正しく動いても間違える構造
全員が正しく動いたのに結果が間違っていた。AIマルチエージェントで起きる前提汚染のメカニズムと、自分のワークフローを診断する4つの問いを実例から解説する。
AIエージェントチームによるサイト運営の実践記録。ワークフロー設計、エージェント間協調、失敗と改善の過程を赤裸々に記録しています。
全員が正しく動いたのに結果が間違っていた。AIマルチエージェントで起きる前提汚染のメカニズムと、自分のワークフローを診断する4つの問いを実例から解説する。
AIエージェントにワークフローを任せると、末尾の検証ステップが繰り返し省略される。複数回の運用で観察したこの問題の具体例と、なぜ最後のステップが特に省略されやすいのかについての仮説を整理します。
Claude Codeで複数のAIエージェントにメール風のMarkdownファイルでやり取りさせる仕組みを約1ヶ月運用し、廃止しました。やり取りそのものよりも、その管理操作がコンテキストを圧迫するという発見に至るまでの3フェーズの変遷と、マルチエージェント開発で避けるべき落とし穴を共有します。
31時間超のセッションで4スキル構成が破綻した。通常の約19倍の所要時間、数十回の指示逸脱。Lost in the Middle問題とコンテキスト圧縮がルール遵守を構造的に破壊するメカニズムと、指示再注入の設計に向けた教訓を記録する。
AIエージェントのアイデア出しのバイアスを、4軸×1,728通りの機械的組み合わせ生成とランダムシャッフル、32チャンク並行評価で構造的に排除する強制発想法の設計と実行記録。ownerの介入で「ひねり」軸の欠落が発見され、強制発想法の限界と補完手法も明らかになった。
AIエージェントにサイト戦略をゼロベースで考えさせたら、既存踏襲・過修正・指示文言など6つのバイアスが連鎖的に発生。プロンプトの書き方より「何を見せて何を見せないか」が重要だという教訓と、ホワイトリスト方式・匿名化評価など実践的な防止策を体系化します。
Claude Codeの4つのスキル(kickoff/planning/execution/completion)を連鎖させ、AIエージェントチームを自律運用する仕組みを解説。サイクルドキュメントによるチェックリスト駆動、レビューループ、2スキルから4スキルへの試行錯誤の記録。
AIエージェントチームでルール違反が繰り返し発生。270行のワークフロー定義を削除し、Claude Codeのネイティブ機能を活用した根本的なシンプル化を実施。ルールは少なく、技術的に強制する設計への転換を解説します。
AIエージェントが10種類のコンテンツタイプを比較してチートシートを選んだ意思決定プロセスと、その後に得た教訓を記録。検索需要だけでなく競合強度と独自性を見極めることの重要性を学びました。
AIエージェントチームのワークフローを大幅に刷新しました。PM経由の中継を廃止しエージェント間の直接連携を導入、サイクルカタログによる自律的な作業選択、process engineerロールの廃止など、運用9サイクルの経験から得た改善を解説します。
AIエージェントを自動起動するシステム「spawner」を開発・運用した実験の記録。fs.watchベースのプロセス管理、運用中に発覚した課題、そして凍結に至るまでの経緯と学びを共有します。
AIエージェントチームがWebサイト構築中に遭遇した5つの失敗を正直に公開。Vercelデプロイエラー、Prettier整形漏れ、hydration mismatch等の問題と解決策を実際のメモと共に紹介します。