CoA(Chain-of-Agents) 是 Google 推出的多智慧體協作框架,旨在解決 大語言模型(LLM) 在處理 長文本任務 時的 上下文限制問題。
CoA 透過 將長文本分割為多個片段,交由多個 工作智慧體(worker agents) 依次處理,並通過 鏈式通信 將有用資訊傳遞給下一個智慧體。最終,一個 管理智慧體(manager agent) 負責整合所有資訊,生成最終輸出。
該框架 無需額外訓練、任務無關且高度可解釋,大幅提升長文本任務的 處理效率與準確度。

CoA 的核心功能
1. 分段處理與鏈式通信
- CoA 透過 長文本分段處理,將長篇內容切割成較小的 可處理片段。
- 多個 工作智慧體 逐步分析這些片段,確保 資訊有效傳遞。
- 避免單一 LLM 記憶上下文受限,提升長文本處理能力。
2. 資訊聚合與上下文推理
- 每個 工作智慧體 在處理自身片段時,將 關鍵資訊傳遞給下一個智慧體。
- 最終 管理智慧體(manager agent) 收集所有資訊,並生成 一致且完整的輸出。
- 透過這種方式,CoA 能夠 有效整合長文本中的資訊,進行更精確的推理。
3. 任務無關與無需額外訓練
- CoA 不依賴於特定任務訓練,可以直接適用於 多種 LLM 應用場景。
- 包括 問答、長文本摘要、代碼補全 等多種應用。
- 降低 AI 開發成本,提高系統的通用性。
4. 提升性能與效率
- CoA 透過 多智慧體並行處理,提升長文本任務的 準確率與運算速度。
- 測試結果顯示,CoA 的 任務表現最高可提升 10%。
- 時間複雜度從 O(n²) 降至 O(nk),降低計算成本。
5. 高度可擴展性
- 可根據需求動態調整工作智慧體數量,適應不同長度的文本。
- 透過 彈性配置,可處理 短文與超長文本內容。

CoA 的技術原理
1. 多智慧體協作與資訊聚合
- 第一階段:
- 工作智慧體(worker agents) 依次讀取與處理文本片段。
- 每個智慧體處理後,將 關鍵資訊傳遞給下一個智慧體。
- 最終階段:
- 管理智慧體(manager agent) 收集所有輸出,進行資訊整合。
- 確保最終結果能完整反映長文本的所有關鍵資訊。
2. 上下文推理與任務無關性
- CoA 利用自然語言通信 進行智慧體之間的協作。
- 每個智慧體 專注於較短的文本片段,提升處理的準確度。
- 適用於 各類 LLM 任務,無需特定訓練。
3. 時間複雜度優化
- CoA 降低計算成本,提升長文本處理效能。
- 從 O(n²) 優化至 O(nk),其中:
- n:輸入 tokens 數量。
- k:LLM 的上下文限制。
- 可高效處理超長文本,提升推理速度。

CoA 的應用場景
1. 長文本問答
- CoA 適用於 多跳推理(Multi-Hop Reasoning)。
- 例如:家族關係推理、法律條文分析。
- 透過 智慧體協作,確保問答過程準確且具邏輯性。
2. 長文本摘要
- CoA 透過 多智慧體分工,有效提取 長文本的關鍵資訊。
- 適用於新聞摘要、學術論文精簡。
- 生成 具條理性與完整性的摘要內容。
3. 代碼補全
- CoA 可用於 長程代碼分析與補全。
- 多智慧體分工處理 不同區塊的程式碼,確保補全準確度。
- 適用於 大型軟體開發、AI 代碼生成工具。
4. 多領域 AI 任務
- CoA 兼容 多種大語言模型(LLM),應用於各種 AI 領域。
- 適用於 醫學分析、金融報告處理、法律合約審核。
- 無需額外調整,即可適用不同領域的長文本任務。
如何了解更多 CoA?
📌 技術論文:CoA arXiv 研究論文
常見問題(FAQ)
1. CoA 是否需要額外訓練?
不需要。CoA 無需額外模型訓練,可以直接適用於多種 LLM 任務,如摘要、問答、代碼補全等。
2. CoA 如何提升 LLM 的長文本處理能力?
CoA 採用 多智慧體協作,將長文本 拆分並分步處理,並透過 鏈式通信 傳遞關鍵資訊,最終由 管理智慧體 整合完整輸出。
3. CoA 可應用於哪些 AI 領域?
CoA 具有 高度靈活性,適用於 法律分析、醫療報告、學術研究、程式碼補全等長文本 AI 任務。