本书是一本系统讲解基于大语言模型的多智能体协同技术的工程实践指南。全书以“原理—方法—应用—保障”为主线,深入剖析AI智能体群落的设计理念、协同机制与工程实现。 全书分为四个部分。第一部分阐述Agent协同原理,包括大模型时代Agent协同的独特价值、基于自然语言的协同通信机制、MCP与A2A等新兴通信协议,以及任务规划、协商决策、协同优化等群落协同策略。第二部分聚焦系统构建方法,涵盖AutoGen、LangGraph、CrewAI等主流框架的实战应用,生产级系统的架构设计、Prompt工程、上下文管理与容错机制,以及规模化部署与性能优化策略。第三部分通过三个递进式案例—20个Agent的智能客服系统、50个Agent的智慧医疗平台、超过100个Agent的智慧城市系统—展示不同规模下的多智能体协同实践。第四部分讲解测试策略、版本管理、成本优化、安全合规等工程化保障措施。
周佺喜,现任国家能源集团大模型智能平台首席架构师,拥有美国约翰霍普金斯大学人工智能硕士学位和英国华威大学工程硕士学位。曾任科大讯飞AI算法架构师,在企业级AI应用架构设计和大模型规模化落地方面有着丰富的实践经验。负责国家能源集团AI平台的架构设计工作,参与企业数字化转型和智能化升级。在AI Agent协同领域进行了深入探索和实践:设计并实施了多Agent协同的智能客服系统原型;开发了支持多Agent并发的协作框架,应用于生产调度等业务场景;研究并实现了基于大模型的Agent编排机制,在任务分解、知识共享等技术方向取得实际进展。持有计算机软件国家发明专利,获得阿里云人工智能高级认证工程师、IBM量子计算认证工程师资质。在大模型应用开发、Agent系统构建等技术领域有多年研究和实践经验,积累了从概念验证到系统落地的完整技术能力。
第1章 大模型时代的Agent群落导论 1
1.1 大模型驱动的Agent革命 1
1.1.1 从ChatGPT到Agent:智能的新形态 1
1.1.2 LLM驱动Agent区别于传统Agent的核心能力 2
1.1.3 为什么单Agent不够用 4
1.1.4 Agent群落:下一个范式转变 5
1.2 Agent协同的独特价值 6
1.2.1 专业化分工:不同Agent扮演不同角色 7
1.2.2 认知协同:通过对话达成复杂推理 8
1.2.3 知识互补:整合多源信息的能力 9
1.2.4 容错性:多Agent带来的鲁棒性 10
1.3 当前技术现状:AI编排与协同趋势 12
1.3.1 AI编排器成为企业AI系统的骨干 12
1.3.2 主流多Agent框架生态概览 13
1.3.3 技术发展路线图 15
1.4 本章小结 17
第2章 Agent的协同通信机制 18
2.1 基于自然语言的Agent协同 18
2.1.1 从协议到对话:协同范式的转变 18
2.1.2 Prompt链:Agent间的对话设计 19
2.1.3 上下文管理:保持对话连贯性 21
2.1.4 角色定义:通过System Prompt塑造Agent 22
2.2 Agent的协同模式 23
2.2.1 顺序协同:任务接力模式 24
2.2.2 并行协同:多Agent同时工作 25
2.2.3 层次协同:Manager-Worker模式 27
2.2.4 竞争协同:多Agent方案竞选 28
2.3 新兴Agent通信协议 29
2.3.1 MCP(模型上下文协议):Agent与工具的标准接口 30
2.3.2 A2A(Agent2Agent协议):跨Agent通信标准 32
2.3.3 ACP(Agent通信协议):IBM的开放互操作方案 33
2.3.4 协议选择与混合应用策略 34
2.4 本章小结 35
第3章 基于LLM的Agent群落协同策略 37
3.1 Agent的任务规划与分配 37
3.1.1 零样本任务分解:让LLM自动拆分任务 37
3.1.2 能力感知分配:基于Agent能力描述的智能匹配 40
3.1.3 动态重规划:执行中的计划调整 42
3.1.4 失败恢复:通过对话纠正错误 44
3.2 Agent的协商与决策 45
3.2.1 多轮对话协商:模拟人类讨论过程 45
3.2.2 投票与评分:利用LLM的判断能力 47
3.2.3 论据生成与辩论:让Agent互相说服 49
3.2.4 裁判机制:引入中立Agent仲裁 50
3.3 Agent的协同优化与演化 52
3.3.1 基于反馈的Prompt自动优化 52
3.3.2 Agent群体的协同学习机制 54
3.3.3 对话策略的A/B测试与选择 55
3.3.4 失败案例的自动分析与改进 56
3.4 本章小结 58
第4章 AI大模型协同框架应用 59
4.1 AutoGen框架协同机制 59
4.1.1 AutoGen v0.4架构与Actor模型 59
4.1.2 Agent角色系统与异步消息传递 61
4.1.3 跨语言协同(Python与.NET) 62
4.1.4 AutoGen Studio低代码编排实践 64
4.2 LangGraph状态流转机制 65
4.2.1 图状态机核心实现 65
4.2.2 条件分支与循环控制 67
4.2.3 检查点与状态持久化 69
4.2.4 人机协同工作流开发 71
4.3 CrewAI与其他框架协作机制 73
4.3.1 CrewAI角色定义与任务委派 74
4.3.2 MetaGPT软件开发自动化实现 76
4.3.3 Pydantic AI类型安全Agent开发 78
4.3.4 OpenAI Agents SDK快速构建实践 80
4.4 快速上手:搭建第一个协同Agent团队 82
4.4.1 环境准备与多模型API配置 82
4.4.2 设计三个基础Agent角色 84
4.4.3 实现Agent间的对话协同 86
4.4.4 运行效果展示与常见问题 89
4.5 本章小结 90
第5章 生产级Agent协同系统设计 91
5.1 Agent协同系统的架构设计 91
5.1.1 从业务需求到Agent角色的映射方法 91
5.1.2 Agent协作关系图的设计模式 93
5.1.3 基于LLM的Agent能力边界定义 95
5.1.4 协同系统的模块化与可扩展性设计 96
5.2 Prompt工程与Agent人格设计 98
5.2.1 System Prompt的结构化设计方法 99
5.2.2 Agent间对话协议的设计与优化 101
5.2.3 动态Prompt调整与个性化定制 103
5.2.4 多语言与跨文化Agent的适配策略 105
5.3 上下文管理与记忆系统 106
5.3.1 对话历史的压缩与摘要技术 107
5.3.2 向量数据库在Agent记忆中的应用 109
5.3.3 Agent间的共享记忆与知识同步 111
5.3.4 记忆遗忘机制与隐私保护 112
5.4 容错与恢复机制 114
5.4.1 AI幻觉的检测与纠正机制 114
5.4.2 Agent失效的检测与自动恢复 116
5.4.3 级联错误的预防与隔离 118
5.4.4 人机协同的介入机制设计 120
5.5 本章小结 121
第6章 Agent协同的规模化与优化 122
6.1 Agent的分层管理架构 122
6.1.1 Manager-Worker模式的实现 122
6.1.2 多层次Agent组织结构设计 125
6.1.3 动态团队组建与解散机制 126
6.1.4 跨团队协作与资源共享 128
6.2 并发协同与资源管理 130
6.2.1 LLM API的并发调用优化 130
6.2.2 Token使用的成本优化策略 132
6.2.3 多模型协同与负载均衡 134
6.2.4 资源预算管理与配额分配 137
6.3 Agent群落的动态管理 138
6.3.1 基于任务复杂度的Agent动态召唤 138
6.3.2 Agent专长的动态发现与组队 141
6.3.3 对话轮次的智能控制与优化 142
6.3.4 Agent记忆的选择性继承与传递 144
6.4 性能监控与调优 146
6.4.1 Agent性能指标体系设计 147
6.4.2 多Agent协同中的效率瓶颈分析 148
6.4.3 Prompt优化与模型微调策略 150
6.4.4 缓存策略与响应加速技术 151
6.5 实践案例:8个Agent的任务协同系统 153
6.5.1 案例背景:多Agent协作撰写研究报告 153
6.5.2 基于对话的任务分解与分配实现 155
6.5.3 多轮对话协同的完整流程演示 157
6.5.4 协同效果评估与优化建议 160
6.6 本章小结 161
第7章 智能客服系统:20个Agent的自然语言协同 163
7.1 基于LLM的客服Agent架构设计 163
7.1.1 客服场景的Agent角色定义与Prompt设计 163
7.1.2 基于语义理解的智能路由机制 166
7.1.3 多Agent并行处理与结果融合 168
7.2 任务流转、冲突消解与效果优化 169
7.2.1 基于对话的任务交接与上下文压缩 169
7.2.2 Agent回答不一致的检测与仲裁 172
7.2.3 对话质量评估与协同模式优化 173
7.3 本章小结 175
第8章 智慧医疗平台:50个Agent的知识协作网络 177
8.1 医疗场景的Agent专业化设计 177
8.1.1 多科室Agent的医学知识Prompt工程 177
8.1.2 症状标准化与医学知识图谱应用 179
8.1.3 基于临床路径的Agent协作流程 182
8.2 多学科会诊、急诊协同与安全合规 184
8.2.1 病例呈现、诊断论证与方案协同制定 185
8.2.2 急诊场景的实时协作与资源调配 188
8.2.3 循证验证、隐私保护与人机协同决策 191
8.3 本章小结 192
第9章 智慧城市系统:100+Agent的大规模群体智能 194
9.1 城市级Agent系统的分层架构 194
9.1.1 “市级—区级—节点”三层Agent体系设计 194
9.1.2 跨层级指令传递与局部自治机制 196
9.1.3 城市知识图谱的共享与更新 199
9.2 交通、AIoT协同与大规模性能优化 202
9.2.1 交通Agent实时协商与事故响应 202
9.2.2 数字孪生与边缘计算Agent协作 204
9.2.3 Agent分组、缓存策略与优雅降级 207
9.3 本章小结 209
第10章 Agent协同系统的测试与运维 210
10.1 Agent的测试策略 210
10.1.1 对话测试框架与协同场景模拟 210
10.1.2 基于LLM的自动化测试与回归验证 213
10.1.3 Prompt变更的回归测试与兼容性验证 215
10.2 Prompt版本管理与成本优化 216
10.2.1 Prompt版本控制与A/B测试框架 216
10.2.2 Token消耗监控与成本优化策略 219
10.2.3 多模型协同的成本效益分析 221
10.3 安全合规与运维保障 223
10.3.1 提示注入防御与敏感信息保护 223
10.3.2 对话日志分析与知识持续更新 225
10.3.3 LLM API故障处理与服务降级 226
10.4 本章小结 231
附录 术语表 232