智能体组织专家
Agent Organization Expert
多智能体编排技能,包括团队组建、任务分解、工作流优化和协调策略。
适用平台:
ChatGPTClaudeGemini
---
name: agent-organization-expert
description: 团队组建、任务分解、工作流优化和协调策略的多智能体编排技能,旨在实现最佳团队绩效和资源利用率。
---
# 智能体组织
通过系统的任务分析、能力映射和工作流设计,组建并协调多智能体团队。
## 配置
- **智能体数量**:${agent_count:3}
- **任务类型**:${task_type:general}
- **编排模式**:${orchestration_pattern:parallel}
- **最大并发数**:${max_concurrency:5}
- **超时(秒)**:${timeout_seconds:300}
- **重试次数**:${retry_count:3}
## 核心流程
1. **分析需求**:理解任务范围、约束和成功标准
2. **映射能力**:将可用智能体与所需技能匹配
3. **设计工作流**:创建包含依赖和检查点的执行计划
4. **编排执行**:协调 ${agent_count:3} 个智能体并监控进度
5. **持续优化**:根据性能反馈进行调整
## 任务分解
### 需求分析
- 将复杂任务分解为离散的子任务
- 识别每个子任务的输入/输出需求
- 估计每个组件的复杂性和资源需求
- 为每个单元定义明确的成功标准
### 依赖映射
- 记录任务执行顺序约束
- 识别子任务之间的数据依赖
- 映射资源共享需求
- 检测潜在瓶颈和冲突
### 时间线规划
- 按照依赖关系排序任务
- 识别并行化机会(最多 ${max_concurrency:5} 个并发)
- 为高风险组件分配缓冲时间
- 定义进度验证的检查点
## 智能体选择
### 能力匹配
根据以下因素选择智能体:
- 所需技能与智能体专长
- 类似任务的历史表现
- 当前可用性和工作负载容量
- 任务复杂度的成本效益
### 选择标准优先级
1. **能力匹配度**:智能体必须具备所需技能
2. **过往记录**:优先选择有成功经验的智能体
3. **可用性**:有足够的容量及时完成任务
4. **成本**:在约束条件下优化资源利用率
### 备用计划
- 为关键角色识别备用智能体
- 定义故障转移触发器和交接程序
- 为单点故障任务保持冗余
## 团队组建
### 组成原则
- 确保所有子任务的技能覆盖完整
- 平衡 ${agent_count:3} 个团队成员的工作负载
- 最小化沟通开销
- 为关键功能包含冗余
### 角色分配
- 根据优势将智能体与子任务匹配
- 定义明确的所有权和责任
- 建立依赖角色之间的沟通渠道
- 记录阻塞问题的升级路径
### 团队规模
- 紧密耦合任务使用小团队
- 可并行化工作负载使用大团队
- 在规模决策中考虑协调开销
- 根据进度动态调整规模
## 编排模式
### 顺序执行
当任务有严格的顺序要求时使用:
- 任务 B 需要任务 A 的输出
- 步骤之间状态必须一致
- 错误处理需要有序回滚
### 并行处理
当任务独立时使用(${orchestration_pattern:parallel}):
- 任务之间没有数据依赖
- 独立的资源需求
- 完成后可以聚合结果
- 最多 ${max_concurrency:5} 个并发操作
### 管道模式
用于流式或连续处理:
- 每个阶段处理并转发结果
- 允许不同阶段并发执行
- 减少多步骤工作流的整体延迟
### 分层委托
用于需要子编排的复杂任务:
- 牵头智能体协调子团队
- 每个子团队处理一个领域
- 结果通过层级向上聚合
### Map-Reduce
用于大规模数据处理:
- Map 阶段将工作分配给智能体
- 每个智能体处理一个分区
- Reduce 阶段合并结果
## 工作流设计
### 流程结构
1. **入口点**:验证输入并初始化状态
2. **执行阶段**:有序的任务分组
3. **检查点**:状态持久化和验证点
4. **出口点**:结果聚合和清理
### 控制流
- 为替代路径定义分支条件
- 为瞬时故障指定重试策略(最多 ${retry_count:3} 次重试)
- 为每个阶段建立超时阈值(默认 ${timeout_seconds:300} 秒)
- 规划部分故障的优雅降级
### 数据流
- 记录阶段之间的数据转换
- 指定数据格式和验证规则
- 规划检查点的数据持久化
- 完成后处理数据清理
## 协调策略
### 沟通模式
- **直接**:智能体之间紧密耦合
- **广播**:一对多状态更新
- **基于队列**:异步解耦任务
- **事件驱动**:对状态变化做出反应
### 同步
- 为依赖任务定义同步点
- 实现带超时的等待机制(${timeout_seconds:300} 秒)
- 优雅处理乱序完成
- 保持智能体之间状态一致
### 冲突解决
- 为资源争用建立优先级规则
- 定义冲突仲裁机制
- 记录死锁的回滚程序
- 通过仔细调度预防冲突
## 性能优化
### 负载均衡
- 根据智能体容量分配工作
- 监控利用率并动态重新平衡
- 避免过载高性能智能体
- 考虑数据密集型任务的智能体局部性
### 瓶颈管理
- 通过监控识别慢速阶段
- 增加受限资源的容量
- 重构工作流以减少依赖
- 在有利时缓存中间结果
### 资源效率
- 跨智能体共享资源池
- 使用后及时释放资源
- 批量处理类似操作以减少开销
- 监控并警报资源浪费
## 监控与适应
### 进度跟踪
- 监控每个任务的完成状态
- 跟踪花费时间与估计时间的对比
- 识别有延迟风险的任务
- 向利益相关者报告汇总进度
### 性能指标
- 任务完成率和延迟
- 智能体利用率和吞吐量
- 错误率和恢复时间
- 资源消耗和成本
### 动态调整
- 根据进度重新分配智能体
- 根据阻塞问题调整优先级
- 根据工作负载调整团队规模
- 根据学习修改工作流
## 错误处理
### 故障检测
- 监控任务故障和超时(${timeout_seconds:300} 秒阈值)
- 及时检测智能体不可用
- 识别级联故障模式
- 警报异常行为
### 恢复程序
- 带退避机制重试瞬时故障(最多 ${retry_count:3} 次尝试)
- 必要时故障转移到备用智能体
- 关键故障时回滚到上一个检查点
- 升级不可恢复的问题
### 预防
- 执行前验证输入
- 分配前测试智能体可用性
- 设计优雅降级
- 在关键路径中构建冗余
## 质量保证
### 验证关卡
- 在每个检查点验证输出
- 交叉检查并行任务的结果
- 验证最终聚合结果
- 确认成功标准已满足
### 性能标准
- 智能体选择准确率目标:>${agent_selection_accuracy:95}%
- 任务完成率目标:>${task_completion_rate:99}%
- 响应时间目标:<${response_time_threshold:5} 秒
- 资源利用率:最佳范围 ${utilization_min:60}-${utilization_max:80}%
## 最佳实践
### 规划
- 投入时间进行彻底的任务分析
- 记录假设和约束
- 预先规划故障场景
- 定义明确的成功指标
### 执行
- 从最小开始