本文件记录项目的所有重要变更。
格式基于 Keep a Changelog, 本项目遵循 语义化版本。
- Phoenix 集成: 集成 Arize Phoenix 实现完整的可观测性
- OpenTelemetry 标准追踪
- arize-phoenix-otel 包集成
- HTTP OTLP exporter
- BatchSpanProcessor 支持生产环境
- LLM 追踪: 完整的 LLM 调用追踪
- Prompt 和 response 记录
- Token 使用统计
- 模型参数记录
- 执行时间追踪
- Agent 追踪: Agent 执行追踪和聚合
- 任务级别的 span 聚合
- Phase 阶段追踪
- 分层 trace 结构
- 执行流程可视化
- OpenInference 支持: 遵循 OpenInference 语义约定
- llm.input_messages (扁平化格式)
- llm.output_messages (扁平化格式)
- llm.token_count.*
- openinference.span.kind
- Phase 追踪: 业务阶段追踪
- Plan phase 追踪
- Generation phase 追踪
- Evaluation phase 追踪
- 阶段执行时间和质量记录
- 配置系统: 完整的可观测性配置
- 启用/禁用开关
- Phoenix endpoint 配置
- 项目名称配置
- 服务名称配置
- 服务管理: Phoenix 服务管理脚本
- Docker 容器启动/停止
- 服务状态检查
- 日志查看
- 数据持久化
- 测试: 完整的测试套件
- 单元测试
- 性能测试
- 集成测试
- 文档: 完整的可观测性文档
- 开发指南
- 环境管理
- 可观测性指南
- 服务管理
- 验证指南
- 执行器集成追踪功能
- CodeGenerator 集成 LLM 追踪
- TaskPlanner 集成 LLM 追踪
- ReflectionEngine 集成 LLM 追踪
- 错误处理更加健壮
- 使用 arize-phoenix-otel 包实现 Phoenix 集成
- 使用 OpenTelemetry SDK 进行追踪
- 使用 BatchSpanProcessor 优化性能
- 使用 OpenInference 语义约定确保兼容性
- 支持 HTTP OTLP exporter
- 支持扁平化的消息属性格式
- CodexExecExecutor: 使用 Codex CLI 的非交互模式执行任务
- 支持所有 Codex CLI 参数(--json, --sandbox, --output-schema 等)
- JSONL 输出解析
- 超时控制和进程管理
- 沙箱模式和审批策略支持
- CodexIntegrationManager: Codex 集成管理器
- 执行器选择逻辑
- Soul profile 上下文传递
- 决策上下文传递
- 降级机制(fallback to CodeGenerator)
- 配置管理和验证
- Worker Agent 集成: 无缝集成 Codex 到 Worker Agent
- 自动执行器选择
- 上下文传递
- 错误降级
- 向后兼容
- 配置系统: 完整的 Codex 配置支持
- 启用/禁用开关
- 执行器选择
- 模型配置
- 沙箱设置
- 审批策略
- 错误处理: 完善的异常处理
- CodexNotInstalledError
- CodexTimeoutError
- CodexExecutionError
- CodexOutputError
- CodexAuthenticationError
- CodexConfigurationError
- 工具函数: Codex CLI 工具集
- is_codex_installed(): 检查 Codex CLI 是否安装
- get_codex_version(): 获取 Codex 版本
- check_codex_availability(): 检查可用性
- validate_codex_authentication(): 验证认证
- 测试: 完整的单元测试
- CodexExecutor 测试(12 个测试)
- CodexIntegrationManager 测试(7 个测试)
- 文档: 完整的用户文档
- 安装指南
- 配置说明
- 使用示例
- 故障排除
- 最佳实践
- Worker Agent 支持多种执行器(CodeGenerator 和 Codex)
- 配置系统支持 Codex 相关配置
- 错误处理更加健壮
- Decision Agent(决策代理): 智能决策代理,作为系统的大脑
- 理解用户意图和上下文
- 基于 Soul 配置文件做决策
- 委派任务给 Worker Agent
- 评估执行结果
- 与用户交互以获取澄清
- 决策流程状态机(UNDERSTAND → ANALYZE → DECIDE → DELEGATE → EVALUATE → COMPLETE)
- Worker Agent(工作代理): 任务执行代理,专注于执行
- 执行 Plan → Generate → Evaluation 流程
- 返回客观数据,不做决策
- 支持输出选项供决策
- 报告执行状态和进度
- Agent Orchestrator(代理编排器): Agent 间的通信枢纽
- 管理 Agent 通信和消息传递
- 控制 Agent 生命周期
- 支持并发执行
- 记录和追踪所有消息
- Context Manager(上下文管理器): 状态管理系统
- 短期上下文(内存)用于快速访问
- 长期上下文(SQLite)用于持久化
- 存储层间的自动同步
- 上下文隔离(用户/会话/项目)
- 大小管理和清理
- 代码接受: 基于质量接受、改进或重新生成代码
- 技术选型: 基于风险容忍度选择技术
- 架构决策: 基于结构偏好选择架构模式
- 实现决策: 基于细节导向选择实现方式
- 扩展 SoulRuleEngine 添加结构偏好规则
- 扩展 SoulRuleEngine 添加细节导向规则
- 决策上下文传递机制
- 决策解释和推理
AutonomousExecutor.execute()返回结构变更- 旧:
{"status": "success", "results": [...]} - 新:
{"status": "success", "decision": {...}, "worker_result": {...}}
- 旧:
- Decision 阶段输出格式扩展以支持多种类型
- Worker 阶段输出格式标准化(移除决策字段)
AutonomousExecutor简化为 Agent 编排器- 通过
legacy_mode参数实现向后兼容层 - 新旧 API 格式转换工具
- 在 Decision Agent 中集中决策逻辑
- Soul profile 集成实现个性化决策
- 上下文感知的决策制定
- 带推理链的决策解释
- 主动的用户交互
- 决策解释
- 跨会话的上下文感知
- 更好的错误处理和恢复
- 清晰的关注点分离(决策 vs 执行)
- 更好的扩展性支持新决策类型
- 模块化架构便于维护
- 改进的可测试性
- LLM 调用追踪和指标
- 决策循环计数
- 上下文大小监控
- 执行时间追踪
- 上下文缓存减少 LLM 调用
- 决策缓存处理重复场景
- 优化的 prompt 工程
- 架构设计文档
- 从旧架构到新架构的迁移指南
- 不同场景的使用示例
- API 文档更新
- 简单任务执行示例
- 技术选型决策示例
- 架构决策示例
- 集成示例
- Decision Agent 单元测试
- Worker Agent 单元测试
- Agent Orchestrator 单元测试
- Context Manager 单元测试
- Agent 协作集成测试
- 不同决策类型的场景测试
legacy_mode参数实现向后兼容- 结果格式转换工具
- 渐进式迁移路径
- 分步迁移说明
- 破坏性变更文档
- 常见问题和解决方案
- 回滚计划
- 初始自主执行器实现
- Plan → Generate → Evaluation → Decision 流程
- Soul profile 集成
- 代理决策制定
- 决策日志记录
- 初始 CLI 实现
- Soul profile 生成
- 基本任务执行
- 配置管理