291 lines (230 loc) · 7.28 KB

变更日志

本文件记录项目的所有重要变更。

格式基于 Keep a Changelog，本项目遵循语义化版本。

[3.2.0] - 2026-04-06

新增

LLM/Agent 可观测性

Phoenix 集成: 集成 Arize Phoenix 实现完整的可观测性
- OpenTelemetry 标准追踪
- arize-phoenix-otel 包集成
- HTTP OTLP exporter
- BatchSpanProcessor 支持生产环境
LLM 追踪: 完整的 LLM 调用追踪
- Prompt 和 response 记录
- Token 使用统计
- 模型参数记录
- 执行时间追踪
Agent 追踪: Agent 执行追踪和聚合
- 任务级别的 span 聚合
- Phase 阶段追踪
- 分层 trace 结构
- 执行流程可视化
OpenInference 支持: 遵循 OpenInference 语义约定
- llm.input_messages (扁平化格式)
- llm.output_messages (扁平化格式)
- llm.token_count.*
- openinference.span.kind
Phase 追踪: 业务阶段追踪
- Plan phase 追踪
- Generation phase 追踪
- Evaluation phase 追踪
- 阶段执行时间和质量记录
配置系统: 完整的可观测性配置
- 启用/禁用开关
- Phoenix endpoint 配置
- 项目名称配置
- 服务名称配置
服务管理: Phoenix 服务管理脚本
- Docker 容器启动/停止
- 服务状态检查
- 日志查看
- 数据持久化
测试: 完整的测试套件
- 单元测试
- 性能测试
- 集成测试
文档: 完整的可观测性文档
- 开发指南
- 环境管理
- 可观测性指南
- 服务管理
- 验证指南

改进

执行器集成追踪功能
CodeGenerator 集成 LLM 追踪
TaskPlanner 集成 LLM 追踪
ReflectionEngine 集成 LLM 追踪
错误处理更加健壮

技术细节

使用 arize-phoenix-otel 包实现 Phoenix 集成
使用 OpenTelemetry SDK 进行追踪
使用 BatchSpanProcessor 优化性能
使用 OpenInference 语义约定确保兼容性
支持 HTTP OTLP exporter
支持扁平化的消息属性格式

[3.1.0] - 2026-04-05

新增

Codex 集成

CodexExecExecutor: 使用 Codex CLI 的非交互模式执行任务
- 支持所有 Codex CLI 参数（--json, --sandbox, --output-schema 等）
- JSONL 输出解析
- 超时控制和进程管理
- 沙箱模式和审批策略支持
CodexIntegrationManager: Codex 集成管理器
- 执行器选择逻辑
- Soul profile 上下文传递
- 决策上下文传递
- 降级机制（fallback to CodeGenerator）
- 配置管理和验证
Worker Agent 集成: 无缝集成 Codex 到 Worker Agent
- 自动执行器选择
- 上下文传递
- 错误降级
- 向后兼容
配置系统: 完整的 Codex 配置支持
- 启用/禁用开关
- 执行器选择
- 模型配置
- 沙箱设置
- 审批策略
错误处理: 完善的异常处理
- CodexNotInstalledError
- CodexTimeoutError
- CodexExecutionError
- CodexOutputError
- CodexAuthenticationError
- CodexConfigurationError
工具函数: Codex CLI 工具集
- is_codex_installed(): 检查 Codex CLI 是否安装
- get_codex_version(): 获取 Codex 版本
- check_codex_availability(): 检查可用性
- validate_codex_authentication(): 验证认证
测试: 完整的单元测试
- CodexExecutor 测试（12 个测试）
- CodexIntegrationManager 测试（7 个测试）
文档: 完整的用户文档
- 安装指南
- 配置说明
- 使用示例
- 故障排除
- 最佳实践

改进

Worker Agent 支持多种执行器（CodeGenerator 和 Codex）
配置系统支持 Codex 相关配置
错误处理更加健壮

[3.0.0] - 2026-04-06

新增

双层 Agent 架构

Decision Agent（决策代理）: 智能决策代理，作为系统的大脑
- 理解用户意图和上下文
- 基于 Soul 配置文件做决策
- 委派任务给 Worker Agent
- 评估执行结果
- 与用户交互以获取澄清
- 决策流程状态机（UNDERSTAND → ANALYZE → DECIDE → DELEGATE → EVALUATE → COMPLETE）
Worker Agent（工作代理）: 任务执行代理，专注于执行
- 执行 Plan → Generate → Evaluation 流程
- 返回客观数据，不做决策
- 支持输出选项供决策
- 报告执行状态和进度
Agent Orchestrator（代理编排器）: Agent 间的通信枢纽
- 管理 Agent 通信和消息传递
- 控制 Agent 生命周期
- 支持并发执行
- 记录和追踪所有消息
Context Manager（上下文管理器）: 状态管理系统
- 短期上下文（内存）用于快速访问
- 长期上下文（SQLite）用于持久化
- 存储层间的自动同步
- 上下文隔离（用户/会话/项目）
- 大小管理和清理

扩展的决策类型

代码接受: 基于质量接受、改进或重新生成代码
技术选型: 基于风险容忍度选择技术
架构决策: 基于结构偏好选择架构模式
实现决策: 基于细节导向选择实现方式

增强的 Soul Profile 集成

扩展 SoulRuleEngine 添加结构偏好规则
扩展 SoulRuleEngine 添加细节导向规则
决策上下文传递机制
决策解释和推理

变更

破坏性变更：API 变更

AutonomousExecutor.execute() 返回结构变更
- 旧：{"status": "success", "results": [...]}
- 新：{"status": "success", "decision": {...}, "worker_result": {...}}
Decision 阶段输出格式扩展以支持多种类型
Worker 阶段输出格式标准化（移除决策字段）

重构组件

AutonomousExecutor 简化为 Agent 编排器
通过 legacy_mode 参数实现向后兼容层
新旧 API 格式转换工具

改进

决策质量

在 Decision Agent 中集中决策逻辑
Soul profile 集成实现个性化决策
上下文感知的决策制定
带推理链的决策解释

用户体验

主动的用户交互
决策解释
跨会话的上下文感知
更好的错误处理和恢复

架构

清晰的关注点分离（决策 vs 执行）
更好的扩展性支持新决策类型
模块化架构便于维护
改进的可测试性

性能

监控

LLM 调用追踪和指标
决策循环计数
上下文大小监控
执行时间追踪

优化

上下文缓存减少 LLM 调用
决策缓存处理重复场景
优化的 prompt 工程

文档

新增文档

架构设计文档
从旧架构到新架构的迁移指南
不同场景的使用示例
API 文档更新

示例

简单任务执行示例
技术选型决策示例
架构决策示例
集成示例

测试

新增测试

Decision Agent 单元测试
Worker Agent 单元测试
Agent Orchestrator 单元测试
Context Manager 单元测试
Agent 协作集成测试
不同决策类型的场景测试

迁移

兼容层

legacy_mode 参数实现向后兼容
结果格式转换工具
渐进式迁移路径

迁移指南

分步迁移说明
破坏性变更文档
常见问题和解决方案
回滚计划

[2.0.0] - 2026-04-05

新增

初始自主执行器实现
Plan → Generate → Evaluation → Decision 流程
Soul profile 集成
代理决策制定
决策日志记录

[1.0.0] - 2026-04-04

新增

初始 CLI 实现
Soul profile 生成
基本任务执行
配置管理