Skip to content

Latest commit

 

History

History
291 lines (230 loc) · 7.28 KB

File metadata and controls

291 lines (230 loc) · 7.28 KB

变更日志

本文件记录项目的所有重要变更。

格式基于 Keep a Changelog, 本项目遵循 语义化版本

[3.2.0] - 2026-04-06

新增

LLM/Agent 可观测性

  • Phoenix 集成: 集成 Arize Phoenix 实现完整的可观测性
    • OpenTelemetry 标准追踪
    • arize-phoenix-otel 包集成
    • HTTP OTLP exporter
    • BatchSpanProcessor 支持生产环境
  • LLM 追踪: 完整的 LLM 调用追踪
    • Prompt 和 response 记录
    • Token 使用统计
    • 模型参数记录
    • 执行时间追踪
  • Agent 追踪: Agent 执行追踪和聚合
    • 任务级别的 span 聚合
    • Phase 阶段追踪
    • 分层 trace 结构
    • 执行流程可视化
  • OpenInference 支持: 遵循 OpenInference 语义约定
    • llm.input_messages (扁平化格式)
    • llm.output_messages (扁平化格式)
    • llm.token_count.*
    • openinference.span.kind
  • Phase 追踪: 业务阶段追踪
    • Plan phase 追踪
    • Generation phase 追踪
    • Evaluation phase 追踪
    • 阶段执行时间和质量记录
  • 配置系统: 完整的可观测性配置
    • 启用/禁用开关
    • Phoenix endpoint 配置
    • 项目名称配置
    • 服务名称配置
  • 服务管理: Phoenix 服务管理脚本
    • Docker 容器启动/停止
    • 服务状态检查
    • 日志查看
    • 数据持久化
  • 测试: 完整的测试套件
    • 单元测试
    • 性能测试
    • 集成测试
  • 文档: 完整的可观测性文档
    • 开发指南
    • 环境管理
    • 可观测性指南
    • 服务管理
    • 验证指南

改进

  • 执行器集成追踪功能
  • CodeGenerator 集成 LLM 追踪
  • TaskPlanner 集成 LLM 追踪
  • ReflectionEngine 集成 LLM 追踪
  • 错误处理更加健壮

技术细节

  • 使用 arize-phoenix-otel 包实现 Phoenix 集成
  • 使用 OpenTelemetry SDK 进行追踪
  • 使用 BatchSpanProcessor 优化性能
  • 使用 OpenInference 语义约定确保兼容性
  • 支持 HTTP OTLP exporter
  • 支持扁平化的消息属性格式

[3.1.0] - 2026-04-05

新增

Codex 集成

  • CodexExecExecutor: 使用 Codex CLI 的非交互模式执行任务
    • 支持所有 Codex CLI 参数(--json, --sandbox, --output-schema 等)
    • JSONL 输出解析
    • 超时控制和进程管理
    • 沙箱模式和审批策略支持
  • CodexIntegrationManager: Codex 集成管理器
    • 执行器选择逻辑
    • Soul profile 上下文传递
    • 决策上下文传递
    • 降级机制(fallback to CodeGenerator)
    • 配置管理和验证
  • Worker Agent 集成: 无缝集成 Codex 到 Worker Agent
    • 自动执行器选择
    • 上下文传递
    • 错误降级
    • 向后兼容
  • 配置系统: 完整的 Codex 配置支持
    • 启用/禁用开关
    • 执行器选择
    • 模型配置
    • 沙箱设置
    • 审批策略
  • 错误处理: 完善的异常处理
    • CodexNotInstalledError
    • CodexTimeoutError
    • CodexExecutionError
    • CodexOutputError
    • CodexAuthenticationError
    • CodexConfigurationError
  • 工具函数: Codex CLI 工具集
    • is_codex_installed(): 检查 Codex CLI 是否安装
    • get_codex_version(): 获取 Codex 版本
    • check_codex_availability(): 检查可用性
    • validate_codex_authentication(): 验证认证
  • 测试: 完整的单元测试
    • CodexExecutor 测试(12 个测试)
    • CodexIntegrationManager 测试(7 个测试)
  • 文档: 完整的用户文档
    • 安装指南
    • 配置说明
    • 使用示例
    • 故障排除
    • 最佳实践

改进

  • Worker Agent 支持多种执行器(CodeGenerator 和 Codex)
  • 配置系统支持 Codex 相关配置
  • 错误处理更加健壮

[3.0.0] - 2026-04-06

新增

双层 Agent 架构

  • Decision Agent(决策代理): 智能决策代理,作为系统的大脑
    • 理解用户意图和上下文
    • 基于 Soul 配置文件做决策
    • 委派任务给 Worker Agent
    • 评估执行结果
    • 与用户交互以获取澄清
    • 决策流程状态机(UNDERSTAND → ANALYZE → DECIDE → DELEGATE → EVALUATE → COMPLETE)
  • Worker Agent(工作代理): 任务执行代理,专注于执行
    • 执行 Plan → Generate → Evaluation 流程
    • 返回客观数据,不做决策
    • 支持输出选项供决策
    • 报告执行状态和进度
  • Agent Orchestrator(代理编排器): Agent 间的通信枢纽
    • 管理 Agent 通信和消息传递
    • 控制 Agent 生命周期
    • 支持并发执行
    • 记录和追踪所有消息
  • Context Manager(上下文管理器): 状态管理系统
    • 短期上下文(内存)用于快速访问
    • 长期上下文(SQLite)用于持久化
    • 存储层间的自动同步
    • 上下文隔离(用户/会话/项目)
    • 大小管理和清理

扩展的决策类型

  • 代码接受: 基于质量接受、改进或重新生成代码
  • 技术选型: 基于风险容忍度选择技术
  • 架构决策: 基于结构偏好选择架构模式
  • 实现决策: 基于细节导向选择实现方式

增强的 Soul Profile 集成

  • 扩展 SoulRuleEngine 添加结构偏好规则
  • 扩展 SoulRuleEngine 添加细节导向规则
  • 决策上下文传递机制
  • 决策解释和推理

变更

破坏性变更:API 变更

  • AutonomousExecutor.execute() 返回结构变更
    • 旧:{"status": "success", "results": [...]}
    • 新:{"status": "success", "decision": {...}, "worker_result": {...}}
  • Decision 阶段输出格式扩展以支持多种类型
  • Worker 阶段输出格式标准化(移除决策字段)

重构组件

  • AutonomousExecutor 简化为 Agent 编排器
  • 通过 legacy_mode 参数实现向后兼容层
  • 新旧 API 格式转换工具

改进

决策质量

  • 在 Decision Agent 中集中决策逻辑
  • Soul profile 集成实现个性化决策
  • 上下文感知的决策制定
  • 带推理链的决策解释

用户体验

  • 主动的用户交互
  • 决策解释
  • 跨会话的上下文感知
  • 更好的错误处理和恢复

架构

  • 清晰的关注点分离(决策 vs 执行)
  • 更好的扩展性支持新决策类型
  • 模块化架构便于维护
  • 改进的可测试性

性能

监控

  • LLM 调用追踪和指标
  • 决策循环计数
  • 上下文大小监控
  • 执行时间追踪

优化

  • 上下文缓存减少 LLM 调用
  • 决策缓存处理重复场景
  • 优化的 prompt 工程

文档

新增文档

  • 架构设计文档
  • 从旧架构到新架构的迁移指南
  • 不同场景的使用示例
  • API 文档更新

示例

  • 简单任务执行示例
  • 技术选型决策示例
  • 架构决策示例
  • 集成示例

测试

新增测试

  • Decision Agent 单元测试
  • Worker Agent 单元测试
  • Agent Orchestrator 单元测试
  • Context Manager 单元测试
  • Agent 协作集成测试
  • 不同决策类型的场景测试

迁移

兼容层

  • legacy_mode 参数实现向后兼容
  • 结果格式转换工具
  • 渐进式迁移路径

迁移指南

  • 分步迁移说明
  • 破坏性变更文档
  • 常见问题和解决方案
  • 回滚计划

[2.0.0] - 2026-04-05

新增

  • 初始自主执行器实现
  • Plan → Generate → Evaluation → Decision 流程
  • Soul profile 集成
  • 代理决策制定
  • 决策日志记录

[1.0.0] - 2026-04-04

新增

  • 初始 CLI 实现
  • Soul profile 生成
  • 基本任务执行
  • 配置管理