Skip to content

aigc

通用 CodeAgent 的落地实践:从架构到关键设计点

引言

如何构建一个真正能在开发流程中派上用场的 CodeAgent?不是那种回答一次就结束的代码问答机器人,而是能够理解任务、拆解步骤、操作文件、运行测试、并在遇到问题时自主调整的开发助手。

这个问题看似简单,实际落地时却会遇到大量工程细节:Agent 的状态如何建模?工具该怎么设计才能让模型稳定调用?上下文窗口有限的情况下如何让 Agent "看到"足够的信息?当 Agent 的一次操作出错时,系统该如何恢复?

这篇文章试图分享我们在这个过程中积累的一些经验。技术选型上,我们使用的是 LangGraph 和 LangChain 1.0,配合 Textual TUI 和 MCP 工具协议。但我们更希望讨论的是设计思路本身——这些思路在其他框架和工具链下同样适用。

科学评测 AI 应用,分离“随机性”与“真实能力”

摘要: 本文提出了一种“N-Fold 稳定性优先”的评测框架。它通过 N 次重复实验,引入标准差 (StdDev)案例稳定性 (Case Stability Rate) 两个核心指标,帮助团队科学地量化和剥离 AI 模型的输出随机性,从而准确定位“稳定失败”的案例,实现可控、可迭代的工程优化。

LLM Agents 架构设计实践指南

1. 前置了解

What is an agent(智能代理)

  • 定义:一种基于 LLM 的系统,能够独立执行复杂任务,代替用户完成工作流程。

  • 特点

    • 决策与执行:利用 LLM 管理工作流,自动完成任务或在失败时将控制权交还用户;
    • 多工具支持:通过调用外部系统工具(API、数据库等)获取信息或采取操作;
    • 安全性保障:在明确的规则下运行,确保行为可控、安全
  • 区别

    • 与普通 LLM 应用相比::普通的 LLM 应用(如单轮对话、情感分析)不属于 agent,因为它们不能自主管理复杂工作流与
    • Workflows(工作流)相比::Workflows是系统通过预定义的代码路径编排 LLM 和工具,而 Agents 是系统中 LLM 动态指导自身的流程和工具使用,维持对任务完成方式的控制权

🔌从0到1带你了解和使用 MCP—AI应用拓展绕不开的协议

文档目标

  • 科普当前 AI 模型与应用主流的交互标准协议 MCP(Model Context Protocol)
  • 帮助了解 MCP 与传统 API 之间的区别以及适用场景
  • 指导如何从0到1搭建和使用 MCP 服务,提供其通用思路和具体实践教程
  • 提供目前 MCP 的主流资源,帮助了解其业界的相关生态

阅读受众

  • 对 AI 模型与应用之间的主流交互协议感兴趣,希望了解 MCP 来帮助拓展 AI 应用
  • 想要进一步了解 MCP 的底层以及实践,如与传统 API 的对比、底层架构和使用教程等

探索 Cursor—AI 编程的“版本答案”之一

文档目标

  • 科普当前 AI 编程的“版本答案”之一——Cursor 的概念及使用
  • 帮助了解 Cursor 的基本用法和高阶用法
  • 探讨 Cursor 的适用场景和短板以及最佳实践

阅读受众

  • 对 AI(或 LLM)编程感兴趣,希望了解当下相关工具来帮助理解
  • 想要进一步了解 Cursor 及其使用方法与最佳实践来提升编程效率