Skip to content

aigc

Anthropic Agent Skills 完整指南:让 AI Agent 掌握专业技能的标准化方案

引言

随着大语言模型在各个领域的应用越来越广泛,如何让 AI Agent 更好地完成特定领域的专业任务成为了一个重要课题。Anthropic 推出的 Agent Skills 提供了一个优雅的解决方案——通过标准化的技能包(Skill),让 Claude 能够动态加载专业指令和资源,从而在特定任务上表现得更加专业和一致。

本文将深入介绍 Anthropic 的 Skills 项目,帮助你理解其核心价值、技术架构和实际应用。

技术准确性声明:本文中所有关键技术细节(Progressive Disclosure、高效脚本执行、环境隔离等)均基于 Anthropic 官方文档验证,包括: - Agent Skills API Guide - Agent Skills Overview - Anthropic Engineering Blog - Agent Skills

文中涉及官方文档的部分均以引用块标注,确保信息的准确性和可追溯性。

跨平台 Skills 实践指南:在任何 AI 工具中使用专业技能

引言

Anthropic 的 Agent Skills 提供了一套优雅的专业技能管理方案,但最初它是 Claude 专属特性。随着社区的发展,现在有多种方案让其他 AI 编程工具(Cursor、Windsurf、Aider 等)也能使用 Skills,甚至在 LangChain、LlamaIndex 等框架中实现类似的 Skills 模式。

本文将介绍三种跨平台 Skills 实践方案,从开箱即用深度定制,以及在实战中创建和迭代 Skills 的最佳工作流。

前置阅读:建议先阅读 Anthropic Agent Skills 完整指南 了解 Skills 的核心概念和技术架构。

通用 CodeAgent 的落地实践:从架构到关键设计点

引言

如何构建一个真正能在开发流程中派上用场的 CodeAgent?不是那种回答一次就结束的代码问答机器人,而是能够理解任务、拆解步骤、操作文件、运行测试、并在遇到问题时自主调整的开发助手。

这个问题看似简单,实际落地时却会遇到大量工程细节:Agent 的状态如何建模?工具该怎么设计才能让模型稳定调用?上下文窗口有限的情况下如何让 Agent "看到"足够的信息?当 Agent 的一次操作出错时,系统该如何恢复?

这篇文章试图分享我们在这个过程中积累的一些经验。技术选型上,我们使用的是 LangGraph 和 LangChain 1.0,配合 Textual TUI 和 MCP 工具协议。但我们更希望讨论的是设计思路本身——这些思路在其他框架和工具链下同样适用。

科学评测 AI 应用,分离“随机性”与“真实能力”

摘要: 本文提出了一种“N-Fold 稳定性优先”的评测框架。它通过 N 次重复实验,引入标准差 (StdDev)案例稳定性 (Case Stability Rate) 两个核心指标,帮助团队科学地量化和剥离 AI 模型的输出随机性,从而准确定位“稳定失败”的案例,实现可控、可迭代的工程优化。

LLM Agents 架构设计实践指南

1. 前置了解

What is an agent(智能代理)

  • 定义:一种基于 LLM 的系统,能够独立执行复杂任务,代替用户完成工作流程。

  • 特点

    • 决策与执行:利用 LLM 管理工作流,自动完成任务或在失败时将控制权交还用户;
    • 多工具支持:通过调用外部系统工具(API、数据库等)获取信息或采取操作;
    • 安全性保障:在明确的规则下运行,确保行为可控、安全
  • 区别

    • 与普通 LLM 应用相比::普通的 LLM 应用(如单轮对话、情感分析)不属于 agent,因为它们不能自主管理复杂工作流与
    • Workflows(工作流)相比::Workflows是系统通过预定义的代码路径编排 LLM 和工具,而 Agents 是系统中 LLM 动态指导自身的流程和工具使用,维持对任务完成方式的控制权

🔌从0到1带你了解和使用 MCP—AI应用拓展绕不开的协议

文档目标

  • 科普当前 AI 模型与应用主流的交互标准协议 MCP(Model Context Protocol)
  • 帮助了解 MCP 与传统 API 之间的区别以及适用场景
  • 指导如何从0到1搭建和使用 MCP 服务,提供其通用思路和具体实践教程
  • 提供目前 MCP 的主流资源,帮助了解其业界的相关生态

阅读受众

  • 对 AI 模型与应用之间的主流交互协议感兴趣,希望了解 MCP 来帮助拓展 AI 应用
  • 想要进一步了解 MCP 的底层以及实践,如与传统 API 的对比、底层架构和使用教程等

探索 Cursor—AI 编程的“版本答案”之一

文档目标

  • 科普当前 AI 编程的“版本答案”之一——Cursor 的概念及使用
  • 帮助了解 Cursor 的基本用法和高阶用法
  • 探讨 Cursor 的适用场景和短板以及最佳实践

阅读受众

  • 对 AI(或 LLM)编程感兴趣,希望了解当下相关工具来帮助理解
  • 想要进一步了解 Cursor 及其使用方法与最佳实践来提升编程效率