Skip to content

All Blog

交代过去 25.12月总结

0. 前言

12 月对我来说,并不是发生了什么巨大转折的一个月。

更多的时候,它像是一个需要被收尾的节点。

就像这一年里的很多事情已经发生过、推进过,也在当下留下了结果和感受。

与其急着从中提炼结论、寻找答案,我更需要先做的一件事,是如实地把它们交代清楚

对我来说,每个月抽出时间来进行总结,在这个阶段的意义并不在于给未来下判断,也不是为变化找理由,

而是让已经发生的事情有一个清晰的位置——

什么是用来交代过去的,什么是用来记录现实的,什么是需要单独拆出来、面向未来慢慢重建的。

当一些问题被清楚地记录下来,而不是反复被带入现在,它们才真正成为“过去”。

Anthropic Agent Skills 完整指南:让 AI Agent 掌握专业技能的标准化方案

引言

随着大语言模型在各个领域的应用越来越广泛,如何让 AI Agent 更好地完成特定领域的专业任务成为了一个重要课题。Anthropic 推出的 Agent Skills 提供了一个优雅的解决方案——通过标准化的技能包(Skill),让 Claude 能够动态加载专业指令和资源,从而在特定任务上表现得更加专业和一致。

本文将深入介绍 Anthropic 的 Skills 项目,帮助你理解其核心价值、技术架构和实际应用。

技术准确性声明:本文中所有关键技术细节(Progressive Disclosure、高效脚本执行、环境隔离等)均基于 Anthropic 官方文档验证,包括: - Agent Skills API Guide - Agent Skills Overview - Anthropic Engineering Blog - Agent Skills

文中涉及官方文档的部分均以引用块标注,确保信息的准确性和可追溯性。

跨平台 Skills 实践指南:在任何 AI 工具中使用专业技能

引言

Anthropic 的 Agent Skills 提供了一套优雅的专业技能管理方案,但最初它是 Claude 专属特性。随着社区的发展,现在有多种方案让其他 AI 编程工具(Cursor、Windsurf、Aider 等)也能使用 Skills,甚至在 LangChain、LlamaIndex 等框架中实现类似的 Skills 模式。

本文将介绍三种跨平台 Skills 实践方案,从开箱即用深度定制,以及在实战中创建和迭代 Skills 的最佳工作流。

前置阅读:建议先阅读 Anthropic Agent Skills 完整指南 了解 Skills 的核心概念和技术架构。

通用 CodeAgent 的落地实践:从架构到关键设计点

引言

如何构建一个真正能在开发流程中派上用场的 CodeAgent?不是那种回答一次就结束的代码问答机器人,而是能够理解任务、拆解步骤、操作文件、运行测试、并在遇到问题时自主调整的开发助手。

这个问题看似简单,实际落地时却会遇到大量工程细节:Agent 的状态如何建模?工具该怎么设计才能让模型稳定调用?上下文窗口有限的情况下如何让 Agent "看到"足够的信息?当 Agent 的一次操作出错时,系统该如何恢复?

这篇文章试图分享我们在这个过程中积累的一些经验。技术选型上,我们使用的是 LangGraph 和 LangChain 1.0,配合 Textual TUI 和 MCP 工具协议。但我们更希望讨论的是设计思路本身——这些思路在其他框架和工具链下同样适用。

不同的归因 25.11月总结

0. 前言

这段时间在复盘一些事情的时候,发现自己经常会陷入两种归因:

一种是过于简单的叙事,比如“我就是不行”“对方太过分了”。

另一种是太绝对的结论,听上去很有道理,但对下一步该怎么做没什么帮助。

后来我开始有意识地问自己:

同样一件事,有没有一种归因方式,既能更接近真实的根因,又能指导我接下来该怎么做?

科学评测 AI 应用,分离“随机性”与“真实能力”

摘要: 本文提出了一种“N-Fold 稳定性优先”的评测框架。它通过 N 次重复实验,引入标准差 (StdDev)案例稳定性 (Case Stability Rate) 两个核心指标,帮助团队科学地量化和剥离 AI 模型的输出随机性,从而准确定位“稳定失败”的案例,实现可控、可迭代的工程优化。

概括的幻觉 25.9月下旬-10月总结

0. 前言

随着经历的增加,我开始学会用“概括”来看待事情。

它带来一种清晰感——好像能用一句话,把复杂的经历和情绪都装进去。

可慢慢地,我发现这种清晰,其实是一种幻觉。

概括让我们以为理解了,

但更多时候,它会让我失去继续思考,也忽略当下的情况。

那些被我总结过的道理,总是很难带入当下的场景和体验。

它们像是事后才出现的反应,

到了需要它们的时候,它们往往像失去了声音一般。

总是误以为自己通过概括获得了理解, 实际上却失去了理解的细节。

真正的理解,也许不是提炼出一句话,

而是回到那件具体的事情里,重新感受当时的自己。

不急着下结论,不急着解释,

只是去看——那一刻我究竟在想什么,又是怎么走到这里的。

力不从心 25.8-9月中旬总结

0. 前言

现实就是这样,不断地为我纠正,以前认为最糟糕的时刻还并不是最糟糕的。

这将近一个半月的时间,应该是今年平均表现最差和最为混乱失衡的一个周期,是投入“个人时间”上最少的周期。

各种不好的现象和习惯都让我变得不太像之前的“自己”,能感受到自己的生命力在一点点流失。

仅仅是维持好正常的状态和表现,就已经变得异常艰难。

很多事情,很多自己,很多想要看清的思想和感情,很多想要得到的问题和答案,力不从心。就这样安慰自己。

随着惯性 25.7月总结

0. 前言

7月对于我来说更多就像是一个朦胧的梦境,偶尔想不起自己所做的事

弥漫着的大雾让我难以看清,随着我身体和精神上的惯性行走着

时好时坏,时而美丽又时而邪恶,面对无法稳定的自己会感到麻木

状态的起伏也如玻璃一般,积攒着,忍耐着,然后在某个受力点,全部破碎

我想,那既然这样,那索性随着惯性继续吧,让一切自然发生,要尽量照顾好自己

当一切秩序被打破 25.5-6月总结

0. 前言

当每个人提到自己的焦虑和压力时,所体验到的份量:

或许大到能把人推进暗黑深渊而无法自拔,又或许小到也只是随意闪过的念想。

就是这样越简单的情绪描述,往往也是越难以控制和抗争的对象。

这两个月对我来说印象和感受最深的,就是焦虑和压力,而与之伴随的生活也总是被打乱和折磨。

我想,当一切秩序被打破,当所有精神被摧毁,残存下来的我会变成什么样子。

LLM Agents 架构设计实践指南

1. 前置了解

What is an agent(智能代理)

  • 定义:一种基于 LLM 的系统,能够独立执行复杂任务,代替用户完成工作流程。

  • 特点

    • 决策与执行:利用 LLM 管理工作流,自动完成任务或在失败时将控制权交还用户;
    • 多工具支持:通过调用外部系统工具(API、数据库等)获取信息或采取操作;
    • 安全性保障:在明确的规则下运行,确保行为可控、安全
  • 区别

    • 与普通 LLM 应用相比::普通的 LLM 应用(如单轮对话、情感分析)不属于 agent,因为它们不能自主管理复杂工作流与
    • Workflows(工作流)相比::Workflows是系统通过预定义的代码路径编排 LLM 和工具,而 Agents 是系统中 LLM 动态指导自身的流程和工具使用,维持对任务完成方式的控制权

面对重蹈覆辙 25.3月 总结

0. 前言

“好像又遇到了似曾相识的事情。”

“好像又来到了曾经走过的地方。”

“好像这次的结果或感受,也与上一次并无不同。”.......

似乎我的人生总是面对着这样的“重蹈覆辙”,像是时间蓄意安排一般,然后一次次地需要做出选择。

而每次看似是做了不同的选择,却发现脚下的影子依旧重叠着昨日的痕迹,神秘的“惯性”在悄悄地控制着。

有时候,我甚至怀疑自己是否陷入某种命定的循环,无论是好的还是坏的,无论是挣扎的泥潭还是沉浸的愉悦。

“但是话说回来,这个问题有那么重要吗?”

“重复了便重复了,难道你能阻止事情的再一次发生吗?”

我当然无法阻止重复的到来,我真正所惧怕的也从不是重复本身,而是面对这些重复时内心逐渐滋长的无感与麻木。

就像面对潮汐与日升日落,站在岸边的自己渐渐失去感知,

我并不希望成为那样的人,我仍想朝着每天升起的太阳与月亮挥手,保留内心的敏锐与鲜活。

“或许这一次,并非完全一样。”

“或许我也可以稍微做出一些不同的选择。”

“或许,此刻的一切才是最真实的。”.......

也许每个人的一生都是在不断与自己过去的影子交谈,就像生命本来就带着的某种必然。

而所谓真正的成长,从来不是彻底摆脱重复,也不是永远不再经历相似的喜与悲,

而是再次站在相似路口时,能够察觉到自己内心微妙而重要的改变,并且敢于做出与过去不同的选择。

人生并没有永远的正确答案,而是当与曾经的自己不期而遇时,学会从容地感恩和告别,如同第一次相遇时那般。

深入理解四种经典负载均衡算法

0. 背景介绍

什么是负载均衡

负载均衡(Load Balancing)是一种计算机网络技术,用于在多个计算机、网络连接、CPU、磁盘驱动器或其他资源中分配负载,优化资源使用,最大化吞吐量,最小化响应时间,避免过载。使用多个组件进行负载分担,相比使用单个组件,可以通过冗余提高可靠性和可用性。

Text Only
                    ┌─────────────┐
                    │ 负载均衡器  │
                    └─────────────┘
          ┌─────────────────────────────┐
          │                             │
    ┌─────┴─────┐             ┌─────────┴─────┐
    │           │             │               │
┌───▼───┐   ┌───▼───┐     ┌───▼───┐       ┌───▼───┐
│服务器1 │   │服务器2 │     │服务器3 │       │服务器4 │
└───────┘   └───────┘     └───────┘       └───────┘

🔌从0到1带你了解和使用 MCP—AI应用拓展绕不开的协议

文档目标

  • 科普当前 AI 模型与应用主流的交互标准协议 MCP(Model Context Protocol)
  • 帮助了解 MCP 与传统 API 之间的区别以及适用场景
  • 指导如何从0到1搭建和使用 MCP 服务,提供其通用思路和具体实践教程
  • 提供目前 MCP 的主流资源,帮助了解其业界的相关生态

阅读受众

  • 对 AI 模型与应用之间的主流交互协议感兴趣,希望了解 MCP 来帮助拓展 AI 应用
  • 想要进一步了解 MCP 的底层以及实践,如与传统 API 的对比、底层架构和使用教程等