Skip to content
Calvin's Blog

Calvin's Blog

Hello 👋🏻

Welcome to my technical blog. I’m Calvin, a Senior Mobile Developer specializing in high-performance cross-platform solutions (Flutter/React Native) and AI integration. Here I share my journey and insights from over a decade of engineering experience.

Latest Posts

Read all posts
Agent Skill 评测实战:别再写完就算,先把对照实验跑起来

基于百度 Geek 说关于 Agent Skill 的文章,抽取其中最有工程价值的评测章节,整理出一套从基线、用例、打分到迭代闭环的实践方法。

Mar 10, 2026
如何写好 agents.md:从 2500+ 仓库提炼的可执行规范

GitHub 对 2500+ agents.md 的分析显示,高质量 Agent 配置的关键不在“提示词文案”,而在可执行命令、清晰边界与可验证流程。

Mar 5, 2026
AGENTS.md 可能在伤害你的编码 Agent:一项实证研究给出的反直觉结论

ETH Zurich 在多代理与多仓库基准上的研究显示,自动生成的 AGENTS.md 往往增加推理成本并拉低正确率;真正有效的是短小、动态维护的“风险清单”。

Mar 5, 2026
Skill-creator 更新解读:用 Evals 与基准测试把 Skills 做成可验证资产

Claude 的 skill-creator 新增评测、基准与触发优化能力,核心价值是把“看起来可用”的 Agent Skills 变成“可验证、可回归、可演进”的工程资产。

Mar 4, 2026
Claude Skill 构建完整指南:从入门到精通

深入解析 Anthropic 官方 Claude Skill 构建指南,涵盖核心概念、技术要求、实践模式与故障排除,助你打造可复用的 AI 工作流。

Mar 3, 2026
Anthropic Advanced Tool Use 解读:让 Agent 在大规模工具系统中稳定工作

Anthropic 提出的 Tool Search Tool、Programmatic Tool Calling、Tool Use Examples,分别解决工具发现、执行效率与参数正确性问题,可组合为可扩展的 Agent 工程方案。

Mar 3, 2026
把工单分析 SOP 做成 Skill:用 Copy as fetch 取代脆弱的页面自动化

通过将 DevTools 的 Copy as fetch 与 agent-browser eval 组合,绕开不稳定的页面点击自动化,把内网工单分析流程固化为可复用 Skill。

Mar 3, 2026
AI代理的上下文工程:构建Manus的经验教训

探索AI代理上下文工程的核心原则:KV缓存优化、动作空间管理、文件系统作为外部记忆、注意力操控与错误恢复等实践经验。

Mar 2, 2026
Cursor Rules 优化实战:把提示词堆砌改造成可治理的工程体系

基于得物技术实践,拆解 Cursor Rules 从冗余冲突到三层治理架构的演进路径,并给出可落地的实施与度量方案。

Mar 2, 2026
Node.js 2025 工程实践:从依赖外置到运行时内建的迁移清单

梳理 Node.js 在 2025 年的关键工程变化,聚焦 ESM、内建 Web API、测试、并行与可观测能力,以及可分阶段落地的迁移策略。

Mar 2, 2026