Skip to content
Calvin's Blog

Calvin's Blog

Hello 👋🏻

Welcome to my technical blog. I’m Calvin, a Senior Mobile Developer specializing in high-performance cross-platform solutions (Flutter/React Native) and AI integration. Here I share my journey and insights from over a decade of engineering experience.

Latest Posts

Read all posts
OpenAI 给管理层的 AI 采用五步法

这份 OpenAI 指南最值得记下来的,不是“尽快上 AI”,而是把组织转型拆成对齐、激活、放大、加速、治理五个动作,而且每一步都要有清晰的组织机制。

Mar 14, 2026
比 Function Calling 更重要的,是给 Agent 一条能自我修正的命令行

这篇 Reddit 讨论最值得记下来的,不是“CLI 一定赢”,而是统一入口、可组合操作和带方向感的报错,确实更贴近 Agent 的工作方式。

Mar 13, 2026
如何让 AI 翻译更准确?从提示词到质检闭环

梳理多篇关于 AI 翻译的实践文章后,我更认同一个结论:翻译准确性不是靠一条神奇 Prompt,而是靠任务定义、分阶段翻译、术语约束、模型选型和质检闭环一起做出来的。

Mar 12, 2026
编程 Agent 如何重塑工程、产品和设计

编程 Agent 改变的不是单点提效,而是 EPD 的协作重心。实现越来越便宜后,真正稀缺的是评审、取舍和跨角色判断。

Mar 12, 2026
Agent Skill 评测实战:别再写完就算,先把对照实验跑起来

基于百度 Geek 说关于 Agent Skill 的文章,抽取其中最有工程价值的评测章节,整理出一套从基线、用例、打分到迭代闭环的实践方法。

Mar 10, 2026
如何写好 agents.md:从 2500+ 仓库提炼的可执行规范

GitHub 对 2500+ agents.md 的分析显示,高质量 Agent 配置的关键不在“提示词文案”,而在可执行命令、清晰边界与可验证流程。

Mar 5, 2026
AGENTS.md 可能在伤害你的编码 Agent:一项实证研究给出的反直觉结论

ETH Zurich 在多代理与多仓库基准上的研究显示,自动生成的 AGENTS.md 往往增加推理成本并拉低正确率;真正有效的是短小、动态维护的“风险清单”。

Mar 5, 2026
Skill-creator 更新解读:用 Evals 与基准测试把 Skills 做成可验证资产

Claude 的 skill-creator 新增评测、基准与触发优化能力,核心价值是把“看起来可用”的 Agent Skills 变成“可验证、可回归、可演进”的工程资产。

Mar 4, 2026
Claude Skill 构建完整指南:从入门到精通

深入解析 Anthropic 官方 Claude Skill 构建指南,涵盖核心概念、技术要求、实践模式与故障排除,助你打造可复用的 AI 工作流。

Mar 3, 2026
Anthropic Advanced Tool Use 解读:让 Agent 在大规模工具系统中稳定工作

Anthropic 提出的 Tool Search Tool、Programmatic Tool Calling、Tool Use Examples,分别解决工具发现、执行效率与参数正确性问题,可组合为可扩展的 Agent 工程方案。

Mar 3, 2026