先用一句话判断故障类型
如果是“能发布但打不开”,先看路由和缓存;如果是“根本没产物”,先看构建;如果是“偶发失败”,优先怀疑环境漂移、速率限制或外部平台不稳定。
1先确认报错出在构建前还是构建后
2再确认失败是稳定复现还是偶发
3最后决定修复、重试还是回滚
部署出问题时,最有效的办法不是盯着“最后一步挂了”,而是像发布工程师那样把链路拆成 构建、产物、上传、路由、缓存、回滚 六段,逐段确认到底是哪里失真。
latest.html、history.html 是否存在。如果这次没落地,不要硬说成功。最实用的做法是直接给出该 topic 的 latest.html 与 history.html,让使用者至少有稳定入口,再继续修复。
部署问题本质上不是“脚本有没有跑”,而是“用户最终能不能稳定打开正确版本”。
围绕部署问题的常见故障、排查路径、回退策略与稳态发布方式。
One next action: open latest.html for the rolling entry, then use history.html if you need a fixed snapshot from run 20260313-170628-29110.