指南目录/ API 接入

DeepSeek API 429 限流排查与重试策略

429 不一定代表平台故障,更多时候是你的请求节奏、并发方式和重试策略叠加后把自己打爆了。排查这类问题,先看流量形态,再看补救动作,效率最高。

先看结论

从并发峰值、退避重试到队列削峰,快速定位 429 的常见根因。

适合谁看

适合正在接第三方模型 API、做兼容层、排线上报错的开发者和团队。

这篇会回答

先确认是不是请求洪峰把自己顶上去了

重试要做退避,不要做死循环

真正要上线时要加削峰和降级

DeepSeek API 429 限流排查与重试策略 文章配图
1

先确认是不是请求洪峰把自己顶上去了

很多团队一看到 429 就先换 Key,但真正的问题往往是短时间内并发过高,或者多个服务共用一个上游凭据。

首轮排查建议先看一分钟内的请求数、失败峰值和来源分布,确认到底是某个批处理脚本、用户入口还是重试风暴导致的。

同一时间是否有多个 worker 一起请求

是否把同步任务和异步任务打到同一条上游链路

失败后是否立即无间隔重试

测试脚本是否误连线上 Key

2

重试要做退避,不要做死循环

429 最怕的不是一次失败,而是失败后立刻再来一次。这样会把临时限流放大成持续性故障。

更稳的做法是指数退避加随机抖动,让重试流量慢下来,同时给上游窗口恢复时间。

3

真正要上线时要加削峰和降级

如果你的业务有批量生成、定时任务或运营活动,最好在入口处加队列,把瞬时高峰摊平。

对非核心请求,可以考虑排队、延迟返回或切到备用模型,而不是让前台用户一直硬撞主链路。

FAQ

常见问题

429 后立刻重试有用吗?

通常不建议。没有退避的立即重试很容易把限流持续放大,最好采用指数退避并控制最大重试次数。

出现 429 就一定要换 Key 吗?

不一定。先确认是不是并发过高、任务堆积或多个服务共用同一上游额度,很多时候优化请求节奏比换 Key 更有效。

Continue Reading

继续沿着这条主线看

这部分不再重新给你一堆大卡片,而是直接把下一步阅读顺序列出来,方便继续往下走。