指南目录/ 知识库与 RAG

RAG 混合检索与 Rerank 调优方法

知识库答得不准时,很多团队第一反应是换更大的模型。实际上更常见的根因是召回环节没做好,尤其是专有名词、编号、表格字段和半结构化内容,纯向量检索往往不够稳。

先看结论

当纯向量召回不够稳时,如何把关键词检索、向量召回和重排组合起来。

适合谁看

适合准备做企业知识库、客服机器人、FAQ 助手和 AI 质检的团队。

这篇会回答

混合检索解决的是召回覆盖问题

Rerank 解决的是候选结果顺序问题

调优必须围绕真实问题集做

RAG 混合检索与 Rerank 调优方法 文章配图
1

混合检索解决的是召回覆盖问题

向量检索擅长语义相近,全文检索擅长精确命中,两者各有盲区。只用其中一种,很容易在真实业务问题里漏掉关键片段。

更稳的方法是先用混合检索拉宽召回范围,再交给后面的排序环节做精修,而不是一上来就想靠单一检索方式包打天下。

2

Rerank 解决的是候选结果顺序问题

很多知识库不是完全没召回到答案,而是正确片段排得太靠后,最终没进模型上下文窗口。

这时候加入 Rerank 的意义,不是创造新答案,而是把真正相关的候选提到前面,让最终上下文更干净。

3

调优必须围绕真实问题集做

如果没有真实问题集,你很难知道召回差是词法问题、语义问题还是排序问题。

因此上线前要准备一组真实问答样本,记录每个问题的命中文档、排序位置和最终回答效果,再决定 topK、召回源和重排策略。

FAQ

常见问题

知识库一开始就一定要上 Rerank 吗?

不一定。小规模资料和简单问答先用混合检索就能跑起来,只有在候选很多、排序不稳时,Rerank 的价值才会明显放大。

为什么加了 Rerank 还会答错?

因为 Rerank 只能优化候选顺序,不能弥补切片错误、文档噪声或回答 Prompt 设计不当这些更前面的缺陷。

Continue Reading

继续沿着这条主线看

这部分不再重新给你一堆大卡片,而是直接把下一步阅读顺序列出来,方便继续往下走。