指南目录/ 知识库与 RAG
RAG 混合检索与 Rerank 调优方法
知识库答得不准时,很多团队第一反应是换更大的模型。实际上更常见的根因是召回环节没做好,尤其是专有名词、编号、表格字段和半结构化内容,纯向量检索往往不够稳。
先看结论
当纯向量召回不够稳时,如何把关键词检索、向量召回和重排组合起来。
适合谁看
适合准备做企业知识库、客服机器人、FAQ 助手和 AI 质检的团队。
这篇会回答
• 混合检索解决的是召回覆盖问题
• Rerank 解决的是候选结果顺序问题
• 调优必须围绕真实问题集做

Reading Path
这篇在专题里的位置
从文档入库、混合检索、Rerank、Prompt 注入防护到效果评测、ROI 和客服质检,串成一条完整落地路径。
第 1 节
混合检索解决的是召回覆盖问题
向量检索擅长语义相近,全文检索擅长精确命中,两者各有盲区。只用其中一种,很容易在真实业务问题里漏掉关键片段。
更稳的方法是先用混合检索拉宽召回范围,再交给后面的排序环节做精修,而不是一上来就想靠单一检索方式包打天下。
第 2 节
Rerank 解决的是候选结果顺序问题
很多知识库不是完全没召回到答案,而是正确片段排得太靠后,最终没进模型上下文窗口。
这时候加入 Rerank 的意义,不是创造新答案,而是把真正相关的候选提到前面,让最终上下文更干净。
第 3 节
调优必须围绕真实问题集做
如果没有真实问题集,你很难知道召回差是词法问题、语义问题还是排序问题。
因此上线前要准备一组真实问答样本,记录每个问题的命中文档、排序位置和最终回答效果,再决定 topK、召回源和重排策略。
FAQ
常见问题
知识库一开始就一定要上 Rerank 吗?
不一定。小规模资料和简单问答先用混合检索就能跑起来,只有在候选很多、排序不稳时,Rerank 的价值才会明显放大。
为什么加了 Rerank 还会答错?
因为 Rerank 只能优化候选顺序,不能弥补切片错误、文档噪声或回答 Prompt 设计不当这些更前面的缺陷。
Continue Reading
继续沿着这条主线看
这部分不再重新给你一堆大卡片,而是直接把下一步阅读顺序列出来,方便继续往下走。