RAG 混合检索与 Rerank 调优方法
知识库答得不准时,很多团队第一反应是换更大的模型。实际上更常见的根因是召回环节没做好,尤其是专有名词、编号、表格字段和半结构化内容,纯向量检索往往不够稳。
先判断这篇是不是你当前要解决的问题,不要一上来就把全文从头读完。
如果没有官方入口清单,先看正文第一节,通常就能判断自己是不是走在对的方向上。
如果这篇解决了你的眼前问题,再回 知识库与 RAG 主线继续往下读。
当纯向量召回不够稳时,如何把关键词检索、向量召回和重排组合起来。
适合谁看
适合准备做企业知识库、客服机器人、FAQ 助手和 AI 质检的团队。
这篇会回答
• 混合检索解决的是召回覆盖问题
• Rerank 解决的是候选结果顺序问题
• 调优必须围绕真实问题集做

这篇放在主线里怎么用最快
从文档入库、混合检索、Rerank、Prompt 注入防护到效果评测、ROI 和客服质检,串成一条完整落地路径。
混合检索解决的是召回覆盖问题
向量检索擅长语义相近,全文检索擅长精确命中,两者各有盲区。只用其中一种,很容易在真实业务问题里漏掉关键片段。
更稳的方法是先用混合检索拉宽召回范围,再交给后面的排序环节做精修,而不是一上来就想靠单一检索方式包打天下。
Rerank 解决的是候选结果顺序问题
很多知识库不是完全没召回到答案,而是正确片段排得太靠后,最终没进模型上下文窗口。
这时候加入 Rerank 的意义,不是创造新答案,而是把真正相关的候选提到前面,让最终上下文更干净。
调优必须围绕真实问题集做
如果没有真实问题集,你很难知道召回差是词法问题、语义问题还是排序问题。
因此上线前要准备一组真实问答样本,记录每个问题的命中文档、排序位置和最终回答效果,再决定 topK、召回源和重排策略。
常见问题
知识库一开始就一定要上 Rerank 吗?
不一定。小规模资料和简单问答先用混合检索就能跑起来,只有在候选很多、排序不稳时,Rerank 的价值才会明显放大。
为什么加了 Rerank 还会答错?
因为 Rerank 只能优化候选顺序,不能弥补切片错误、文档噪声或回答 Prompt 设计不当这些更前面的缺陷。
别停在这一篇,继续往下走
这部分不再重新给你一堆大卡片,而是直接把下一步阅读顺序列出来,方便继续往下走。
如果这页已经解决了眼前问题,下一步直接从主入口继续往下走
百度流量不会只落在首页。详情页也要把新手路径、专题目录、问题页、对比页、工具页和模板中心重新串起来,方便读者继续往下读。
如果问题已经进入风控补件、恢复账期或限制解除,直接切回恢复合作主线
有些搜索看起来像余额、账期或停服问题,实际已经进入恢复合作阶段。别继续在当前目录里绕,先用恢复专题、恢复 FAQ 和恢复模板合集把阶段重新分清。
新手开始
第一次接触 AI 大模型时,先按任务进入最短路径,少走弯路。
AI Coding 特别页
把模型、Token、Skills、项目规则和工作流集中到一页里,适合先判断 AI Coding / Agent 工作台怎么搭的人。
AI API 网关特别页
如果你手里有 API / Token 资源,准备做统一入口、兼容接口、配额治理和套餐报价,这页更接近商业承接。
AI API 计费 / 余额 / 预算治理特别页
如果你已经开始真实消耗 OpenAI、Claude、DeepSeek 或兼容网关额度,这页更适合承接余额、限额、预算和分摊治理类搜索流量。
企业知识库 / RAG 特别页
如果你准备做企业知识库、FAQ 助手、客服机器人或 AI 质检,这页更适合承接真正要立项的人。
文档 / OCR / 报销自动化特别页
如果你准备做发票识别、PDF 表格提取、合同总结或报销自动化,这页更适合承接执行型流量。
专题目录
按真实搜索意图分流,先进入官网入口、Key 开通、计费或知识库专题。
对比目录
适合已经进入选型、预算和方案判断阶段的搜索流量。
工具目录
把计算器、格式化工具和提示词工具挂出来,承接更接近变现的需求。
商务模板
采购、开票、回款和风控恢复模板,直接接企业执行阶段的搜索需求。
站点地图
把核心栏目、重点专题和高优先级入口集中列出来,方便继续浏览和抓取。