欧易官方稳定版交易所
282.69MB · 2025-09-19
在大语言模型(LLM)火热的今天,RAG(检索增强生成) 系统几乎成了标配:
听起来很完美对吧?但问题是—— 召回的候选文档质量参差不齐,真正相关的往往只有少数几个。
这时候就需要一个关键角色登场了: Rerank(重排序)模型。
它的任务就是:从一堆候选文档里,精准挑出与 query 最相关的内容,并排到前面。
想象一下:
如果没有 Rerank,模型可能胡乱引用,最后回答走偏。 而有了 Rerank,系统就能把 真正相关的文档排在前面,让生成结果更精准。
既然 Rerank 这么重要,那么问题来了:它该怎么训练? 这里有三大经典方法:Pointwise、Pairwise、Listwise。
简单易上手 没直接优化排序
更贴近排序 只能学局部对比,不保证全局最优
效果最好,对准任务指标 训练复杂,标注和计算成本高
方法 | 输入形式 | 优点 | 缺点 |
---|---|---|---|
Pointwise | (query, doc) | 简单,标注易得 | 排序效果有限 |
Pairwise | (query, doc⁺, doc⁻) | 更贴近排序 | 只保证局部正确 |
Listwise | (query, [doc1, doc2,...]) | 效果最佳 | 成本高、实现复杂 |
一句话: Pointwise 上手快,Pairwise 更实用,Listwise 效果最好。
我把大模型路线分成L1到L4四个阶段,这份大模型路线大纲已经导出整理打包了,在智泊AI。