## 需求描述 当前 RAG 引擎只使用 pgvector 向量搜索(cosine similarity),对于精确关键词匹配场景效果不佳。 ## 建议方案 引入 BM25 全文检索,与向量搜索结合实现混合搜索: 1. PostgreSQL tsvector 全文索引 2. BM25 评分 + 向量相似度加权融合 3. RRF (Reciprocal Rank Fusion) 合并排序 ## 参考 - [pgvector + tsvector 混合搜索](https://github.com/pgvector/pgvector#hybrid-search) - [RAG Fusion 论文](https://arxiv.org/abs/2402.03367)
需求描述
当前 RAG 引擎只使用 pgvector 向量搜索(cosine similarity),对于精确关键词匹配场景效果不佳。
建议方案
引入 BM25 全文检索,与向量搜索结合实现混合搜索:
参考