通用专题 Java/后端开发 向量检索工程化 向量检索上线后变差,问题常常出在版本、切分和回滚 向量检索质量不只取决于模型,embedding 版本、切分策略、索引参数、权限过滤和回滚方案都会影响线上效果。 阅读全文
多家公司 AI 后端/大模型应用开发 RAG 知识库更新 RAG 知识库更新后为什么会变差:切分、版本和缓存的连锁反应 RAG 不只难在首次搭建,知识库持续更新后更考验版本管理、缓存失效、索引一致性和坏例回归。 阅读全文