Interview Articles

程序员面试专题库

从岗位、技术栈和面试追问切入，快速找到能直接用于复习、项目表达和查漏补缺的文章。

Java 后端 MySQL Redis RAG Agent 大模型

通用技术面 AI 后端/大模型应用开发 Prompt 版本管理

提示词要像代码一样有版本，否则改好一个问题会弄坏十个

提示词不是临时文案。只要影响线上输出，就需要版本、评测、灰度和回滚，否则一次小改动可能破坏大量已有场景。

阅读全文

通用技术面 AI 后端/大模型应用开发 RAG 知识库灰度

知识库更新也要灰度，RAG 不是上传完文档就上线

RAG 知识库更新会影响切分、召回、重排、缓存和引用。把新文档直接全量上线，可能让答案在用户面前变差。

阅读全文

通用技术面 AI 后端/大模型应用开发模型降级与质量边界

模型降级不是换个便宜模型，真正难的是质量边界

模型降级不是简单切到便宜模型。不同任务的正确性要求、可见承诺、延迟预算和失败处理，决定了降级能不能上线。

阅读全文

通用技术面 AI 后端/大模型应用开发大模型成本治理

大模型账单突然变高，通常不是模型单价一个原因

大模型成本上涨往往藏在长上下文、重复重试、无效流式输出和缓存失效里。面试里讲成本治理，要能把账单拆回一次请求的真实链路。

阅读全文

通用技术面 AI 后端/大模型应用开发 RAG 证据链

RAG 的引用不是装饰：证据链断了，答案越流畅越危险

RAG 不是把资料塞给模型。真正影响可信度的是每个结论能否追到证据、证据是否匹配问题，以及答错后能否回流修正检索链路。

阅读全文

多家公司 AI 后端/大模型应用开发大模型流式后端

大模型流式输出不是前端效果：后端要处理取消、超时和背压

流式输出不只是把字一个个吐给前端。后端要管理模型连接、客户端取消、超时、背压、部分结果和错误收尾。

阅读全文

多家公司 AI 后端/大模型应用开发大模型评测集

大模型评测集怎么建设：好问题、坏例和边界样本比数量更重要

评测集不是攒一堆问题，而是覆盖真实任务、历史坏例和边界场景，让每次改动都有回归依据。

阅读全文

多家公司 AI 后端/大模型应用开发 RAG 重排

RAG 重排为什么重要：召回很多资料，不等于模型会用对

RAG 重排的价值是把真正有用的证据放到前面，但它也会带来延迟和成本，需要按场景取舍。

阅读全文

多家公司 AI 后端/大模型应用开发 Embedding 与检索

Embedding 不是向量化按钮：检索质量从表示空间开始

向量检索质量不只取决于向量数据库，embedding 模型、文本切分、领域词和评估样本都会决定召回效果。

阅读全文

多家公司 AI 后端/大模型应用开发大模型安全边界

大模型安全边界落到后端：拒答、脱敏、审计和人工确认

大模型安全不是提示词里写几句禁止，而是后端要设计输入、输出、权限、确认和审计的完整边界。

阅读全文

多家公司 AI 后端/大模型应用开发企业 RAG 权限

企业 RAG 最容易翻车的地方：权限过滤必须早于生成

企业 RAG 的权限问题不能交给模型自觉，必须在检索和上下文构造阶段就过滤掉无权限资料。

阅读全文

多家公司 AI 后端/大模型应用开发模型路由

模型路由不是省钱技巧：质量、成本和延迟要一起算

模型路由不是简单把请求分给便宜模型，而是按任务难度、风险、延迟和成本选择合适路径。

阅读全文

第 1 / 2 页下一页