评测集不是攒一堆问题,而是覆盖真实任务、历史坏例和边界场景,让每次改动都有回归依据。
阅读全文Interview Articles
程序员面试专题库
从岗位、技术栈和面试追问切入,快速找到能直接用于复习、项目表达和查漏补缺的文章。
长任务 Agent 要像工作流系统一样管理状态,不能把执行进度只放在一次模型上下文里。
阅读全文RAG 重排的价值是把真正有用的证据放到前面,但它也会带来延迟和成本,需要按场景取舍。
阅读全文向量检索质量不只取决于向量数据库,embedding 模型、文本切分、领域词和评估样本都会决定召回效果。
阅读全文灰度发布不是把用户分批放进新版本,而是让变更在可观测、可回滚、可兼容的前提下逐步扩大。
阅读全文限流、熔断、降级不是三个口号,而是系统在压力和故障下保护核心链路的不同动作。
阅读全文鉴权不是只有登录态,网关验证身份,服务端判断业务权限,高风险动作还需要二次确认和审计。
阅读全文可观测性不是多打印日志,而是让一次请求从入口到下游都有可追踪证据,故障时能快速收敛范围。
阅读全文大模型安全不是提示词里写几句禁止,而是后端要设计输入、输出、权限、确认和审计的完整边界。
阅读全文企业 RAG 的权限问题不能交给模型自觉,必须在检索和上下文构造阶段就过滤掉无权限资料。
阅读全文模型路由不是简单把请求分给便宜模型,而是按任务难度、风险、延迟和成本选择合适路径。
阅读全文Agent 的能力不只在能拆任务,而在计划能被约束、执行能被审计、反思不能无限循环。
阅读全文
第 1 / 8 页
下一页