多家公司算法工程师推荐系统 2026-06-14

推荐系统面试怎么讲召回、排序和特征，才不空泛

推荐系统不是堆模型名。面试官更关心你如何定义目标、组织召回和排序、处理冷启动，并用实验验证业务效果。

推荐系统是算法面试里的高频项目，但很多回答会陷入模型名堆砌：协同过滤、向量召回、深度排序、特征交叉。真正的面试追问通常更具体：候选内容从哪里来？为什么召回不到？排序指标为什么提升但用户反馈变差？新用户没有行为怎么办？线上延迟怎么控制？

推荐系统可以按三层讲：召回、排序、重排。召回解决“从海量内容里先找一批可能相关的候选”；排序解决“这些候选谁排前面”；重排解决“最终展示时还要考虑多样性、去重、业务规则和用户体验”。把层次讲清楚，面试官才知道你理解系统结构。

召回要讲覆盖和噪声

召回不是越多越好。召回太少，用户可能看不到想要的内容；召回太宽，排序压力变大，噪声也会增加。面试里可以讲多路召回：基于用户历史行为、相似内容、热门内容、关注关系、关键词或向量相似度。每一路召回都有适用场景和问题。

比如热门召回能兜底，但容易让内容单一；相似内容召回相关性强，但可能让用户越看越窄；向量召回能捕捉语义相似，但需要处理训练数据和向量更新。这样讲比只说“用了向量召回”更完整。

推荐排序经常有多个目标。点击率高不一定代表体验好，停留时间长也可能是内容低质但吸引注意。面试里可以讲主目标和保护目标：主目标可能是点击、转化、完播，保护目标可以是负反馈、投诉、内容多样性、长期留存。

如果面试官问为什么模型分数提升但线上效果一般，可以从样本偏差、离线指标和线上目标不一致、特征延迟、流量分层、实验周期太短等角度分析。推荐系统最重要的不是会训练排序模型，而是知道模型为什么会在真实用户面前失效。

冷启动是推荐面试常见追问。新用户没有行为，可以用注册信息、入口来源、地理位置、热门内容、主动选择兴趣、短期点击反馈来快速建立偏好。新内容没有历史反馈，可以用内容标签、文本或图片特征、作者信息、小流量探索来获得初始数据。

回答冷启动时要注意不要过度承诺。没有行为就不可能立刻精准，只能通过兜底、探索和快速反馈逐步收敛。承认边界比说“用大模型解决”更可信。

推荐项目上线通常要做对照实验。不要只说“指标提升了”。要讲实验对象、流量比例、观察周期、主指标、保护指标和分层结果。比如整体点击率提升，但新用户下降，就不能简单判定成功；收入提升但负反馈增加，也要谨慎。

一个成熟回答会包含失败实验。真实推荐系统里，失败实验很正常。能说出一次实验为什么失败，以及如何根据样本或用户分层调整，会比只讲成功案例更有说服力。

推荐系统面试的高分回答，不是把每个模型都讲一遍，而是把“候选怎么来、顺序怎么定、用户为什么满意、系统如何验证”讲清楚。