头部C9科班本硕研二,拿到大模型算法岗

是时候准备春招和实习了。

节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。

总结链接如下:

《大模型面试宝典》(2025版) 发布!

喜欢本文记得收藏、关注、点赞。

头部C9科班本硕研二,拿到大模型算法岗_第1张图片


bg:头部C9科班本硕研二,2中厂大模型应用相关实习

头部C9科班本硕研二,拿到大模型算法岗_第2张图片
年前最后几天,拿到了Offer,面试感觉从一到三面压力逐渐下降,三面 leader 只是对项目细节和落地感兴趣,没有拷打技术原理和八股,都在问实现的事。

一面

  • 自我介绍
  • 实习项目1中RAG怎么做的,怎么设计的召回排序
  • embedding 召回和粗排有哪些方案
  • 数据 pipeline 形式
  • 了解 ReAct 吗,了解强化学习和奖励函数吗?
  • 实习项目2中微调模型选型原因?
  • 为什么不考虑大参数模型,为什么用 LoRA ?
  • 微调数据 pipeline,数据集细节,数据整合策略
  • 为什么混合训练?
  • 出现新数据加入后离线评估掉点怎么办?
  • 会 vllm 吗?

代码

  • 编辑距离(ACM 格式)

二面 (mentor2)

  • 自我介绍
  • 项目背景?
  • LLM 的输出是什么?
  • RAG 用的 Embedding 模型是哪个?会有误判的情况嘛?怎么解决?遇到的其他困难?
  • 如果项目结果仍然不被公司内部同事接受,该怎么让这个服务在全公司范围内开展和运作?
  • 微调数据怎么来的?有没有做数据增强?
  • 翻译错误识别的 AUC 如何计算?
  • 如果识别出结果,后续怎么解决?
  • 和我讨论了一下业务相关的可行方案?

八股

  • LoRA 和全参 SFT 有啥区别?
  • LoRA 是插入新一层参数还是在原本参数上进行调整?
  • 口述注意力公式;Q、K、V 分别是什么,有什么用;
  • 为什么除以根号 dk,为啥不是除以 dk?

代码

  • LC 141. 环形链表,要求空间复杂度 O(1)

三面 (部门 leader)

  • 自我介绍
  • 项目谁主要负责的
  • pipeline 细节
  • 如何设计提示词模板
  • 遇到的困难
  • 用的什么模型
  • 怎么解决模型幻觉
  • 怎么解决 token length 限制
  • 模型输入输出是什么
  • 如何针对反馈出现的问题做改进
  • 为什么不用 SOTA 闭源模型
  • 模型选型理由
  • 模型输入输出是什么
  • 如何做评估
  • 最近读的大模型论文
  • 使用过 cursor 吗,有什么想法

你可能感兴趣的:(NLP与大模型,人工智能,大模型,深度学习,面试题,算法,暑期实习)