AI周报:技术面试卷出新高度,Agent落地开启“工具觉醒”时代

​一句话暴论​​:当面试官要求手搓FP16精度时,真正的考题是“你能否在硅基文明觉醒前跟上进化速度”。


一、面试地狱难度实录(开发者生存指南)

  • ​百度二面手搓FP16精度​​:考的不是浮点数,而是对硬件底层的敬畏(原文)
  • ​腾讯夺命11连问​​:混元大模型面试暴露行业真相——​​懂原理已不够,得会调参、训推、修故障的“全栈炼丹师”​​(解析)
  • ​NVIDIA四轮拷打实录​​:GPU厂面试竟考Attention优化!​​Lighting Attention核心破局点​​:用KV分块+动态稀疏,把显存带宽压榨到极限(解读)
  • ​阿里淘天终面翻车现场​​:大厂终面转向“场景实战题”,​​产品思维成为新门槛​​(血泪史)
​面试官潜台词​​:2025年的AI工程师,得是“算法+工程+硬件”的三体人。

二、训练技术:卷效率还是卷规模?

  1. ​RLVR​​:多模态后训练框架刷新认知——​​用强化学习教MLLM“看图推理”​​,泛化性能↑10%(论文)
  2. ​微调争议​​:99%企业不该碰微调?​​数据质量不足时,微调=灾难性遗忘加速器​​(反常识)
  3. ​显存压榨术​​:梯度检查点+LoRA量化,6B模型单卡可训(调参指南)
​暴论​​:Scaling Law没失效,但​ ​穷人玩家请走“小模型+精调”的猥琐发育路线​​。

三、模型战场:Qwen3 vs DeepSeek vs MiniMax

  • ​Qwen3嵌入模型揭秘​​:为什么全行业用RoPE?​​旋转位置编码成LLM长文本标配​​(数学之美)
  • ​MiniMax开源M1模型​​:3万字长文生成吊打Gemini,​​用混合注意力实现性价比逆袭​​(实测)
  • ​GraphRAG杀疯了​​:清华DO-RAG用Agentic CoT让领域问答效果飙升33%,​​知识图谱+RAG=专业领域核武器​​(技术报告)
⚡️ ​ ​关键进展​​:多模态RAG进入“双线索时代”(文本+结构信息并行处理),SimpleDoc项目证明:​ ​表格/代码类数据必须AST解析​​( 代码分块技术)。

四、Agent革命:MCP协议开启“工具主动调用”纪元

  • ​MCP-Zero省98%算力​​:让Agent学会说“我要查数据库”,而不是傻等人类指令(范式颠覆)
  • ​爆款应用链​​:
    • Office-PowerPoint-MCP:​​一句话生成PPT并实时编辑​​(Demo)
    • 小说Agent:1小时产出30万字网文,网文作者集体转型“AI监工”(争议)

  • ​安全警报​​:Karpathy坦言Agent攻击无解!​​六大防护模式紧急上线​​(防御指南)
​创业者警告​​:别碰通用智能体!​ ​垂直场景Data Agent才是摇钱树​​(金融/工业/运维场景已跑通)。

五、争议与反思

  1. ​RAG必要吗?​​ Google用“选择性生成框架”让RAG准确率↑10%,但​​轻量任务Agent直接开干更高效​​(实验)
  2. ​Infra断代之争​​:AI Infra工程师在重构基础设施——​​传统分布式架构正被MoE+KV缓存分块技术颠覆​​(讨论)
  3. ​Karpathy炸场演讲​​:​​AI是终极操作系统​​,程序员转型“AI行为设计师”(金句)

彩蛋:本周最惨技术人

​腾讯实习生把显存搞炸了​​——原因竟是忘关FlashAttention的deterministic模式(事故报告)

教训:​ ​跑大模型前默念三遍“开deterministic=找死”​​。

面试

  • 面试题:解释下minimax中lighting attention的由来
  • 面试题:解释下minimax中lighting attention的由来
  • 面试题:pretrain和test阶段的scaling law的资源分配策略区别是啥?
  • 百度二面要我手搓FP16精度,差点跪了...
  • 腾讯混元大模型面试:夺命11连问
  • 腾讯混元大模型面试:夺命11连问
  • NVIDIA面经:四轮“拷打”实录
  • (51 封私信 / 90 条消息) 大模型面试 - 知乎
  • 拒绝AI“一本正经地胡说八道”:我用三版Prompt驯服RAG模型的实战复盘

训练技术

  • 多模态 LLM RLVR 引入后训练框架!显著提升MLLM推理与泛化
  • 多模态 LLM RLVR 引入后训练框架!显著提升MLLM推理与泛化
  • 新突破!大模型强化预训练RPT来袭
  • 【大模型微调】5.调参经验总结与显存占用因素探究
  • 大模型微调,为什么99%的企业都不应该碰这个坑?

聊聊模型

  • Qwen3 嵌入模型和重排序模型解读
  • RAG+:通过应用感知推理增强RAG系统
  • 最新125种多模态大模型技术全面综述
  • Agentic CoT驱动,清华DO-RAG领域问答性能飙升33%,远超FastGPT、Dify
  • GraphRAG提速新思路E^2GraphRAG及DeepResearch Bench评估结果
  • GraphRAG遇上DeepResearch:有趣的FusionGraphRAG项目推介
  • 多模态RAG前沿速读:三看SimpleDoc双线索实现思路
  • 表格RAG项目解读:一个过滤+澄清补充的数据工程式思路
  • 代码类型的RAG做chunk切分怎么做?兼看改进AST方案
  • Qwen和DeepSeek为什么都用RoPE?
  • 多模态通用感知大模型的技术演进与应用探索
  • 通俗易懂的总结!RL for LLM本质理解
  • 深入解析多模态大模型推理技术的最新发展
  • Fast-dLLM技术解析:分块KV缓存与置信度感知并行解码技术
  • GitHub新晋“天花板”:企业级RAG引擎RAGFlow,Star飙升5.6万! - 今日头条
  • 多模态RAG前沿速读:三看SimpleDoc双线索实现思路
  • Qwen3 Embedding模型架构、训练方法、数据策略
  • 不需要 RAG!手把手教你构建问答 Agent(只需 30 分钟)
  • Google | 溯源分析RAG系统错误,提出选择性生成框架,让RAG问答准确率提升10%
  • 剖析 LLM Agent 定义及返回结构体定义
  • 快速理解热门LLM大语言模型
  • 鹅厂实习生血泪贴:Agent/RAG黑科技,真相竟是这样!
  • 智能体应用最佳组合,一台主机同时部署Dify和RAGFlow全流程避坑指南 | 实操保姆级记录
  • ​​超越Gemini和Qwen!3B小模型横扫中英文文档识别,表格公式识别提升超15%​
  • AFFiNE:一款开源的下一代知识库,将结构化写作、可视化创作、任务管理、知识图谱四大核心能力熔于一炉

Agent

  • MCP-Zero重塑工具调用范式:让Agent学会“主动要”,而不是被动等“喂”,可省下98%算力!
  • MCP:AI界的“Type-C”——让AI模型和世界对话从此“零代沟”!
  • Agent 前沿速递:生态、协作与上下文的关键演进
  • Office-PowerPoint-MCP-Server:通过 AI 助手直接创建编辑 PPT
  • 用Agent挖掘AI人才!DINQ AI人才引擎:不错过每一个AI Talent
  • MiniMax M1开源:一口生成3万字吊打Gemini,智能体性价比完胜DeepSeek? - 今日头条
  • 阿星:小说智能体发布,一小时30万字,3000万网文作者怎么办?
  • 【深度】MCP + Cline + A2A + n8n + KAG 金融领域投资管理最佳实践 - 今日头条
  • 精|知识探索新范式:深度研究Deep Research智能体全面综述,系统、方法与应用
  • 别搞通用智能体,落地赚钱才是王道
  • Data Agent:未来企业的“数据大脑”
  • AI Agent 在角色扮演场景的研究进展
  • MCP技术浪潮中的Agent应用开发新范式
  • Sping Ai 接入 Mysql MCP 智能查询数据
  • Spring Ai 接入Office Word MCP 智能改稿
  • 如何使用 Agno 构建一个基础的 AI 智能体?
  • 六个安全Agent设计模式:有效防止Prompt注入攻击
  • MCP很好,但它不是万灵药!真正的技术进步,往往始于祛魅之后的清醒认知
  • 万字长文深入浅出教你优雅开发复杂AI Agent
  • Figma 推出官方 MCP,真正做到了所见即所得
  • 即将淘汰80%普通人的7项AI技能:1、提示词工程;2、AI设计;3、AI智能体;4、工作流自动化
  • Andrej Karpathy:对于AI Agent的安全风险,我也束手无策
  • 「运维版Cursor」首发亮相!终结命令行地狱,Agent解放双手
  • 工业AI Agent落地难?且看研华硬核破局之道
  • Cursor-Agent 实战:构建端到端自动化取数工具的探索与思考
  • 从概念到落地:有赞 Agent 应用与探索

RAG

  • 一文了解dify实现智能分析助手的三种方式
  • 硬核进化!BISHENG 1.3.0 发布:用实力,定义企业级知识库的“好用”

未分类

  • AI Infra 和传统 Infra 断代了吗?聊聊 Infra “三大难题”,以及其中的关联
  • 最新总结,不同抽取任务哪个模型最能打
  • 最新开源工具:实测提升PDF六大能力!
  • 0%通过率!Code神话泡沫!LiveCodeBench Pro发布!
  • 少说‘Wait’,多做题:NoWait重塑大模型推理路径
  • 如何凭大模型权重就能逆向大模型训练数据
  • EasyRec 推荐算法训练推理优化
  • 再思考文档解析最新趋势方案及7类真实场景下文档解析Badcase记录
  • MiniMax发布开源模型M1,性能直逼Gemini 2.5 Pro
  • Gemini 2.5家族正式发布,聊一聊谷歌大模型的帕累托最优路线
  • Karpathy YC演讲终极解码:AI即操作系统,产品即“钢铁侠战衣”
  • AI Infra和传统Infra,区别在哪?
  • 穷人版verl 671B GPRO跑通(亲测可行)
  • 新来的实习生又双叒把显存搞炸了...
  • 阿里淘天大模型终面:麻了,真的麻了!
  • 大模型推理太慢?分布式部署搞定!
  • 11Labs 增长负责人:搞营销要学着做视频,但创始人出镜会有点自恋
  • 对话 ClackyAI 李亚飞:「套壳」之上还有厚度,数据闭环没那么重要
  • 罗永浩:梁文锋建议我「靠嘴吃饭」,我想做个播客帮助科技创业者
  • 新的OCR模型 MonkeyOCR-3B
  • MiniMax-M1:全球首个开源权重的大规模混合注意力推理模型,专为处理长输入和复杂任务而生
  • Gemini 2.5 技术报告
  • unsloth制作了一份关于大模型强化学习的完整指南
  • 在CloudMatrix 384超节点上部署 DeepSeek 的报告
  • 让小爱音箱可播放任何想听的歌曲,还支持语音控制和本地音乐文件播放
  • 持续学习的 python 文本分类器——adaptive-classifier
  • MistralAI新模型:Mistral-Small-3.2-24B-Instruct-2506
  • TransMLA|GQA/MHA转MLA获得10倍推理加速
  • 月之暗面发布了 Kimi-Researcher
  • 从公式到代码!一文梳理RLHF发展历程
  • 多模型融合的系数到底应该是多少?
  • 海报设计神器!字节开源CreatiDesign,拿下平面设计新SOTA! - 今日头条
  • 介绍一个适合企业和单位使用文档管理系统TEEDY - 今日头条
  • EasyRec 推荐算法训练推理优化
  • DPO与GRPO谁更胜一筹?港中文、北大等发布首个系统性对比研究 - 今日头条
  • Andrej Karpathy 爆火演讲刷屏技术圈:AI 开启软件 3.0,重写一切的时代来了! - 今日头条
  • 足球小编走天下:全国房价跌幅榜震惊到我了。
  • 阿里淘天大模型终面:麻了,真的麻了!
  • OpenHands:替代开发者修改代码、运行命令、浏览网页、调用API - 今日头条
  • Transformer联手Diffusion!Soul开源AI生图新范式!
  • 编程神器Cursor终于更新到正式版,最新系统提示词来了!
  • 装备类企业的AI战略发展浅析
  • AI时代的生存-什么让我们脱颖而出?
  • 工业大模型定义及技术架构
  • "过时的?"提示词工程
  • AI时代,从“数据可视化”到“数据可视听化”
  • Automa-RPA实现京东商品自动搜索
  • 一个人提升最快的方式:经验知识化
  • AI的落地难题、应用案例和生产率悖论
  • 大模型工程化:从“实验玩具”到“应用落地”的关键突破口
  • 放弃国企工作,创办一人企业:我一定能用AI挣到钱!丨AI转型访谈录
  • 提示词工程:从原理、实践到未来——一部系统性综述
  • 「一人干掉整个市场部」| 对谈 Head AI 创始人 Kay
  • 官宣|Zilliz Cloud 建表功能大升级,更多检索类型支持,更低成本
  • PDF文档解析--MinerU
  • AI越强,Prompt越没用?恰恰相反,不懂这些你将被淘汰
  • 刚上线的大模型应用,为什么总是出现报错?
  • 基于Perplexica与内网穿透工具的本地AI搜索服务远程访问实践过程
  • AI识图,提取标题、点赞等数据,哪家效果好?
  • Prompt Design 不只是写一句话给AI
  • 搭建AI知识库踩了37个坑,血泪总结这套避雷手册
  • 我把Prompt优化效果从2.8分提到4.7分,只用了这套“工程化”流程
  • AI的认知象限:浅谈一下我们与AI的边界
  • AI在人力资源管理中九个方面的成功应用及案例
  • 知识库检索匹配的服务化实践
  • 从模板到指标服务:解锁AI时代的数据新可能
  • Al代码审查实践:从构想到快速落地
  • AI智能地址识别实践:小帅的优化日记

你可能感兴趣的:(人工智能,语言模型)