在科技飞速发展的当下,AI已成为推动各行业变革的核心力量。为助您紧跟AI发展浪潮,把握前沿动态,MIAOYUN特别推出「每周AI新鲜事儿」,涵盖技术突破、新模型发布、研究报告等多个方面,一起来回顾本周发生的AI新鲜事儿吧!
AI开源大模型
腾讯混元发布首款开源混合推理MoE模型「Hunyuan-A13B」
6月27日,腾讯混元宣布开源首个混合推理MoE模型「Hunyuan-A13B」,总参数80B,激活参数仅13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。Hunyuan-A13B模型是腾讯内部应用和调用量最大的大语言模型之一,有超过400+业务用于精调或者直接调用,日均请求超1.3亿。这是业界首个13B级别的MoE开源混合推理模型,可以根据需要选择思考模式(“快思考”或“慢思考”),对个人开发者较为友好,只需要1张中低端GPU卡即可部署。
华为宣布开源盘古7B稠密和72B混合专家模型
6月30日,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。盘古Pro MoE利用4000颗昇腾NPU进行训练,其性能在多个基准测试中超过了Qwen3-32B等主流模型,单推理吞吐可达1528 tokens/s。盘古Embedded 7B则引入了“快思考”和“慢思考”双系统,提升了推理效率,并在复杂问题上表现优于Qwen3-8B。
百度开源文心4.5系列10款模型
6月30日,百度开源文心4.5系列10款模型,涵盖了激活参数规模分别为47B和3B的混合专家(MoE)模型(最大的模型总参数量为424B),以及0.3B的稠密参数模型,预训练权重和推理代码完全开源。针对MoE架构,百度提出了一种创新性的多模态异构模型结构,通过跨模态参数共享机制实现模态间知识融合,同时为各单一模态保留专用参数空间。文心4.5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。
阿里国际AI发布Ovis-U1统一的多模态理解与生成模型
7月1日,阿里巴巴国际团队推出统一的多模态理解与生成模型「Ovis-U1」,集成多模态理解、图文生成与图像编辑三大功能于一身。该模型仅3亿参数规模,却具备出色的跨模态对齐能力,能识别图像物体、手写公式、视频内容,并按指令生成商品图、修改图像或解析数学问题。Ovis-U1采用DeepSpeed优化训练流程,代码与权重以Apache2.0协议开源,可在Hugging Face与GitHub自由下载。训练过程中加入合规性筛选机制,确保输出内容安全可靠。开发者可直接调用模型进行二次开发,大幅降低多模态项目开发成本。
智谱发布并开源GLM-4.1V-9B-Thinking通用视觉语言模型
7月2日,在智谱开放平台产业生态大会上,智谱宣布开源新一代通用视觉语言模型「GLM-4.1V-Thinking」,以推理能力为核心突破,刷新10B级别多模态模型性能上限。该模型通过引入“思维链推理机制(Chain-of-Thought Reasoning)”,显著提升复杂认知任务处理能力,支持图像、视频、文档等多模态输入形式。目前已在HuggingFace上线,并免费在智谱开放平台上线GLM-4.1V-Thinking-Flash API。
百度发布自研视频生成模型MuseSteamer并上线「绘想」平台
7月2日,在百度AI DAY开放日上,百度商业研发团队正式推出自研视频生成模型「MuseSteamer」,同时配套上线了AI视频创作平台「绘想」。MuseSteamer是全球首个实现中英文音视频一体化生成的视频模型,支持720p到1080p分辨率的高质量视频生成。模型提供了Turbo版、Lite版、Pro版及全系列有声版模型矩阵,覆盖从普通创作者到专业影视机构的需求,其中Turbo版已上线绘想平台开启限时免费公测,支持5s的720P视频。
智源研究院发布OmniGen 2统一图像生成模型
7月3日,北京智源人工智能研究院(BAAI)发布了统一图像生成模型「OmniGen 2」,一款主打文本生成图像、图像编辑与上下文创作的多模态模型。该模型采取了分离式架构解耦文本和图像,同时采用了ViT和VAE的双编码器策略。不同于其他工作,ViT和VAE独立作用于MLLM和Diffusion Transformer中,提高图像一致性的同时保证原有的文字生成能力。
技术突破
边缘智能时代的 MiniCPM-V系列突破
7月1日,由清华大学和面壁智能团队联合推出的「MiniCPM-V」系列高效端侧多模态大模型,在边缘设备上实现了多模态能力的突破。MiniCPM-V仅依靠8B参数实现了多模态综合性能超越GPT-4V、Gemini Pro等万亿参数云端模型,并在11个权威基准测试中超越了多种领先模型。该系列包含MiniCPM-V 1.0、2.0和Llama3-V 2.5,采用自适应视觉编码和其他创新技术,有效降低了计算和内存需求,使其可以在智能手机、平板等设备上高效运行。
Sakana AI推出新型推理时扩展算法,AI模型协作性能提升30%
7月1日,日本 Sakana AI 公司推出了一种新型推理时扩展算法:自适应分支蒙特卡洛树搜索(AB-MCTS,Adaptive Branching Monte Carlo Tree Search)。该算法通过利用不同模型的特性,优化了解决复杂问题的能力,并通过动态选择最优模型来增强集体智能,实现了多个前沿AI模型(如Gemini 2.5 Pro、o4-mini、DeepSeek-R1-0528)的协作,在ARC-AGI-2基准测试中提升了30%的性能,目前已开源底层算法TreeQuest便于用户应用。
推荐系统生成与表征统一框架RecFound,提升推荐模型性能
7月2日消息,由上海交通大学与华为诺亚方舟实验室提出的「RecFound」框架,成功解决了推荐系统多任务学习中的知识冲突与收敛失衡问题,推动了生成式与表征式任务的统一研究。该框架采用任务化低秩专家混合(TMoLE)、步进式收敛导向样本调度器(S2Sched)和TIES-Merging模型融合技术,优化模型、数据与训练策略,提升了推荐模型的整体性能,是推荐基础模型领域的重要突破。
华为开源超大规模MoE模型推理框架Omni-Infer
7月2日消息,华为开源超大规模MoE模型推理框架「Omni-Infer」。该项目包括推理框架和推理加速套件,兼容vLLM等多种主流开源推理框架,优化了调度、负载均衡和资源分配。目前多家机构如北京智源研究院、上海人工智能实验室已接入合作。此外,该项目还进行专业开源社区建设,通过PMC和SIG两级机制实现透明决策。
DeepSWE开源AI Agent登顶榜首
7月3日,著名大模型训练平台Together.ai与Agentica联合推出开源AI Agent框架「DeepSWE」。DeepSWE基于阿里开源Qwen3-32B模型,通过rLLM框架和改进版GRPO++算法,在64个H100 GPU上历时6天进行强化学习训练,覆盖4500个真实软件工程任务(如代码修复、功能实现、构建测试等),通过稀疏奖励机制优化解决方案生成,在SWE-Bench-Verified测试中Pass@1准确率达59%,性能居所有开源Agent框架榜首。
AI研究报告
Gartner发布2025年中国人工智能十大趋势
6月27日,Gartner发布2025年中国人工智能(AI)十大趋势。Gartner高级首席分析师费天祺表示:“中国在AI研发和部署方面取得了巨大进步,包括生成式人工智能(GenAI)技术,并且正凭借强大的设计、工程能力和日益完善的生态系统推动AI行业快速前进。中国的AI行业及相关生态系统涵盖了IT基础设施、数据、人才、安全和模型工程创新,在实现高效资源利用的前提下推动了大语言模型(LLM)及其他应用的快速发展。这些变化构成了今年中国AI十大趋势的核心主题。”
国家标准GB/T 45654—2025《网络安全技术 生成式人工智能服务安全基本要求》
6月30日,全国网络安全标准化技术委员会发布《GB/T 45654—2025网络安全技术 生成式人工智能服务安全基本要求》。文件规定了生成式人工智能服务在训练数据安全、模型安全、安全措施等方面的要求,并给出了各项安全要求对应的证实方法供参考。适用于服务提供者开展生成式人工智能服务相关活动,也为相关主管部门以及第三方评估机构开展大模型备案管理、安全测评提供技术参考。
Iconiq Capital发布《2025年AI现状报告》
6月30日消息,硅谷财富管理巨头Iconiq Capital发布的《2025年AI现状报告》指出,AI正进入实战落地阶段,企业需关注成本控制与灵活产品策略,同时数据显示数据处理费用已超过训练成本。
AI 产业深度报告《State of Foundation Models》(2025)
7月3日消息,Innovation Endeavors合伙人Davis Treybig近期发布了一份AI产业深度报告《State of Foundation Models》(2025),报告从模型、技术、应用、智能体、市场、公司架构、未来机会七个维度出发,全面且深入地剖析了AI产业当下的发展现状及未来趋势。报告观点:AI不再是渐进式改良,而是生产力的代际跃迁;成功的AI应用已不再依赖单一模型;基础模型公司正被迫向应用层移动;当数据收集成本降低1000倍,“数据即服务”将迎来前所未有的机遇等。
国内AI大模型产业发展态势研究报告(2025)发布
7月4日,AI云原生智能算力架构平台发布国内AI大模型产业发展态势研究报告(2025)。报告围绕国内AI大模型产业展开全面剖析,指出AI大模型是全球科技竞争新高地,并从政策、技术、市场三方面分析产业发展驱动力。政策上,我国及各地发布多项支持政策;技术上,Transformer 架构奠定基础,语言大模型关键技术推动发展;市场上,办公、制造等多场景的需求推动产业前进。