MIAOYUN | 每周AI新鲜事儿（06.27-07.04）

在科技飞速发展的当下，AI已成为推动各行业变革的核心力量。为助您紧跟AI发展浪潮，把握前沿动态，MIAOYUN特别推出「每周AI新鲜事儿」，涵盖技术突破、新模型发布、研究报告等多个方面，一起来回顾本周发生的AI新鲜事儿吧！

AI开源大模型

腾讯混元发布首款开源混合推理MoE模型「Hunyuan-A13B」

6月27日，腾讯混元宣布开源首个混合推理MoE模型「Hunyuan-A13B」，总参数80B，激活参数仅13B，效果比肩同等架构领先开源模型，但是推理速度更快，性价比更高。Hunyuan-A13B模型是腾讯内部应用和调用量最大的大语言模型之一，有超过400+业务用于精调或者直接调用，日均请求超1.3亿。这是业界首个13B级别的MoE开源混合推理模型，可以根据需要选择思考模式（“快思考”或“慢思考”），对个人开发者较为友好，只需要1张中低端GPU卡即可部署。

华为宣布开源盘古7B稠密和72B混合专家模型

6月30日，华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。盘古Pro MoE利用4000颗昇腾NPU进行训练，其性能在多个基准测试中超过了Qwen3-32B等主流模型，单推理吞吐可达1528 tokens/s。盘古Embedded 7B则引入了“快思考”和“慢思考”双系统，提升了推理效率，并在复杂问题上表现优于Qwen3-8B。

百度开源文心4.5系列10款模型

6月30日，百度开源文心4.5系列10款模型，涵盖了激活参数规模分别为47B和3B的混合专家（MoE）模型（最大的模型总参数量为424B），以及0.3B的稠密参数模型，预训练权重和推理代码完全开源。针对MoE架构，百度提出了一种创新性的多模态异构模型结构，通过跨模态参数共享机制实现模态间知识融合，同时为各单一模态保留专用参数空间。文心4.5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。

阿里国际AI发布Ovis-U1统一的多模态理解与生成模型

7月1日，阿里巴巴国际团队推出统一的多模态理解与生成模型「Ovis-U1」，集成多模态理解、图文生成与图像编辑三大功能于一身。该模型仅3亿参数规模，却具备出色的跨模态对齐能力，能识别图像物体、手写公式、视频内容，并按指令生成商品图、修改图像或解析数学问题。Ovis-U1采用DeepSpeed优化训练流程，代码与权重以Apache2.0协议开源，可在Hugging Face与GitHub自由下载。训练过程中加入合规性筛选机制，确保输出内容安全可靠。开发者可直接调用模型进行二次开发，大幅降低多模态项目开发成本。

智谱发布并开源GLM-4.1V-9B-Thinking通用视觉语言模型

7月2日，在智谱开放平台产业生态大会上，智谱宣布开源新一代通用视觉语言模型「GLM-4.1V-Thinking」，以推理能力为核心突破，刷新10B级别多模态模型性能上限。该模型通过引入“思维链推理机制（Chain-of-Thought Reasoning）”，显著提升复杂认知任务处理能力，支持图像、视频、文档等多模态输入形式。目前已在HuggingFace上线，并免费在智谱开放平台上线GLM-4.1V-Thinking-Flash API。

百度发布自研视频生成模型MuseSteamer并上线「绘想」平台

7月2日，在百度AI DAY开放日上，百度商业研发团队正式推出自研视频生成模型「MuseSteamer」，同时配套上线了AI视频创作平台「绘想」。MuseSteamer是全球首个实现中英文音视频一体化生成的视频模型，支持720p到1080p分辨率的高质量视频生成。模型提供了Turbo版、Lite版、Pro版及全系列有声版模型矩阵，覆盖从普通创作者到专业影视机构的需求，其中Turbo版已上线绘想平台开启限时免费公测，支持5s的720P视频。

智源研究院发布OmniGen 2统一图像生成模型

7月3日，北京智源人工智能研究院（BAAI）发布了统一图像生成模型「OmniGen 2」，一款主打文本生成图像、图像编辑与上下文创作的多模态模型。该模型采取了分离式架构解耦文本和图像，同时采用了ViT和VAE的双编码器策略。不同于其他工作，ViT和VAE独立作用于MLLM和Diffusion Transformer中，提高图像一致性的同时保证原有的文字生成能力。

技术突破

边缘智能时代的 MiniCPM-V系列突破

7月1日，由清华大学和面壁智能团队联合推出的「MiniCPM-V」系列高效端侧多模态大模型，在边缘设备上实现了多模态能力的突破。MiniCPM-V仅依靠8B参数实现了多模态综合性能超越GPT-4V、Gemini Pro等万亿参数云端模型，并在11个权威基准测试中超越了多种领先模型。该系列包含MiniCPM-V 1.0、2.0和Llama3-V 2.5，采用自适应视觉编码和其他创新技术，有效降低了计算和内存需求，使其可以在智能手机、平板等设备上高效运行。

Sakana AI推出新型推理时扩展算法，AI模型协作性能提升30%

7月1日，日本 Sakana AI 公司推出了一种新型推理时扩展算法：自适应分支蒙特卡洛树搜索（AB-MCTS，Adaptive Branching Monte Carlo Tree Search）。该算法通过利用不同模型的特性，优化了解决复杂问题的能力，并通过动态选择最优模型来增强集体智能，实现了多个前沿AI模型（如Gemini 2.5 Pro、o4-mini、DeepSeek-R1-0528）的协作，在ARC-AGI-2基准测试中提升了30%的性能，目前已开源底层算法TreeQuest便于用户应用。

推荐系统生成与表征统一框架RecFound，提升推荐模型性能

7月2日消息，由上海交通大学与华为诺亚方舟实验室提出的「RecFound」框架，成功解决了推荐系统多任务学习中的知识冲突与收敛失衡问题，推动了生成式与表征式任务的统一研究。该框架采用任务化低秩专家混合（TMoLE）、步进式收敛导向样本调度器（S2Sched）和TIES-Merging模型融合技术，优化模型、数据与训练策略，提升了推荐模型的整体性能，是推荐基础模型领域的重要突破。

华为开源超大规模MoE模型推理框架Omni-Infer

7月2日消息，华为开源超大规模MoE模型推理框架「Omni-Infer」。该项目包括推理框架和推理加速套件，兼容vLLM等多种主流开源推理框架，优化了调度、负载均衡和资源分配。目前多家机构如北京智源研究院、上海人工智能实验室已接入合作。此外，该项目还进行专业开源社区建设，通过PMC和SIG两级机制实现透明决策。

DeepSWE开源AI Agent登顶榜首

7月3日，著名大模型训练平台Together.ai与Agentica联合推出开源AI Agent框架「DeepSWE」。DeepSWE基于阿里开源Qwen3-32B模型，通过rLLM框架和改进版GRPO++算法，在64个H100 GPU上历时6天进行强化学习训练，覆盖4500个真实软件工程任务（如代码修复、功能实现、构建测试等），通过稀疏奖励机制优化解决方案生成，在SWE-Bench-Verified测试中Pass@1准确率达59%，性能居所有开源Agent框架榜首。

AI研究报告

Gartner发布2025年中国人工智能十大趋势

6月27日，Gartner发布2025年中国人工智能（AI）十大趋势。Gartner高级首席分析师费天祺表示：“中国在AI研发和部署方面取得了巨大进步，包括生成式人工智能（GenAI）技术，并且正凭借强大的设计、工程能力和日益完善的生态系统推动AI行业快速前进。中国的AI行业及相关生态系统涵盖了IT基础设施、数据、人才、安全和模型工程创新，在实现高效资源利用的前提下推动了大语言模型（LLM）及其他应用的快速发展。这些变化构成了今年中国AI十大趋势的核心主题。”

国家标准GB/T 45654—2025《网络安全技术生成式人工智能服务安全基本要求》

6月30日，全国网络安全标准化技术委员会发布《GB/T 45654—2025网络安全技术生成式人工智能服务安全基本要求》。文件规定了生成式人工智能服务在训练数据安全、模型安全、安全措施等方面的要求，并给出了各项安全要求对应的证实方法供参考。适用于服务提供者开展生成式人工智能服务相关活动，也为相关主管部门以及第三方评估机构开展大模型备案管理、安全测评提供技术参考。

Iconiq Capital发布《2025年AI现状报告》

6月30日消息，硅谷财富管理巨头Iconiq Capital发布的《2025年AI现状报告》指出，AI正进入实战落地阶段，企业需关注成本控制与灵活产品策略，同时数据显示数据处理费用已超过训练成本。

AI 产业深度报告《State of Foundation Models》（2025）

7月3日消息，Innovation Endeavors合伙人Davis Treybig近期发布了一份AI产业深度报告《State of Foundation Models》（2025），报告从模型、技术、应用、智能体、市场、公司架构、未来机会七个维度出发，全面且深入地剖析了AI产业当下的发展现状及未来趋势。报告观点：AI不再是渐进式改良，而是生产力的代际跃迁；成功的AI应用已不再依赖单一模型；基础模型公司正被迫向应用层移动；当数据收集成本降低1000倍，“数据即服务”将迎来前所未有的机遇等。

国内AI大模型产业发展态势研究报告（2025）发布

7月4日，AI云原生智能算力架构平台发布国内AI大模型产业发展态势研究报告（2025）。报告围绕国内AI大模型产业展开全面剖析，指出AI大模型是全球科技竞争新高地，并从政策、技术、市场三方面分析产业发展驱动力。政策上，我国及各地发布多项支持政策；技术上，Transformer 架构奠定基础，语言大模型关键技术推动发展；市场上，办公、制造等多场景的需求推动产业前进。

MIAOYUN | 每周AI新鲜事儿（06.27-07.04）

AI开源大模型

技术突破

AI研究报告

你可能感兴趣的:(人工智能深度学习算法云计算)