AI日报-20250617:MiniMax-M1震撼发布!Kimi-Dev-72B代码模型开源!MetaLlama3.1突破!

1、松下OmniFlow多模态大模型震撼发布:文本、图像、音频自由切换新时代! 2、TikTok震撼发布Symphony
AI三件套:图片秒变视频,文字秒出广告 3、一篇博客改变命运:研究员靠Muon优化器成功加入OpenAI
4、陶哲轩重磅发声:AI在数学领域仍缺关键"嗅觉",人类直觉无可替代 5、AI搜索平台Glean狂揽1.5亿美元融资,估值暴涨至72亿美元!
6、Meta联手EssilorLuxottica打造Oakley智能眼镜,运动科技新篇章开启 7、Meta Llama
3.1大模型惊人突破!《哈利波特》记忆率飙升至42% 8、LinkedIn革命性升级:AI求职搜索告别关键词,自然语言匹配时代来临 9、谷歌被曝秘密用ChatGPT训练Gemini,Scale AI紧急澄清
10、Grok任务功能震撼来袭!AI定时追踪X热门话题,效率碾压ChatGPT 11、Gemini 2.5 Pro重磅升级:Deep
Think功能将颠覆AI推理能力 12、OpenAI震撼升级ChatGPT搜索功能:智能响应精准度飙升!
13、颠覆性突破!OWL多智能体框架斩获17K Star,碾压OpenAI创协作新纪元
14、夸克App重磅推出"AI家教"!个性化辅导能力颠覆传统学习模式 15、腾讯LeVo震撼发布!AI唱歌模型秒杀Suno
4.5,零样本音色克隆颠覆音乐创作 16、前谷歌CEO投资公司震撼发布240亿参数化学推理模型,准确率碾压GPT-4.1! 17、Alta获1100万美元融资:明星投资人加持,打造"傻瓜式"时尚科技平台
18、MiniMax-M1震撼发布:全球首款开源混合架构推理模型,性能直逼顶尖闭源模型
19、九章智算云2.0震撼发布:突破百万级token生成,打造普惠算力新标杆
20、Kimi-Dev代码模型震撼开源!72B参数横扫SWE-bench,性能超越DeepSeek
21、通义千问Qwen3全系适配MLX!AI助手迎来重大升级 22、Anthropic重磅推出Claude Code
SDK:AI编程助手开启智能配对新时代

1、松下OmniFlow多模态大模型震撼发布:文本、图像、音频自由切换新时代!
松下最新推出的OmniFlow多模态大模型,突破性地实现了文本、图像与音频之间的高效转换,采用模块化设计和多模态引导机制,显著提升生成质量与资源利用率。

核心亮点

模块化预训练设计,各组件独立优化,大幅提升训练效率与灵活性。
多模态引导机制,用户可精准控制生成过程,满足多样化需求。
实验表现优异,文本到图像/音频生成均达行业领先水平,FID指标显著降低。

原文链接: https://www.aibase.com/zh/news/18946


2、TikTok震撼发布Symphony AI三件套:图片秒变视频,文字秒出广告
TikTok推出三款革命性AI视频创作工具,集成在Symphony Creative Studio中,帮助品牌轻松制作广告内容。新功能包括图片转视频、文字转视频和产品展示功能,极大简化广告制作流程。

核心亮点

图片转视频功能将静态产品照变为5秒动态视频,支持多版本组合。
文字转视频工具无需素材库,仅凭文案即可生成测试版广告视频原型。
️Showcase Products功能融合数字化身与产品图,打造沉浸式UGC风格广告。

原文链接: https://www.aibase.com/zh/news/18950


3、一篇博客改变命运:研究员靠Muon优化器成功加入OpenAI
研究员Keller Jordan凭借一篇关于Muon优化器的博客文章成功加入OpenAI,该优化器能显著提升神经网络训练效率,可能用于GPT-5开发。

核心亮点

Muon优化器将CIFAR-10训练时间缩短至79%,大幅提升训练效率。
采用牛顿-舒尔茨迭代法优化隐藏层参数,运行成本低于1%。
博客批判现有优化器缺陷,提出实际应用效果优先的创新理念。

原文链接: https://www.aibase.com/zh/news/18953


4、陶哲轩重磅发声:AI在数学领域仍缺关键"嗅觉",人类直觉无可替代
著名数学家陶哲轩指出,尽管AI在多个领域表现卓越,但在数学领域仍缺乏人类特有的"数学嗅觉"——即辨别错误方向和证明的直觉能力。这种直觉目前无法被AI复制,使人类在数学判断中保持不可替代性。

核心亮点

陶哲轩称AI生成的数学证明表面完美,但常含人类不会犯的低级错误。
人类独有的"数学气味"能直觉感知错误,AI目前难以复制这种能力。
AlphaZero在棋类游戏展现类似"嗅觉",但数学领域仍需突破性进展。

原文链接: https://www.aibase.com/zh/news/18955


5、AI搜索平台Glean狂揽1.5亿美元融资,估值暴涨至72亿美元!
企业级AI搜索平台Glean完成1.5亿美元F轮融资,估值从46亿美元飙升至72亿美元,由Wellington Management领投,多家知名投资机构参与。

核心亮点

估值一年暴涨26亿美元,展现企业AI搜索赛道巨大潜力
集成Google/Microsoft/Slack等主流办公软件,打造智能工作流中枢
️结合自然语言处理技术,为企业构建个性化知识图谱提升效率

原文链接: https://www.aibase.com/zh/news/18957


6、Meta联手EssilorLuxottica打造Oakley智能眼镜,运动科技新篇章开启
Meta与眼镜巨头EssilorLuxottica深化合作,将共同开发Oakley品牌智能眼镜,进一步扩展其可穿戴设备产品线。此举延续了双方自2021年推出Ray-Ban Stories以来的成功合作,瞄准运动和户外场景的高性能需求。

核心亮点

Oakley高性能运动眼镜首次融入智能科技,开拓全新应用场景。
Meta与EssilorLuxottica合作延长至2030年,展现长期战略布局。
基于Ray-Ban智能眼镜的成功经验,技术积累将加速新品开发。

原文链接: https://www.aibase.com/zh/news/18959


7、Meta Llama 3.1大模型惊人突破!《哈利波特》记忆率飙升至42%
Meta最新发布的Llama 3.1大模型在文本记忆能力上实现飞跃,对《哈利波特》首部内容的记忆率高达42%,远超旧版模型的4.4%,引发AI界广泛关注。

核心亮点

Llama3.1对热门书籍记忆能力突出,《霍比特人》《1984》表现远超冷门作品。
采用Books3数据库测试,36本书分段评估,重复概率超50%即判定为“已记住”。
相比2023版Llama1,新模型记忆能力提升近10倍,展现技术迭代惊人速度。

原文链接: https://www.aibase.com/zh/news/18965


8、LinkedIn革命性升级:AI求职搜索告别关键词,自然语言匹配时代来临
LinkedIn推出全新AI求职搜索功能,允许用户使用自然语言描述求职意向,系统将精准匹配最相关职位。该功能基于微调的大型语言模型,彻底改变了传统关键词搜索模式,使求职过程更直观高效。

核心亮点

告别关键词束缚,支持自然语言查询,如"硅谷最新软件工程师职位"。
采用两阶段LLM处理,优化检索排序流程,从9个步骤大幅精简。
查询引擎智能生成定制建议,解决传统搜索结果不精准的痛点。

原文链接: https://www.aibase.com/zh/news/18972


9、谷歌被曝秘密用ChatGPT训练Gemini,Scale AI紧急澄清
谷歌被指通过承包商使用ChatGPT的数据来改进其AI助手Gemini的性能,引发行业震动。Scale AI迅速否认相关指控,称仅为标准评估操作。

核心亮点

承包商利用ChatGPT数千条回复与Gemini对比,提升回答质量。
Scale AI强调未用ChatGPT训练模型,相关操作为行业常见评估。
Meta拟143亿美元收购Scale AI 49%股权,谷歌或终止合作。

原文链接: https://www.aibase.com/zh/news/18982


10、Grok任务功能震撼来袭!AI定时追踪X热门话题,效率碾压ChatGPT
xAI旗下AI助手Grok推出全新Tasks定时任务功能,支持自动化查询与外部通知,大幅提升信息获取效率,尤其适合追踪X平台热门话题与实时数据分析。

核心亮点

支持多种任务频率,从一次性到周期性任务,满足多样化需求。
结果主动推送至邮箱,无需手动查看,效率远超ChatGPT。
订阅用户享更高配额与优先体验,包括DeepSearch等尖端功能。

原文链接: https://www.aibase.com/zh/news/18990


11、Gemini 2.5 Pro重磅升级:Deep Think功能将颠覆AI推理能力
Google即将为Gemini 2.5 Pro推出全新Deep Think功能,该功能通过多线程推理机制显著提升复杂任务处理能力,在数学、编程和多模态任务中表现卓越。

核心亮点

Deep Think模式性能提升15%,在USAMO数学测试中准确率达49.4%。
支持多模态输入,结合文本、图像和音频,提供全面解决方案。
率先向Google AI Ultra计划用户开放,未来将整合Workspace生态。

原文链接: https://www.aibase.com/zh/news/18991


12、OpenAI震撼升级ChatGPT搜索功能:智能响应精准度飙升!
OpenAI宣布对ChatGPT搜索功能进行重大升级,优化搜索质量并提升智能响应精准度。新版本支持图像搜索,增强上下文理解能力,提供更连贯的对话体验,同时标注信息来源增强透明度。


核心亮点

ChatGPT搜索功能升级,智能响应更精准,优化用户体验。
新增图像搜索功能,丰富搜索方式,提升信息获取多样性。
标注信息来源,增强内容真实性,提高用户信任度。

原文链接: https://www.aibase.com/zh/news/18993


13、颠覆性突破!OWL多智能体框架斩获17K Star,碾压OpenAI创协作新纪元
香港大学与camel-ai联合推出的Workforce多智能体框架及OWL训练方法,在GAIA基准测试中以69.7%准确率刷新纪录,超越商业系统,GitHub开源即获17,000星标。

核心亮点

创新解耦设计三模块:规划器+协调器+工作节点,实现灵活跨领域迁移
两阶段OWL训练法:监督微调+强化学习优化,显著提升决策纠错能力
开源首月斩获17K星标,GAIA测试碾压OpenAI等商业系统性能

原文链接: https://www.aibase.com/zh/news/18997


14、夸克App重磅推出"AI家教"!个性化辅导能力颠覆传统学习模式
夸克App全新升级"夸克老师"AI家教功能,基于通义千问大模型,具备讲题、批改、出题等全流程辅导能力,在高考数学测评中斩获145+高分,并支持根据学生水平智能推荐习题。

核心亮点

十亿级专业题库支撑,覆盖数百万份地方名校真题资源。
模拟人类教师教学思路,拆解知识点并提供1对1针对性辅导。
发放1000万份学习会员季卡,用户更新App即可免费领取体验。

原文链接: https://www.aibase.com/zh/news/19000


15、腾讯LeVo震撼发布!AI唱歌模型秒杀Suno 4.5,零样本音色克隆颠覆音乐创作
腾讯AI实验室推出革命性AI唱歌模型LeVo,在音色克隆、分轨生成等核心指标上媲美行业标杆Suno4.5,其零样本音色克隆技术仅需3秒音频即可精准复制目标音色,为音乐创作带来全新可能。

核心亮点

零样本音色克隆技术惊艳,仅需3秒音频片段即可完美复刻目标音色。
支持人声伴奏分轨生成,为专业音乐制作提供前所未有的编辑灵活性。
承诺全面开源策略,将完整代码和预训练模型免费开放给全球开发者。

原文链接: https://www.aibase.com/zh/news/19001


16、前谷歌CEO投资公司震撼发布240亿参数化学推理模型,准确率碾压GPT-4.1!
由前谷歌CEO埃里克・施密特投资的FutureHouse公司开源了240亿参数的化学推理模型ether0,该模型在多项任务中准确率超越GPT-4.1等领先模型,且训练数据需求仅为传统模型的1/50。

核心亮点

基于Mistral-Small-24B架构,处理64万+化学实验数据,覆盖18类专业任务。
首创推理行为蒸馏技术,开放答案准确率碾压Claude等通用大模型。
仅需1/50训练数据即可达到传统模型效果,擅长类药分子设计等复杂推理。

原文链接: https://www.aibase.com/zh/news/19006


17、Alta获1100万美元融资:明星投资人加持,打造"傻瓜式"时尚科技平台
Alta近日完成1100万美元融资,由多位明星投资人领投,旨在开发降低时尚行业技术门槛的创新平台,帮助非技术背景从业者轻松实现数字化升级。

核心亮点

融资由时尚科技领域顶级风投和明星天使投资人联合参与
平台采用无代码设计,服装设计师可10分钟创建虚拟时装秀
AI算法自动分析潮流数据,精准预测下一季爆款面料与版型

原文链接:https://techcrunch.com/2025/06/16/alta-raises-11m-to-bring-clueless-fashion-tech-to-life-with-all-star-investors


18、MiniMax-M1震撼发布:全球首款开源混合架构推理模型,性能直逼顶尖闭源模型
MiniMax-M1作为全球首个开源的大规模混合架构推理模型,在生产力场景中表现卓越,支持百万级上下文输入和8万Token输出,性能接近海外领先模型,同时具备业内最高性价比。

核心亮点

独创闪电注意力机制,算力效率提升70%,长文本处理能力行业顶尖
强化学习算法CISPO效率翻倍,训练成本仅53万美金,远低于预期
提供不限量免费使用,API定价行业最低,长文本支持能力独步全球

原文链接: https://mp.weixin.qq.com/s/OWrbRE3zHaeNahXkPnP0fg


19、九章智算云2.0震撼发布:突破百万级token生成,打造普惠算力新标杆
九章云极DataCanvas公司发布新一代全栈智能计算云平台Alaya NeW Cloud 2.0,突破"秒级生成百万级token"性能瓶颈,提供全球首个强化学习智算服务,显著降低AI算力使用门槛。

核心亮点

采用Serverless架构,实现秒级响应与无限扩展,端到端性能提升5倍。
独创"按度计费"模式,降低总拥有成本达60%,让AI算力更普惠。
全球首创强化学习云平台,训练效率提升500%,支持万卡级异构算力调度。

原文链接: https://mp.weixin.qq.com/s/VliALWlzn8W1QROhnoiHZg


20、Kimi-Dev代码模型震撼开源!72B参数横扫SWE-bench,性能超越DeepSeek
Kimi团队最新开源代码模型Kimi-Dev-72B在SWE-bench Verified测试中以60.4%的成绩刷新开源SOTA记录,参数量仅72B却超越最新DeepSeek-R1模型,展现出强大的编程能力。该模型采用MIT协议开源,已发布权重和量化版本。

核心亮点

72B参数轻量设计却实现60.4%SWE-bench得分,性能超越主流闭源模型。
创新双角色架构,通过BugFixer和TestWriter自我博弈提升代码修复能力。
采用1500亿真实GitHub数据训练,严格净化数据避免测试泄露风险。

原文链接: https://mp.weixin.qq.com/s/f6rZVucyUf47WGUwbLjXJA


21、通义千问Qwen3全系适配MLX!AI助手迎来重大升级
通义千问Qwen3系列模型全面适配MLX框架,用户可通过Siri等语音助手便捷调用,实现更高效的AI交互体验。

核心亮点

Qwen3全系模型无缝兼容MLX,语音助手调用更流畅。
适配范围覆盖多场景,提升AI工具链的易用性。
技术突破降低使用门槛,普通用户也能轻松体验。

原文链接: https://mp.weixin.qq.com/s/L-QbHv7Rggh6TX38Vh21nw


22、Anthropic重磅推出Claude Code SDK:AI编程助手开启智能配对新时代
Anthropic正式发布Claude Code SDK,该工具旨在通过AI技术提升编程效率,实现智能配对编程,为开发者提供更高效的代码辅助支持。

核心亮点

Claude Code SDK专为开发者设计,显著提升编程效率与准确性。
支持智能配对编程,可实时提供代码建议与错误修正方案。
️集成简便,兼容多种开发环境,助力开发者快速上手使用。

原文链接: https://www.infoq.cn/article/rWPURK0yAshwhrJhhYFO


个人公人人人号:未来世界2099

主要分享全球最新科技前沿

你可能感兴趣的:(AI日报,人工智能,业界资讯)