商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!

文 | BFT机器人 

商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!_第1张图片

近日,商汤科技正式发布「日日新SenseNova 4.0」,宣告大模型体系多维度全面升级。这款模型具备更全面的知识覆盖、更可靠的推理能力,以及更优越的长文本理解和数字推理能力。同时,它还支持跨模态交互,为不同应用场景提供了强大的支持。

商汤科技推出的「日日新·商量大语言模型-通用版本(SenseChat V4)」,具备强大的语言能力,支持128K语境窗口长度,整体评测成绩水平比肩GPT 4,相较GPT 3.5已经实现了全面超越。为了方便开发者使用,商汤还推出了Function call & Assistants API版本的大语言模型,显著降低了使用大模型的门槛。

商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!_第2张图片

基于最新发布的Function call & Assistants API版本大语言模型,商汤科技已经开发并发布了数据分析工具“办公小浣熊”。此外,商汤还将大模型能力转化为实际场景的产品应用,推出了面向办公场景的商汤⽇⽇新·商量语⾔⼤模型-数据分析版本、面向医疗场景的日日新·商量语言大模型-医疗版本“大医”、 面向自动驾驶及工业场景的日日新·商量多模态大模型,以及面向创作创意场景的日日新·秒画文生图大模型等丰富的工具。

目前,商汤科技的「日日新SenseNova」大模型体系已经与在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业超过500家客户建立深度合作,加速了行业企业的智能化转型。未来,商汤将继续推动「日日新SenseNova」大模型体系及相关产品和工具的发展,为实现通用人工智能(AGI)提供有力支持,助力全场景、多产业实现智能化升级。

最高支持12万文字长文本

   综合成绩比肩GPT-4

「日日新SenseNova 4.0」为开发者提供了丰富而灵活的API接口和服务,使他们可以根据实际应用需求轻松调用大模型的AI技术能力。这种设计理念旨在降低成本、提高效率,从而加速各类AI应用的实现。

大模型性能提升的关键在于语言建模能力的增强。「日日新SenseNova 4.0」在语言建模方面实现了全新升级,推出了「日日新·商量大语言模型-通用版本(SenseChat V4)」。该模型支持不同长度的token窗口,包括4k、32k和128k,进一步扩大了模型的应用范围。

商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!_第3张图片

商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!_第4张图片

在能力提升方面,SenseChat V4在知识理解阅读理解综合推理数理代码长文本理解等领域展现出强大的通用能力。综合整体评测成绩水平比肩GPT-4,尤其在推理和代码编程测评中,表现甚至超越了GPT-4。在权威测试集HumanEval Coding的测试中,一次通过率高达75.6%,这一数据优于GPT-4的74.4%。

构建专业大模型

  填补行业空缺

除了基础模型,商汤科技还致力于通过高效融合垂直领域知识,帮助人们构建各类专业大模型,从而降低大模型的下游应用成本和门槛。这一目标旨在推动大模型技术在更多领域的应用和普及。

在技术演进方面,多模态成为人工智能大模型的重要方向

商汤科技的新一代「日日新 SenseNova」推出了拥有300亿参数的日日新·商量多模态大模型(SenseChat-Vision V4),其图文感知能力在全球范围内处于领先水平。在权威评测基准测试集MME Benchmark上,该模型的综合得分排名首位,展现了出色的性能表现。

商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!_第5张图片

目前,该模型已经支持智能驾驶智能车舱电力行业等多个实际场景的应用。与传统的OCR能力相比,日日新·商量多模态大模型不仅能理解图像中的文字和物体,还能根据逻辑进行推理,实现了更高程度的认知能力。这一特点使得该模型在处理复杂场景和任务时具有更高的灵活性和准确性。

办公与数据分析领域,商汤科技推出了日日新·商量语言大模型-数据分析版本(SenseChat-DataAnalysisCode V4)。这款工具具备强大的自然语言输入功能,结合商汤大模型的意图识别、逻辑理解与代码解释器的能力,能够自动将数据转化为有意义的分析和可视化结果。

商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!_第6张图片

在实际应用方面,该工具已经广泛支持xls、xlsx、csv、txt、json等格式的文件和表格处理。在1000+测试集的精度上,办公小浣熊的表现略胜于GPT-4。这一优势使得该工具在处理复杂的数据分析任务时更加高效和准确。

此外,在医疗健康领域,商汤科技也对大语言模型的医疗版本进行了全新升级。日日新·商量语言大模型-医疗版本“大医”(SenseChat-Medical V4)在本次更新后,实现了专业医学问答及复杂医学任务推理的功能。同时,该模型还支持更多模态医学文件的智能解读和交互问答。

商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!_第7张图片

在两项行业权威评测中,大医的表现均非常出色。在2023年职业药剂师考试大模型评测和中文医疗大语言模型开放评测平台MedBench中,大医的综合评分均排名第二,性能接近GPT-4。这一成绩充分证明了其在医疗领域的强大实力和广泛应用前景。

商汤科技自主研发的日日新-秒画文生图大模型(SenseMirage V4)相较于前一版本,参数量大幅提升至百亿量级。通过采用Mixture of text experts、Spatial-aware CFG等先进的算法优化,该模型的语义理解能力与图像质感细节表现得到了显著增强,能够达到电影级海报的生成水平。

同时,结合Adversarial Distillation算法,商汤科技还发布了秒画SenseMirage-Turbo V4版本。相较于基础版本,该版本在推理速度上实现了10倍的提升。这一显著的优势使得秒画SenseMirage-Turbo V4在处理大规模图像生成任务时更加高效,为实际应用提供了更加强大的支持。

结语

自23年商汤科技推出「日日新 SenseNova」大模型体系以来,这一创新产品形态已成为大模型技术落地应用的重要尝试之一。该体系为企业用户提供了丰富的AI应用工具和服务,使得超过3000家企业能够快速融入大模型技术应用领域,覆盖了互联网、游戏、文旅、教育、医疗健康、金融和编程等多个行业。

商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!_第8张图片

商汤科技始终致力于降低大模型的使用门槛,通过不断的技术创新和产品优化,拓展人工智能在各行业的落地场景。这一目标使得大模型技术真正在行业中得到了广泛应用,为各行业带来了更高效、智能的解决方案。

未来,商汤科技将继续推进「日日新 SenseNova」大模型体系的建设,实现更多创新场景的应用。通过不断的技术创新和产品升级,商汤将不断推动大模型的前置化,让更多的智能走向更多场景、更多行业。

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。

你可能感兴趣的:(科技)