关于市场主流大模型的系统性整理和分析(必看系列,附汇总表格)

一、旗舰专有模型生态系统

在生成式AI的高端市场,几家公司凭借其强大的研发实力和资本支持,构建了以旗舰专有模型为核心的生态系统。它们通过API和订阅服务提供最先进的功能,引领着技术发展的方向。

1.1 OpenAI:在位的创新者

OpenAI作为行业的先行者,其战略核心是建立一道“性能护城河”。通过持续发布性能领先(且价格高昂)的模型,锁定那些愿意为顶级能力支付溢价的用户和企业。其快速的迭代周期旨在使其始终保持技术领先地位。

GPT语言与推理模型
  • GPT-4系列的演进:OpenAI的模型迭代速度惊人。从2023年3月14日发布的GPT-4开始,它展示了在专业基准测试中达到“人类水平的表现” 。随后,2024年5月13日,OpenAI推出了其多模态旗舰模型GPT-4o,首次实现了对文本、音频和图像的实时处理与生成,标志着交互式AI进入新纪元 。为了满足不同需求,OpenAI的产品线不断细化,于2025年4月14日发布了专注于代码生成的GPT-4.1系列,并于2025年2月27日推出了更强大的GPT-4.5预览版 。
  • 分层模型战略:GPT-4.1的发布清晰地展示了OpenAI的分层产品策略。该系列包含三个版本:为复杂任务设计的旗舰模型GPT-4.1、在速度和智能之间取得平衡的GPT-4.1 mini,以及为低延迟任务设计的最具成本效益的GPT-4.1 nano 。这种分层结构旨在覆盖从高端企业级应用到轻量级消费级应用的所有市场区隔。
  • 定价结构:OpenAI的定价策略反映了其高端定位。以GPT-4.1系列API为例,GPT-4.1的定价为每百万输入token 2.00美元,输出为8.00美元。GPT-4.1 mini的成本则大幅降低至输入0.40美元/输出1.60美元,而GPT-4.1 nano更是低至输入0.10美元/输出0.40美元 。此外,OpenAI还提供缓存输入和模型微调的定价选项,微调成本更高,例如
    GPT-4.1的微调训练成本为每百万token 25.00美元。
  • 消费者入口:对于普通用户,ChatGPT订阅服务是接触这些先进模型的主要渠道。ChatGPT Plus(每月20美元)、ChatGPT Pro(每月200美元)和ChatGPT Team(每用户每月25-30美元)提供了不同级别的访问权限,包括高峰时段优先访问、更快的响应速度以及对Sora等新功能的有限使用权。
生成式媒体产品组合
  • DALL-E 3(图像生成):DALL-E 3在理解提示词的细微差别和细节方面比其前代产品有了显著改进,能够将用户的想法转化为异常准确的图像。其原生集成在ChatGPT中,允许用户利用ChatGPT作为头脑风暴伙伴来优化和完善提示词 。DALL-E 3的API定价按图像收费,根据分辨率和质量而异。例如,标准质量的1024x1024图像为每张0.04美元,而高清(HD)版本则为0.08美元,相比之下,DALL-E 2的价格更低。
  • Sora(视频生成):Sora是OpenAI于2024年12月9日向ChatGPT Plus和Pro用户公开发布的文本到视频模型。它能够根据文本提示生成长达20秒、分辨率高达1080p的复杂视频场景,并能对现有视频进行扩展或编辑。其技术基础是DALL-E 3的扩散型Transformer架构的延伸。Sora的定价目前捆绑在ChatGPT订阅中,例如Plus用户每月可生成有限数量的视频。
专业化模型
  • Whisper(语音转文本):Whisper是OpenAI于2022年9月21日首次发布的开源语音识别模型,因其强大的多语言转录和翻译能力而广受赞誉。它拥有从
    tiny(39M参数)到large(1550M参数)的多种模型尺寸,以平衡速度和准确性,不同尺寸的模型对VRAM的需求也从约1 GB到10 GB不等。Whisper基于Transformer编码器-解码器架构,在包含68万小时音频的大规模多样化数据集上进行训练。除了开源版本,Whisper也可通过Azure AI Speech等云平台使用,这些平台为其增加了说话人分离(diarization)等企业级功能 。2025年3月,OpenAI发布了基于GPT-4o的更新转录模型,其错误率低于Whisper,显示出将语音能力整合进其核心专有产品线的趋势。

1.2 Google (DeepMind):集成的挑战者

谷歌的AI战略根植于其庞大的生态系统。通过将旗舰模型Gemini深度整合到搜索、云服务(Vertex AI)和日常应用(Gmail, Docs)中,谷歌旨在创造一种“AI增强的谷歌体验”,从而实现强大的用户和企业锁定。

Gemini模型家族
  • Gemini模型概览:作为对标GPT系列的旗舰产品,Gemini是谷歌最智能的AI模型系列 。最新的Gemini 2.5家族于2025年推出,同样采用了分层策略,包括为高复杂性任务设计的
    Gemini 2.5 Pro、为日常任务提供快速性能的Gemini 2.5 Flash,以及为高容量、成本敏感型任务设计的Gemini 2.5 Flash-Lite 。这些模型均具备原生的多模态能力和长上下文窗口,并引入了“思考前响应”的推理能力,以提升性能和准确性 。
  • 定价与访问:谷歌为Gemini API提供了双层访问模式:一个用于测试的免费层级和一个提供更高速率限制的付费层级。其API定价极具竞争力,并根据输入长度进行分级。例如,
    Gemini 2.5 Pro的输入价格从每百万token 1.25美元起,而Gemini 2.5 Flash的输入价格仅为0.30美元。
  • 消费者订阅:谷歌通过Google AI Pro(每月19.99美元)和Google AI Ultra(每月249.99美元)两个订阅计划将Gemini推向消费者市场。这些计划的特点是捆绑销售,将Gemini的访问权限与Google One的存储空间、YouTube Premium等服务打包在一起。
    Ultra计划更是提供了对最先进模型(如2.5 Pro Deep Think和视频生成模型Veo 3)的独家访问权,这是一种典型的生态系统锁定策略。
创意与专业化模型
  • Imagen & Veo:谷歌的创意生成模型组合包括用于图像生成的Imagen和用于视频生成的Veo。这些模型被深度整合到其订阅服务中,成为Google AI Pro和Ultra计划的核心卖点之一。
  • Gemma:与专有的Gemini系列不同,Gemma是谷歌推出的轻量级开源模型系列 。这表明谷歌采取了一种混合策略,一方面通过Gemini构建强大的专有生态,另一方面通过Gemma拥抱开源社区,扩大其技术影响力。

1.3 Anthropic:关注安全的竞争者

Anthropic的市场策略是差异化竞争,通过将自身定位为比OpenAI更“安全、可靠”的选择,来吸引对风险敏感的高价值企业客户。其技术和市场合作都围绕这一核心展开。

Claude模型家族
  • 模型演进与层级:Anthropic的Claude模型家族以其强大的推理能力和对安全的重视而闻名。其迭代路径清晰,从2024年3月发布的Claude 3,到同年6月性能显著提升的Claude 3.5,再到计划于2025年5月22日推出的Claude 4 。与OpenAI类似,Claude也采用了三层模型结构:
    Opus(最强大,用于复杂推理)、Sonnet(平衡性能与速度)和Haiku(最快、最经济)。
  • 核心特性:Anthropic的核心技术理念是“宪法AI”(Constitutional AI),即通过一套预设的原则来指导模型的行为,确保其输出的无害性和可靠性 。Claude模型在编码、多步骤工作流、图表解释和从图像中提取文本等任务上表现出色 。一个重要的创新是2024年10月推出的“计算机使用”(Computer use)功能,该功能允许Claude通过截屏、点击和输入文本来操作计算机界面,是向真正的AI智能体迈出的重要一步 。
定价与访问
  • API定价:Claude的API定价处于高端水平,与OpenAI相当。例如,Claude 4 Opus的定价为每百万输入token 15美元,输出75美元 。这一定价策略表明其目标客户是愿意为高质量和高可靠性付费的企业。
  • 订阅计划:Anthropic为个人和企业用户提供了多种订阅选项。个人用户可以选择Free免费版、Pro专业版(每月20美元)或Max高级版(起价100美元),以获得更多的使用量和高级功能。针对企业,
    Team(团队)和Enterprise(企业)计划提供了协作功能、单点登录(SSO)和更高的使用配额。
  • 战略合作:Anthropic与亚马逊(通过Amazon Bedrock)和谷歌(通过Vertex AI)等大型云服务商建立了紧密的合作关系,这进一步证明了其B2B市场的战略重心 。通过这些合作,企业可以方便地在其现有的云环境中访问和集成Claude模型。

1.4 xAI:挑战现状的颠覆者

由埃隆·马斯克(Elon Musk)创立的xAI,其战略是通过快速迭代和整合实时数据源(特别是X平台),在性能上直接挑战行业领导者。Grok模型旨在提供更及时、有时甚至更具争议性的回答,吸引那些寻求“无过滤”AI体验的用户。

Grok模型家族
  • 快速迭代:xAI于2025年7月9日发布了其旗舰模型Grok 4,跳过了Grok 3.5的公开发布,直接推出了一个性能大幅提升的版本 。Grok 4有两个版本:为大多数任务设计的标准版
    Grok 4,以及一个更强大的多智能体架构Grok 4 Heavy,后者通过并行运行多个AI智能体来协同解决复杂问题,以提高准确性 。
  • 核心特性:Grok 4的核心优势在于其强大的推理能力、原生工具使用和实时搜索集成 。它能够直接访问X(前身为Twitter)的实时数据,这使其在处理时效性强的话题时具有独特优势 77。该模型在多项基准测试中表现出色,尤其是在数学、编码和科学推理方面,其性能可与顶级专有模型相媲美甚至超越 。
  • 定价与访问:Grok 4并非免费。它通过多层订阅模式提供服务。标准版Grok 4可通过每月30美元的SuperGrok计划或X平台的Premium+订阅访问 。功能更强大的
    Grok 4 Heavy则需要订阅每月300美元的SuperGrok Heavy计划,该计划主要面向需要顶级性能的企业客户和研究人员 。其API定价也具有竞争力,
    grok-4的定价为每百万输入token 3美元,输出15美元 。

二、开源运动的拥护者

与专有模型生态系统并行发展的,是一股强大的开源力量。以Meta AI、Mistral AI和Stability AI为代表的公司,通过向公众发布其模型的权重和代码,极大地推动了AI技术的民主化和创新。

2.1 Meta AI:开源巨兽

Meta的战略是通过将语言模型层商品化,来防止任何单一竞争对手建立平台垄断,从而保护其自身的核心业务(如社交媒体和元宇宙)。免费提供最先进的模型是一种战略性的防御和进攻手段,它不仅削弱了竞争对手的商业模式,还在未来的市场中播下了自己技术基础的种子。

Llama 3模型
  • 模型发布与特性:Meta于2024年4月18日发布了Llama 3系列模型,首批发布的版本包括8B(80亿)和70B(700亿)参数的预训练和指令微调模型 。Llama 3在多个方面进行了重大升级:它在一个超过15万亿token的庞大数据集上进行了预训练,该数据集的规模是Llama 2的七倍,并且代码数据量是其四倍 。此外,它采用了一个拥有128K词汇量的新分词器,能更高效地编码语言,从而提升了模型性能 。Meta还计划在未来发布参数超过400B的更大模型,直接挑战顶级的专有模型 。
  • 授权与分发:Llama 3采用了一种宽松的社区许可证,允许大多数商业用途免费使用。唯一的限制是,月活跃用户超过7亿的公司需要向Meta申请特别许可 35。为了最大化其影响力,Meta确保Llama 3在所有主流云平台(如AWS、Azure、Google Cloud)和模型中心(如Hugging Face、Kaggle)上广泛可用,极大地降低了开发者获取和使用该模型的门槛 。

2.2 Mistral AI:欧洲的劲旅

Mistral AI采取了一种“开发者优先,开放核心”的战略。他们利用高质量的开源模型来建立技术信誉和强大的开发者社区,然后通过企业级的API、专业化模型和托管服务实现盈利。这种自下而上的策略,即用开源赢得开发者的心,再用高性价比的商业产品赢得企业的预算,使其成为市场上不可忽视的力量。

双轨模型战略
  • 开源模型:Mistral AI于2023年4月由三位来自谷歌和Meta的法国研究员创立,其使命是让前沿AI技术普及化 。公司通过发布一系列强大的开源权重模型来践行这一使命,这些模型采用Apache 2.0许可证。代表性模型包括2025年6月10日发布的推理模型
    Magistral Small、语音理解模型Voxtral以及代码生成模型Devstral 。
  • 商业模型:在开源模型之外,Mistral AI还通过其API平台“La Plateforme”和云合作伙伴提供性能更强的专有商业模型 。产品线包括旗舰推理模型
    Mistral Large、平衡型模型Mistral Medium,以及针对特定任务的Codestral(代码)和Document AI(文档处理)等 。
定价与访问
  • API定价:Mistral AI的API定价极具竞争力,通常低于OpenAI和Anthropic。例如,Mistral Large 2的API价格为每百万输入token 3美元,输出9美元,远低于同级别的Claude Opus 。
  • 订阅服务:为了与大型厂商竞争,Mistral AI也为其聊天应用Le Chat推出了消费者订阅服务,包括免费版、每月14.99美元的Pro版和每用户每月24.99美元的Team版 。

2.3 Stability AI与扩散模型革命

Stability AI的战略可以被视为生成式媒体领域的“红帽模式”(Red Hat model)。它通过培育一个核心的开源项目(Stable Diffusion)来建立庞大的社区和生态系统,然后围绕这个核心项目销售企业级的服务、支持和易于使用的商业产品,从而实现盈利。

Stable Diffusion模型
  • 模型历史与演进:Stable Diffusion是2022年8月首次发布的开创性文本到图像模型,由Stability AI、Runway和慕尼黑大学的研究人员合作开发 。其最大的特点是开源,使得强大的图像生成能力首次可以在消费级硬件上运行 。模型不断迭代,
    Stable Diffusion 3于2024年2月进入预览阶段,而Stable Diffusion 3.5则在2024年10月22日迎来稳定版发布 。新版本采用了全新的多模态扩散Transformer(MMDiT)架构,显著提升了对复杂提示词的遵循能力和生成图像中的文字拼写准确性 。其模型家族也包含了
    Large、Medium和Turbo等不同版本,以在质量和速度之间提供多样化选择 。
  • 授权与访问:Stable Diffusion模型主要采用Stability AI Community License,该许可证对大多数个人和小型商业用途是免费的,但要求年收入超过100万美元的大型企业购买商业授权 。用户可以通过多种方式访问这些模型:直接从GitHub或Hugging Face下载权重进行自托管、使用官方API、通过AWS等云合作伙伴,或者使用Stability AI自己推出的网页应用如
    DreamStudio和Stable Assistant 。
  • 超越图像:Stability AI正在将其技术扩展到其他模态,推出了Stable Video(视频生成)、Stable Audio(音频生成)以及3D和4D生成工具,旨在成为一个全面的开源生成式媒体公司 。

2.4 DeepSeek:中国的开源力量

DeepSeek是一家专注于构建高性能开源大语言模型的中国公司,其战略是通过技术实力和极具竞争力的定价,挑战全球顶级模型 。

  • 模型系列与特性:DeepSeek的模型系列包括DeepSeek V3(语言模型)、DeepSeek R1(推理模型)和Janus(多模态模型)。
    DeepSeek V3基于高效的专家混合(MoE)Transformer架构,在知识、推理、编码和数学基准测试中取得了与顶级闭源模型(如GPT-4o)相近的性能。
    DeepSeek R1则是一款专注于推理的开源模型,通过强化学习进行自我进化,在数学和代码任务上表现出色 。
  • 授权与定价:DeepSeek的模型采用MIT等宽松的开源许可证,鼓励广泛的商业和研究用途 。其API定价极具竞争力,例如
    DeepSeek V3的API价格为每百万输入token 0.66美元,输出2.64美元,远低于西方同类模型 。

三、区域领导者与专业领域主导者

除了上述全球性的主要参与者,一些公司在特定区域市场或专业领域内建立了强大的领导地位。

3.1 中国AI格局:百度、阿里巴巴与腾讯

中国的AI市场呈现出一种独特的动态,即在政府支持下,由本土科技巨头主导的、以实现大规模应用和生态系统控制为目标的激烈“价格战”。

百度ERNIE(文心一言)
  • 模型系列:ERNIE(Enhanced Representation through kNowledge IntEgration)是百度的旗舰大语言模型系列。早在2021年底,百度就与鹏城实验室合作发布了拥有2600亿参数的ERNIE 3.0 Titan 。近年来,其迭代速度加快,于2025年3月16日发布了新一代多模态基础模型
    ERNIE 4.5和深度思考推理模型ERNIE X1 。
  • 市场定位与特性:ERNIE模型的核心优势在于对中文语言和文化背景的深刻理解,这使其在中国市场具有天然的优势 。它被深度整合到百度的核心产品中,如百度搜索和百度智能云,并为金融、能源、媒体等多个行业提供解决方案 。
  • 定价策略:百度的定价策略极其激进。ERNIE Bot的基础版本对个人用户完全免费 。对于企业用户,其API价格也远低于西方竞争对手。例如,
    ERNIE 4.5 Turbo的输入价格低至每千Tokens 0.03元人民币,而ERNIE X1的输入价格更是计划低至每千Tokens 0.002元人民币 57。这种策略旨在迅速抢占市场份额,将开发者和企业吸引到其云生态中。
阿里巴巴Qwen(通义千问)
  • 模型家族:Qwen是阿里巴巴达摩院于2023年4月首次推出的自研大模型系列 。与百度类似,阿里巴巴也采取了开源与专有并行的策略。它在Hugging Face等平台上开源了大量的模型,包括不同尺寸的文本生成、嵌入和重排模型,如
    Qwen3-Reranker和Qwen3-Embedding 。同时,它也通过阿里云提供更强大的专有模型服务。
  • 价格战:阿里巴巴是这场价格战的主要发起者之一。2024年5月,阿里云宣布对其主力模型Qwen-Long进行高达97%的降价,使其API输入价格降至每千Tokens 0.0005元人民币(0.05分),成为全球价格最低的LLM之一 。这一举动旨在加速AI在中国各行各业的普及,并巩固阿里云的市场地位。
腾讯Hunyuan(混元)
  • 模型系列:腾讯的Hunyuan大模型系列同样采取开源与专有并行的策略。其开源的Hunyuan-Large是一个拥有3890亿总参数和520亿激活参数的专家混合(MoE)模型,在处理长文本和综合基准测试方面表现出色 。此外,腾讯还推出了专注于3D内容生成的开源模型
    Hunyuan 3D-2.0,能够根据文本或图像在数秒内生成高分辨率的3D模型 。
  • 市场策略与定价:腾讯通过腾讯云向企业用户提供其专有模型API服务 。其定价策略同样具有竞争力,例如
    Hunyuan T1推理模型的API输入价格约为每百万token 0.14美元 。开源的
    Hunyuan 3D-2.0则完全免费,旨在推动3D内容创作的普及 。

3.2 Midjourney:艺术生成的大师

Midjourney的成功证明,在通用模型竞争白热化的市场中,专注于特定细分领域并做到极致,可以创造出强大的商业护城河。它选择不参与功能和价格的全面竞争,而是通过卓越的艺术品质吸引并留住了一个忠诚度极高的创意社区。

  • 市场定位:Midjourney是一个独立的、自筹资金的研究实验室,团队规模很小 。它没有选择开源或提供通用API,而是作为一个封闭的专有服务运营,主要通过Discord社区和其官方网站提供服务 。
  • 产品与特性:Midjourney的核心竞争力在于其无与伦比的艺术美学和风格化图像生成能力。在创意设计社区中,它被广泛认为是生成最具艺术感和视觉吸引力图像的黄金标准。
  • 定价模型:Midjourney完全采用订阅制。用户无法按次付费或免费使用(可能有限的试用除外)。其订阅计划基于“GPU小时”进行计费,从Basic基础版(每月10美元,约200张图像)到Mega高级版(每月120美元,约3600张图像)不等 。这种定价模式强调了其作为专业创意工具而非大众化应用的定位。

四、全球AI模型矩阵

下表对本文中讨论的主要AI模型进行了系统性整理,旨在为技术选型、成本效益分析和市场竞争格局评估提供一个直观、可比较的数据参考。该矩阵是报告的核心数据资产,将不同厂商、不同模态、不同商业模式的模型置于同一框架下,便于决策者进行一目了然的战略性比较。

厂商 模型名称 / 家族 种类 / 类别 核心功能与特点 性能 (关键基准) 授权 / 可用性 最新版本发布时间 定价模型 (美元)
OpenAI GPT-4o 多模态大语言模型 实时处理文本、音频、图像;卓越的推理和对话能力。 MMLU: 88.7% 专有API, 订阅 2024年5月13日 API: $5.00 In / $20.00 Out (文本, /1M tokens) ; 订阅: $20/月起 (ChatGPT Plus)
GPT-4.1 大语言模型 (代码优化) 专为编码任务优化,性能强大。 MMLU: 90.2% 专有API, 订阅 2025年4月14日 API: $2.00 In / $8.00 Out (/1M tokens)
DALL-E 3 文本到图像 高度遵循提示词,文字渲染能力强,集成于ChatGPT。 行业领先的图像质量 专有API, 订阅 2024年4月23日 (API更新) API: $0.04/图像 (1024x1024, 标清)
Sora 文本到视频 生成高质量视频,可扩展、编辑现有视频。 领先的文本到视频生成能力 订阅 (ChatGPT Plus/Pro) 2024年12月9日 订阅: $20/月起 (有限生成)
Whisper (Large-v3) 语音转文本 高精度多语言语音识别和翻译。 领先的多语言转录准确性 开源 (MIT许可证), 专有API 2023年11月 API: $0.006/分钟 ; 开源免费
Google Gemini 2.5 Pro 多模态大语言模型 适用于复杂任务和编码,原生多模态,长上下文。 GPQA Diamond: 83.0% 专有API, 订阅 2025年6月17日 API: $1.25 In / $10.00 Out (/1M tokens, <=200k)
Gemini 2.5 Flash 多模态大语言模型 速度快,适用于日常任务。 高性价比 专有API, 订阅 2025年6月17日 API: $0.30 In / $2.50 Out (/1M tokens)
Gemma 轻量级语言模型 开源模型系列,适合研究和轻量级应用。 强大的轻量级模型 开源 - 免费
Veo 3 文本到视频 高级视频生成模型。 高质量视频生成 订阅 (Google AI Ultra) 2025年 (预览) 订阅: $249.99/月 (捆绑)
Anthropic Claude 4 Opus 多模态大语言模型 顶级智能,适用于复杂推理和企业级任务。 SWE-bench: 72.5% 专有API, 订阅 2025年5月22日 API: $15.00 In / $75.00 Out (/1M tokens)
Claude 3.5 Sonnet 多模态大语言模型 平衡智能、成本和速度,性能优于前代Opus。 MMLU-Pro: 78.4% 专有API, 订阅 2024年6月20日 API: $3.00 In / $15.00 Out (/1M tokens)
Claude 3.5 Haiku 多模态大语言模型 速度最快,成本效益最高的模型。 快速、经济 专有API, 订阅 2024年12月 API: $0.80 In / $4.00 Out (/1M tokens)
xAI Grok 4 多模态推理模型 强大的推理能力,实时搜索集成,原生工具使用。 GPQA Diamond: 88% 专有API, 订阅 2025年7月9日 API: $3.00 In / $15.00 Out (/1M tokens) ; 订阅: $30/月起
Meta AI Llama 3 (70B) 大语言模型 强大的开源模型,性能卓越,社区庞大。 MMLU-Pro: 86.0% 社区许可证 2024年4月18日 免费 (MAU < 7亿)
Llama 3 (8B) 大语言模型 轻量级开源模型,适用于多种场景。 GPQA: 接近GPT-4水平 社区许可证 2024年4月18日 免费 (MAU < 7亿)
Mistral AI Mistral Large 2 大语言模型 (推理) 旗舰商业模型,具备强大的推理能力。 MMLU: 84.0% 专有API, 商业许可证 2024年11月 (2.1) API: $3.00 In / $9.00 Out (/1M tokens)
Magistral Small 大语言模型 (推理) 开源推理模型,具备可追溯的思维链能力。 AIME 2024: 70.7% 开源 (Apache 2.0) 2025年6月10日 免费
Voxtral 语音转文本 开源语音理解模型,支持多语言。 领先的语音理解能力 开源 (Apache 2.0) 2025年 42 API: $0.004/分钟 (音频输入)
Stability AI Stable Diffusion 3.5 文本到图像 强大的开源图像生成模型,采用MMDiT架构。 领先的开源图像生成 社区许可证, 商业许可证 2024年10月22日 开源免费;企业需商业授权;提供付费API和应用订阅
Stable Video 图像/文本到视频 开源视频生成模型。 高质量视频生成 研究许可证 - 开源免费;提供付费API和应用订阅
DeepSeek DeepSeek V3 大语言模型 (MoE) 性能强大的开源MoE模型,在多项基准上可与闭源模型媲美。 MMLU: 88.5% 开源 (MIT许可证), API 2024年12月26日 API: $0.66 In / $2 Out (/1M tokens)
Baidu ERNIE 4.5 (文心大模型) 多模态大语言模型 深度优化中文,原生多模态,性能全面提升。 MMLU-Pro: ~78% 专有API, 免费个人使用 2025年3月16日 个人免费;API: ~¥0.004/k In, ~¥0.016/k Out (tokens)
Alibaba Qwen-Long (通义千问) 长文本大语言模型 支持千万级token长文本输入,价格极具竞争力。 Qwen3-235B MMLU-Pro: 80.6% 专有API 2024年5月 (价格更新) API: ~¥0.0005/k In (tokens)
Tencent Hunyuan-Large 大语言模型 (MoE) 最大的开源MoE模型之一,长文本处理能力强。 MMLU-Pro: 87.2% 开源, 专有API 2023年9月7日 (首次发布) API: ~$0.14 In / ~$0.55 Out (/1M tokens)
Midjourney Midjourney v6 文本到图像 顶级艺术美学风格,社区驱动。 艺术图像生成的黄金标准 订阅专用 - 订阅: $10/月 (3.3 GPU小时) 至 $120/月 (60 GPU小时)

你可能感兴趣的:(LLM,人工智能,语言模型)