多模态:Phi-3.5-vision-instruct【4.2B参数】【微软】

2024年时间线:

2月,微软“送温暖”法国初创公司Mistral,这是微软投资的第二家大模型公司;

3月,微软“活剥”Inflection,开创巨头“垄断新思路”;

微软“嫡长子”轻量级模型Phi-3出世,性能堪比GPT-3.5 Turbo;

4月,微软宣布向 G42投资15 亿美元,后者会通过Azure运行其AI应用和服务。

8月,微软发布Phi-3.5系列——Phi-3.5-mini-instruct(38.2亿参数)、Phi-3.5-MoE-instruct(419亿参数)、Phi-3.5-vision-instruct(41.5亿参数)

Phi-3.5-vision-instruct是微软最新发布的 Phi-3.5 系列中的一个AI模型,专注于多模态任务处理,尤其是视觉推理方面的能力。

Phi-3.5-vision-instruct模型具备广泛的图像理解、

你可能感兴趣的:(VLM/多模态,phi)