自动驾驶---视觉语言模型(VLM)与双系统融合

1 背景

        目前从笔者的调研信息来看,不少公司在智驾领域都采用了VLM大模型技术,量产版本中包括理想和小米。

        前段时间,笔者写了比较多关于理想汽车的博客,也多次介绍了理想汽车的总体智驾方案,并且近几个月自媒体“电动知士”对智界,小鹏,理想,智己四家在售车型(分别对应的技术商为:华为,小鹏,理想,Momenta)分别在武汉和重庆(相对来说比较难的城市)两地进行了智驾方面的测试。整体看下来,在表现比较好的是华为和小鹏,理想在重庆的表现比在武汉好一些。

        目前国内这四家在智驾大模型的研发效率上和其它厂家基本拉开了一些差距,从最近的各路媒体测试也能看出来。在笔者看来,基础能力上唯一领先的仍然是特斯拉的FSD。

自动驾驶---视觉语言模型(VLM)与双系统融合_第1张图片

        因此本篇博客详细介绍理想汽车和清华大学在VLM方面的研究,在前面的

你可能感兴趣的:(自动驾驶,人工智能,机器学习)