机器学习、深度学习,大模型之间的关系?

好多朋友因为ChatGPT、DeepSeek才开始关注AI,当深入了解AI技术,又接触到类似于机器学习、深度学习的概念。

对于非技术背景的粉丝朋友来说,开始总会有些晕,搞不清楚机器学习、深度学习、大模型彼此之间的关系。

到底哪一个技术更高级?

他们是替代关系、包含关系、还是互补关系呢?

其实所有AI技术的实现载体,都叫“模型”。大模型是AI技术模型的一种。

机器学习和深度学习都是获得模型的方法和手段。从概念上来说,机器学习的内涵比深度学习更加宽泛!

机器学习、深度学习,大模型之间的关系?_第1张图片

当遇到一个需要智能化解决方案的业务问题的时候,我们唯一要做的事情,其实就是“建模” —— 从数据中抽象出等价“模型”。

如果模型是根据数据自动计算生成的,这类技术就叫机器学习。当然,也有不少模型是通过人工观察数据总结定义的规则。

深度学习技术,是一种特殊类型的机器学习方法。

深度学习技术的建模对象是深度神经网络,但是机器学习的方法并没有这样的限制。

深度神经网络模型在建模时,用户往往不需要对变量预设业务含义。

这个特性极大地降低了技术人员的业务门槛,所以深度学习技术的发展更快,在各个行业的落地应用也更加广泛。

当然,这也带来了另外一个比较现实的问题,就是模型的可解释性比较差,给实际业务应用带来了更大的决策风险。

再来说大模型技术,不管是语言大模型、图像大模型还是多模态大模型,其底层架构都是深度神经网络。

于是,深度学习和大模型技术是密切关联的。而掌握深度学习技术,前提又需要理解机器学习的工作原理。

在利用大模型技术解决AI问题时,分为以下几种情况:

1)大模型自身就直接就可以解决业务问题。这主要用的是大模型自带的推理能力。用提示词的方式,定义清楚任务,同时给它必要的条件,直接反馈答案。

2)大模型可以回答问题,但是质量不好。这就要求对大模型中的模型参数进行调整。改变模型参数,这就属于“建模”的范畴了,机器学习也好,深度学习也好,都是绕不过去的技术过程。

3)大模型不适合解决目标业务问题。这里的原因是多方面的,包括模型不兼容、推理成本过高、计算资源有限、缺少“建模”必要的数据集等。

根据机器学习理论,“建模”所需要的数据量应当和模型参数相匹配!

对于大模型来说,因为需要调整的参数量巨大,所以当大模型不满足业务应用要求,同时可以参考的业务数据又不足,那么意味着不适合“大模型”的解决方案,可能要求用户回到传统的机器学习(小模型)解决方案中。

最后总结一下,写这篇文章的目的在于:

一是厘清机器学习、深度学习、大模型三者的关系;

二是提醒大家不要迷恋“大模型”技术,AI模型和业务问题相匹配,才能产生好的数字化应用效果。

你可能感兴趣的:(人工智能,ai,改行学it,语言模型,深度学习)