什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问

什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第1张图片

人工智能这门学科,别说我们一般人了,就是很多业内人士也很难搞得特别清楚。究其原因,人工智能是一个非常广泛的领域,涵盖了很多大的学科。大致可以归纳为以下六个类别:

什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第2张图片
什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第3张图片

在进一步阐述深度学习之前,我们需要了解什么是机器学习(Machine Learning)。机器学习是人工智能的一个分支,而在很多时候,几乎成为人工智能的代名词。简单来说,机器学习就是通过算法,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测。

深度学习是机器学习研究中的一个新的领域,其目的是建立可以模拟人脑进行分析学习的神经网络。简单来说,深度学习就是使用深度神经网络来做机器学习。

什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第4张图片

仍然是一头雾水?没关系,小T举一个生活中常见的挑水果的示例大家就很容易明白了。

什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第5张图片

小时候,妈妈让我们帮忙出门去买些水果。因为家人都喜欢甜美多汁的苹果,所以妈妈告诉我们:果皮透亮的红色苹果比绿色的苹果要更甜一些。由此我们产生了一个简单的规则:只挑选皮亮色红的苹果。

苹果买回来吃了以后我们发现,同样是皮亮色红的苹果,其中有一些其实味道也并不好。很显然,妈妈教给我们的方法有些片面了,挑选甜美多汁的苹果的标准并不只根据颜色。

通过不断购买和尝试大量苹果以后,我们总结出来一个结论:皮亮色红是没有错的,但是相对于那种有着大片红色果皮的苹果来讲,红色呈条纹状的那种更甜更好吃。从此以后,我们就会加上这条新的经验结论去购买苹果。

什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第6张图片
不断的购买和尝试,相当于喂给机器海量的训练数据

过了一段时间有一天,我们发现经常购买苹果的那家店铺关门了。所以我们又换了另外一家水果店根据以前经验结论去购买苹果。不过这家店铺的苹果和之前我们常去的那家的苹果不是一个产地的,之前的一些经验结论又不适用了。于是我们又重新开始尝试,发现A产地的苹果是红色条纹的最甜,而B产地的苹果是黄红色的最甜。

又过了一段时间家里来了个妹妹,妹妹并不喜欢甜甜的红苹果,只喜欢酸酸甜甜的橙子。。。(额,脑仁疼!).我们之前所有实践得出的苹果知识都没用了。我们需要根据之前挑苹果的经验,用相同的办法重新研究一遍哪些橙子的口感最好。

什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第7张图片
有没有悟出点儿什么!

在这个买水果的例子中,我们就相当与一个进行深度学习的机器。大量的试吃的苹果就是机器的训练数据我们通过对大量数据的分类和逻辑判断,不断更新和修正自身在购买水果这个方向的认知。

这其中的分类和逻辑判断,就是机器的算法。读取更多的训练数据,机器的准确率也会更高,一旦发生预测错误机器就会进行自我修正。

更妙的是,机器还能用同一个算法来训练不同的模型,预测不同的水果:橙子、香蕉、葡萄、樱桃、西瓜之类的等等。

由此可见,深度学习的进展本质上是由大数据喂养出来的。大数据时代,海量高质量的带标注数据,使深度学习模型可以学习到非常有效的层次化特征表示;以云计算为代表的大规模分布式计算平台以及GPU、FPGA等硬件能力的提升为深度学习提供了必要的计算基础设施。大数据喂养下的深度学习取得了显著进展,机器在图像、语音识别等感知能力方面甚至超越人类。在深度学习的推动下,自然语言处理方面也取得了显著进展。

什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第8张图片

1、依赖大规模标注数据和难以有效利用先验知识等局限性,阻碍了深度学习的进一步发展。

由于深度学习需要的训练数据数量十分庞大,而随着数据采集难度和获取成本的日益增高,深度学习也逐渐体现出其局限性。

什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第9张图片
先验知识的宝库还尚未被深度学习有效利用  

2、深度学习还有一个不小的问题:没有人知道它是如何运作的。

深度神经网络的架构由于或多或少受到了人类大脑的启发,正如人类的大脑一样,深度学习的程序很难从外部理解:它是一个神秘的黑箱。也就是说,我们为机器提供大量的训练数据,机器就能够产生一套算法并不断自行进化和修正。但是这套算法机器是如何产生的,我们不得而知。

什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第10张图片
“黑箱难题”仍在阻碍着深度学习的普及

目前,全世界的科学家们都在全力开发工具打开这个黑箱。因为黑箱的存在即意味着不可解释,以及不确定性。“我们并不确定神经网络在做什么,我们不太信任它。”工程师们告诉小T:“对神经网络的恐惧是完全正当的,而真正让我感到恐惧的是神经网络在学习对的事情的同时也学习了错的事情。”

什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第11张图片

深度学习的大量实践中,人们越来越多地发现深度学习模型的结果往往与人的先验知识或者专家知识相冲突。如何让深度学习摆脱对于大规模样本的依赖?如何让深度学习模型有效利用大量存在的先验知识?如何让深度学习模型的结果与先验知识一致已成为了当前深度学习领域的重要问题。


什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问_第12张图片

下期内容:什么是数据标注?|“人工智能+区块链”科普第5问

你可能感兴趣的:(什么是深度学习?深度学习的发展瓶颈为何| “人工智能+区块链”科普第4问)