Reinforcement learning and Deep learning

Author: LiChong0309
Lable: Reinforcement intelligence 、Deep learning、Artificial Intelligence、Machine Learning

  • 1.Artificial Intelligence
  • 2. Machine Learning
  • 3. Reinfrocement Learning
  • 4. Deep Learning
  • 5.Reinforcement Learning和Deep learning的区别
  • 6. Reference

Reinforcement learning and Deep learning_第1张图片
从图中可以看出,人工智能提出的最早,机器学习提出的稍晚,深度学习最晚。

1.Artificial Intelligence

①:弱人工智能:行为方式是人类预先设定好的,知识是有限的,运算过程是一个相对封闭的环境。即使它的能力在今后的发展中得到非常大的提升,也只知识量的提高、运算速度的提升和运算范围的扩大。这样的人工智能是受人类掌控的,对人类自身来说是先对安全的。
②: 强人工智能:有可能制造出真正能推理和解决问题的智能机器,这样的机器是有知觉的,有自我意识的。

而目前业界的真实的人工智能还处于早期人工智能阶段,或者叫做弱人工智能,终结者这样的机器人应该才算强人工智能.不过目前离这个目标还有些遥远.人工智能往往结合着制造业,因此说人工智能的时候往往会说机器人。而目前业界的真实的人工智能还处于早期人工智能阶段,或者叫做弱人工智能,终结者这样的机器人应该才算强人工智能,不过目前离这个目标还有些遥远,人工智能往往结合着制造业,因此说人工智能的时候往往会说机器人。

2. Machine Learning

机器学习是实现人工智能的一种手段,也是目前被认为比较有效的实现人工智能的手段,目前在业界使用机器学习比较突出的领域很多,例如:计算机视觉、自然语言处理、推荐系统等等。大家生活中经常用到的比如高速上的ETC的车牌识别,今日头条的新闻推荐,天猫上的评价描述。
Machine Learning 可以分为三种:
①:监督学习
②:无监督学习
③:半监督学习

3. Reinfrocement Learning

※:是一种机器学习的技术
※:又称为再励学习、评价学习
※:Reinforcement learning是智能系统(agent)从环境(state)行为(action)映射的学习,以使奖励信号函数值最大。
※:由于外部给出的信息很少,所以智能系统必须要依靠自身的经历进行自我学习,通过这种学习获取知识,改进行动方案以适应环境。

Reinforcement Learing三要素是:
①:状态(State)
②:行为(action)
③:环境奖励(reward)

4. Deep Learning

※:是机器学习的一种技术
※:最初的深度学习网络是利用神经网络来解决特征层分布的一种学习过程。

神经网络是受人类大脑的启发而来的:神经元之间的相互连接关系。但是,人类大脑中的神经元可以与特定范围内的任意神经元连接,而人工神经网络中数据传播要经历不同的层,传播方向也不同。
举个例子,你可以将一张图片切分为小块,然后输入到神经网络的第一层中。在第一层中做初步计算,然后神经元将数据传至第二层。由第二层神经元执行任务,依次类推,直到最后一层,然后输出最终的结果。
通常我们了解的DNN(深度神经网络),CNN(卷积神经网络),RNN(循环神经网络),LSTM(长短期记忆网络)都是隶属于深度学习的范畴

5.Reinforcement Learning和Deep learning的区别

关于强化学习和深度学习的实例,最典型的莫过于谷歌的AlphaGo和AlphaZero两位了,前者通过深度学习中的深度卷积神经网络,在训练了大约三千万组人类的下棋数据,无数度电的情况下才搞出来的模型,而后者使用强化学习的方式,通过自己和自己下棋的方式搞出来的模型.而最终的实验结果也很让人震撼.AlphaGo干败了人类围棋顶尖高手,而AlphaZero干败了AlphaGo。
深度学习技术可以用到强化学习上,叫深度强化学习

6. Reference

基本概念:人工智能,机器学习,深度学习,强化学习的区别和简介:
https://my.oschina.net/lums/blog/1808968

你可能感兴趣的:(Artificial,Intelligence,Machine,Learning,Reinforcement,Learning,Deep,learning)