李宏毅老师2020年深度学习系列讲座笔记8

瞎看吧。。。。至少做个笔记

https://www.bilibili.com/video/BV1UE411G78S?from=search&

 

第八节课来啦!

首先研究的是当action的空间不是有限的而是连续的(无穷)情形。一种解决方法是抽样一系列action来学习;一种是直接gradient descent硬算。

第三种方法:

李宏毅老师2020年深度学习系列讲座笔记8_第1张图片

然后就结束了?????

 

 

你可能感兴趣的:(李宏毅老师2020年深度学习系列讲座笔记8)