tensorflow小技巧--tensor切片赋值

给tensor进行切片赋值是使用tensorflow开发模型的常用操作,具体方法如下:

#定义一个5*2*3的变量
a=tf.Variable(tf.zeros((5,2,3)),name='myTensor')
#对中间维度为1的切片进行赋值
a[:,1,:].assign(tf.constant([[1,2,3],[4,5,6],[7,8,9],[10,11,12],[13,14,15]],dtype=tf.float32))

#赋值后的a
<tf.Variable 'myTensor:0' shape=(5, 2, 3) dtype=float32, numpy=
array([[[ 0.,  0.,  0.],
        [ 1.,  2.,  3.]],
       [[ 0.,  0.,  0.],
        [ 4.,  5.,  6.]],
       [[ 0.,  0.,  0.],
        [ 7.,  8.,  9.]],
       [[ 0.,  0.,  0.],
        [10., 11., 12.]],
       [[ 0.,  0.,  0.],
        [13., 14., 15.]]], dtype=float32)>

关于训练:考虑一个更复杂的赋值例子,a是一个可以训练的变量,我们把a作为切片赋值为变量b,函数f(b)是否也可以对a求导呢?通过实验看一下吧。

#a是可以求导的变量
a=tf.Variable([5.0,4.0],trainable=True,name='a')

#b是可以求导的变量
b=tf.Variable(tf.zeros((3,2)),trainable=True,name='b')

#将a赋值给b的第一行
b[0,:].assign(a)

#fun=b1*b1+...+bn*bn
with tf.GradientTape() as tape:
    fun=tf.reduce_sum(b*b)
grad=tape.gradient(fun,b)

#求导结果
grad
<tf.Tensor: shape=(3, 2), dtype=float32, numpy=
array([[10.,  8.],
       [ 0.,  0.],
       [ 0.,  0.]], dtype=float32)>

对b求导的结果符合预期,那对a求导呢?

with tf.GradientTape() as tape:
    fun=tf.reduce_sum(b*b)
grad=tape.gradient(fun,a)
grad

对a求导结果为空,说明导数不存在。说明切片赋值仅仅是将a的值赋给了b,b中并不包含变量a,fun仅仅是b的函数!

注:tensorflow版本 2.2
每天学习一个小技巧~~

你可能感兴趣的:(tensorflow,python,numpy,人工智能,机器学习)