幻璃

TensorFlow2

业界主流开发框架

1. TensorFlow2 基础

1.1 tensor 介绍

TensorFlow 中，tensor 通常分为：常量 tensor 与变量 tensor：

常量 tensor 定义后值和维度不可变，变量定义后值可变而维度不可变。
在神经网络中，变量 tensor 一般可作为储存权重和其他信息的矩阵，是可训练的数据类型。而常量tensor 可作为储存超参数或其他结构信息的变量

1.2 创建常量 tensor

常量 tensor 的创建方式比较多，常见的有一下几种方式：

l tf.constant()：创建常量 tensor；
l tf.zeros(), tf.zeros_like(), tf.ones(),tf.ones_like(): 创建全零或者全一的常量 tensor；
l tf.fill(): 创建自定义数值的 tensor；
l tf.random: 创建已知分布的 tensor；
l 从 numpy，list 对象创建，再利用 tf.convert_to_tensor 转换为类型。

步骤 1 tf.constant()

tf.constant(value, dtype=None, shape=None, name='Const', verify_shape=False)：

l value：值；
l dtype：数据类型；
l shape：张量形状；
l name：常量名称；
l verify_shape：布尔值，用于验证值的形状，默认 False。verify_shape 为 True 的话表示检查 value 的形状与 shape 是否相符，如果不符会报错。

代码：

import tensorflow as tf

const_a = tf.constant([[1, 2, 3, 4]], shape=[2, 2], dtype=tf.float32)  # 创建 2x2 矩阵,值 1,2,3,4 
const_a

输出：
<tf.Tensor: id=2, shape=(2, 2), dtype=float32, numpy=
array([[1., 2.],
       [3., 4.]], dtype=float32)>

代码：

# 查看常见属性
print("常量const_a 的数值为：", const_a.numpy())
print("常量const_a 的数据类型为：", const_a.dtype)
print("常量const_a 的形状为：", const_a.shape)
print("常量const_a 将被产生的设备名称为：", const_a.device)

输出：
常量const_a 的数值为： [[1. 2.]
 [3. 4.]]
常量const_a 的数据类型为： <dtype: 'float32'>
常量const_a 的形状为： (2, 2)
常量const_a 将被产生的设备名称为： /job:localhost/replica:0/task:0/device:CPU:0

步骤 2 tf.zeros(), tf.zeros_like(), tf.ones(),tf.ones_like()

因为 tf.ones()，tf.ones_like()与 tf.zeros()，tf.zeros_like()的用法相似，因此下面只演示前者的使用方法。

创建一个值为 0 的常量。

tf.zeros(shape, dtype=tf.float32, name=None):

l shape：张量形状;
l dtype：类型;
l name：名称。

代码：

zeros_b = tf.zeros(shape=[2, 3], dtype=tf.int32)  # 创建 2x3 矩阵，元素值均为 0

根据输入张量创建一个值为 0 的张量，形状和输入张量相同。

tf.zeros_like(input_tensor, dtype=None, name=None, optimize=True)：

l input_tensor：张量；
l dtype：类型；
l name：名称；
l optimize：优化。

代码：

zeros_like_c = tf.zeros_like(const_a)
# 查看生成数据
zeros_like_c.numpy()

输出：
array([[0., 0.],
       [0., 0.]], dtype=float32)

步骤 3 tf.fill()

创建一个张量，用一个具体值充满张量。

tf.fill(dims, value, name=None)：

l dims：张量形状，同上述 shape；
l vlaue：张量数值；
l name：名称。

代码：

fill_d = tf.fill([3, 3], 8)  # 2x3 矩阵，元素值均为为 8  
# 查看数据
fill_d.numpy()

输出：
array([[8, 8, 8],
       [8, 8, 8],
       [8, 8, 8]], dtype=int32)

步骤 4 tf.random

用于产生具体分布的张量。该模块中常用的方法包括：tf.random.uniform()，tf.random.normal()和 tf.random.shuffle()等。下面演示 tf.random.normal()的用法。

创建一个符合正态分布的张量。

tf.random.normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32,seed=None, name=None):

l shape：数据形状；
l mean：高斯分布均值；
l stddev：高斯分布标准差；
l dtype：数据类型；
l seed：随机种子
l name：名称。

代码：

random_e = tf.random.normal([5, 5], mean=0, stddev=1.0, seed=1)
# 查看创建数据
random_e.numpy()

输出：
array([[-0.8113182 ,  1.4845988 ,  0.06532937, -2.4427042 ,  0.0992484 ],
       [ 0.5912243 ,  0.59282297, -2.1229296 , -0.72289723, -0.05627038],
       [ 0.6435448 , -0.26432407,  1.8566332 ,  0.5678417 , -0.3828359 ],
       [-1.4853433 ,  1.2617711 , -0.02530608, -0.2646297 ,  1.5328138 ],
       [-1.7429771 , -0.43789294, -0.56601   ,  0.32066926,  1.132831  ]],
      dtype=float32)

步骤 5 从 numpy，list 对象创建，再利用 tf.convert_to_tensor 转换为类型。

将给定制转换为张量。可利用这个函数将 python 的数据类型转换成 TensorFlow 可用的 tensor 数据类型。

tf.convert_to_tensor(value,dtype=None,dtype_hint=None,name=None):

l value：需转换数值；
l dtype：张量数据类型；
l dtype_hint：返回张量的可选元素类型，当 dtype 为 None 时使用。在某些情况下，调用者在tf.convert_to_tensor 时可能没有考虑到 dtype，因此 dtype_hint 可以用作为首选项。

代码：

# 创建一个列表
list_f = [1, 2, 3, 4, 5, 6]
# 查看数据类型
type(list_f)

输出：
list

代码：

tensor_f = tf.convert_to_tensor(list_f, dtype=tf.float32)
tensor_f

输出：
<tf.Tensor: id=16, shape=(6,), dtype=float32, numpy=array([1., 2., 3., 4., 5., 6.], dtype=float32)>

1.3 创建变量 tensor

TensorFlow 中，变量通过 tf.Variable 类进行操作。tf.Variable 表示张量，其值可以通过在其上运行算术运算更改。可读取和修改变量值。

代码：

# 创建变量，只需提供初始值
var_1 = tf.Variable(tf.ones([2, 3]))
var_1

输出：
<tf.Variable 'Variable:0' shape=(2, 3) dtype=float32, numpy=
array([[1., 1., 1.],
       [1., 1., 1.]], dtype=float32)>

代码：

# 变量数值读取
print("变量 var_1 的数值：", var_1.read_value())
# 变量赋值
var_value_1 = [[1, 2, 3], [4, 5, 6]]
var_1.assign(var_value_1)
print("变量 var_1 赋值后的数值：", var_1.read_value())

输出：
变量 var_1 的数值： tf.Tensor(
[[1. 1. 1.]
 [1. 1. 1.]], shape=(2, 3), dtype=float32)
变量 var_1 赋值后的数值： tf.Tensor(
[[1. 2. 3.]
 [4. 5. 6.]], shape=(2, 3), dtype=float32)

代码：

# 变量加法
var_1.assign_add(tf.ones([2, 3]))
var_1

输出：
<tf.Variable 'Variable:0' shape=(2, 3) dtype=float32, numpy=
array([[2., 3., 4.],
       [5., 6., 7.]], dtype=float32)>

1.4 tensor 切片与索引

1.4.1 切片

切片的方式主要有：

l [start: end]：从 tensor 的开始位置到结束位置的数据切片；
l [start :end :step]或者[::step]：从 tensor 的开始位置到结束位置每隔 step 的数据切片；
l [::-1]:负数表示倒序切片；
l ‘…’：任意长。

代码：

# 创建一个 4 维tensor。tensor 包含 4 张图片，每张图片的大小为 100*100*3 
tensor_h = tf.random.normal([4, 100, 100, 3])
tensor_h

输出：
<tf.Tensor: id=40, shape=(4, 100, 100, 3), dtype=float32, numpy=
array([[[[-1.2748867 ,  0.61186457, -1.3725697 ],
         [-0.32428452,  0.2527103 ,  0.69562674],
         [ 0.55394286,  1.0515776 ,  1.6650721 ],
         ...,
         [ 0.5942018 , -0.3625194 ,  1.3041826 ],
         [ 0.81127596,  3.019384  ,  0.22381118],
         [ 0.9802666 ,  0.52870286,  1.8634393 ]],

        [[ 0.05032753, -0.45593497,  1.006573  ],
         [-0.97207814,  0.65104896, -0.5570135 ],
         [-0.90569866,  0.1540982 , -0.04971581],
         ...,

# 取出第一张图片
tensor_h[0, :, :, :]

输出：
<tf.Tensor: id=44, shape=(100, 100, 3), dtype=float32, numpy=
array([[[-1.2748867 ,  0.61186457, -1.3725697 ],
        [-0.32428452,  0.2527103 ,  0.69562674],
        [ 0.55394286,  1.0515776 ,  1.6650721 ],
        ...,
        [ 0.5942018 , -0.3625194 ,  1.3041826 ],
        [ 0.81127596,  3.019384  ,  0.22381118],
        [ 0.9802666 ,  0.52870286,  1.8634393 ]],

# 每两张图片取出一张的切片
tensor_h[::2, ...]

输出：
<tf.Tensor: id=48, shape=(2, 100, 100, 3), dtype=float32, numpy=
array([[[[-1.2748867 ,  0.61186457, -1.3725697 ],
         [-0.32428452,  0.2527103 ,  0.69562674],
         [ 0.55394286,  1.0515776 ,  1.6650721 ],
         ...,
         [ 0.5942018 , -0.3625194 ,  1.3041826 ],
         [ 0.81127596,  3.019384  ,  0.22381118],
         [ 0.9802666 ,  0.52870286,  1.8634393 ]],

#倒序切片
tensor_h[::-1]

输出：
<tf.Tensor: id=52, shape=(4, 100, 100, 3), dtype=float32, numpy=
array([[[[ 0.5161808 ,  0.23140958, -0.43209437],
         [ 0.00776087,  1.3823358 ,  0.6929437 ],
         [ 1.5621277 , -0.04508307, -0.1968164 ],
         ...,
         [-1.2630497 , -1.0238761 , -1.1867431 ],
         [-0.24941015, -0.11402028,  0.27717665],
         [ 0.8502298 , -0.30275303, -0.85351145]],

1.4.2 索引

索引的基本格式：a[d1] [d2] [d3]

代码：

# 取出第一张图片第二个通道中在[20,40]位置的像素点 
tensor_h[0][19][39][1]

输出：
<tf.Tensor: id=68, shape=(), dtype=float32, numpy=-1.614223>

在某一维度进行索引。

tf.gather(params, indices,axis=None)：

l params：输入张量；
l indices：取出数据的索引；
l axis：所取数据所在维度。

代码：

# 取出tensor_h（[4,100,100,3]）中，第 1，2，4 张图像。 
indices = [0, 1, 3]
tf.gather(tensor_h, axis=0, indices=indices)

输出：
<tf.Tensor: id=83, shape=(3, 100, 100, 3), dtype=float32, numpy=
array([[[[-0.01252888, -0.46393958,  0.60526013],
         [-0.01322627, -0.24589129, -1.7498221 ],
         [ 0.15702602, -0.84582156, -0.01484271],
         ...,
         [-1.4868114 ,  2.6454847 ,  0.84849346],
         [-0.15565126,  0.5482018 , -0.96524566],
         [ 1.1514304 , -0.07815795,  1.7596667 ]],

tf.gather_nd 允许在多维上进行索引:

tf.gather_nd(params,indices)：

l params：输入张量；
l indices：取出数据的索引，一般为多维列表。

代码：

# 取出tensot_h([4,100,100,3])中，第一张图像第一个维度中[1,1]的像素点；第二张图片第一像素点中[2,2]的像素点 
indices = [[0, 1, 1, 0], [1, 2, 2, 0]]
tf.gather_nd(tensor_h, indices=indices)

输出：
<tf.Tensor: id=85, shape=(2,), dtype=float32, numpy=array([-0.38638964, -1.1200645 ], dtype=float32)>

1.5 张量的维度变化

1.5.1 维度查看

代码：

const_d_1 = tf.constant([[1, 2, 3, 4]], shape=[2, 2], dtype=tf.float32)  # 查看维度常用的三种方式
print(const_d_1.shape)
print(const_d_1.get_shape())
print(tf.shape(const_d_1))  # 输出为张量，其数值表示的是所查看张量维度大小

输出：
(2, 2)
(2, 2)
tf.Tensor([2 2], shape=(2,), dtype=int32)

可以看出.shape 和.get_shape()都是返回 TensorShape 类型对象，而 tf.shape(x)返回的是 Tensor 类型对象。

1.5.2 维度重组

tf.reshape(tensor,shape,name=None)：

l tensor：输入张量；
l shape：重组后张量的维度。

代码：

reshape_1 = tf.constant([[1, 2, 3], [4, 5, 6]])
print(reshape_1)
tf.reshape(reshape_1, (3, 2))

输出：
tf.Tensor(
[[1 2 3]
 [4 5 6]], shape=(2, 3), dtype=int32)
<tf.Tensor: id=92, shape=(3, 2), dtype=int32, numpy=
array([[1, 2],
       [3, 4],
       [5, 6]], dtype=int32)>

1.5.3 维度增加

tf.expand_dims(input,axis,name=None)：

l input：输入张量；
l axis：在第 axis 维度后增加一个维度。在输入 D 尺寸的情况下，轴必须在[-(D + 1),D]（含）范围内。负数代表倒序。

代码：

# 生成一个大小为 100*100*3 的张量来表示一张尺寸为 100*100 的三通道彩色图片
expand_sample_1 = tf.random.normal([100, 100, 3], seed=1)
print("原始数据尺寸：", expand_sample_1.shape)
print("在第一个维度前增加一个维度(axis=0)：", tf.expand_dims(expand_sample_1, axis=0).shape)
print("在第二个维度前增加一个维度(axis=1)：", tf.expand_dims(expand_sample_1, axis=1).shape)
print("在最后一个维度后增加一个维度(axis=-1)：", tf.expand_dims(expand_sample_1, axis=-1).shape)

输出：
原始数据尺寸： (100, 100, 3)
在第一个维度前增加一个维度(axis=0)： (1, 100, 100, 3)
在第二个维度前增加一个维度(axis=1)： (100, 1, 100, 3)
在最后一个维度后增加一个维度(axis=-1)： (100, 100, 3, 1)

1.5.4 维度减少

tf.squeeze(input,axis=None,name=None)：

l input：输入张量；
l axis：axis=1，表示要删掉的为 1 的维度。

代码：

# 生成一个大小为 100*100*3 的张量来表示一张尺寸为 100*100 的三通道彩色图片
squeeze_sample_1 = tf.random.normal([1, 100, 100, 3])
print("原始数据尺寸：", squeeze_sample_1.shape)
squeezed_sample_1 = tf.squeeze(expand_sample_1)
print("维度压缩后的数据尺寸：", squeezed_sample_1.shape)

输出：
原始数据尺寸： (1, 100, 100, 3)
维度压缩后的数据尺寸： (100, 100, 3)

1.5.5 转置

tf.transpose(a,perm=None,conjugate=False,name='transpose')：

l a：输入张量；
l perm：张量的尺寸排列；一般用于高维数组的转置。
l conjugate：表示复数转置；
name：名称。

# 低维的转置问题比较简单，输入需转置张量调用 tf.transpose 
trans_sample_1 = tf.constant([1, 2, 3, 4, 5, 6], shape=[2, 3])
print("原始数据尺寸：", trans_sample_1.shape)
transposed_sample_1 = tf.transpose(trans_sample_1)
print("转置后数据尺寸：", transposed_sample_1.shape)

输出：
原始数据尺寸： (2, 3)
转置后数据尺寸： (3, 2)

代码：

'''
高维数据转置需要用到 perm 参数，perm 代表输入张量的维度排列。
对于一个三维张量来说，其原始的维度排列为[0, 1, 2]（perm）分别代表高维数据的长宽高。通过改变perm
中数值的排列，可以对数据的对应维度进行转置
'''
# 生成一个大小为$*100*200*3 的张量来表示 4 张尺寸为 100*200 的三通道彩色图片
trans_sample_2 = tf.random.normal([4, 100, 200, 3])
print("原始数据尺寸：", trans_sample_2.shape)
# 对 4 张图像的长宽进行对调。原始 perm 为[0,1,2,3]，现变为[0,2,1,3]
transposed_sample_2 = tf.transpose(trans_sample_2, [0, 2, 1, 3])
print("转置后数据尺寸：", transposed_sample_2.shape)

输出：
原始数据尺寸： (4, 100, 200, 3)
转置后数据尺寸： (4, 200, 100, 3)

1.5.6 广播（broadcast_to）

利用把 broadcast_to 可以将小维度推广到大维度。

tf.broadcast_to(input,shape,name=None)：

l input：输入张量；
l shape：输出张量的尺寸。

broadcast_sample_1 = tf.constant([1, 2, 3, 4, 5, 6])
print("原始数据：", broadcast_sample_1.numpy())
broadcasted_sample_1 = tf.broadcast_to(broadcast_sample_1, shape=[4, 6])
print("广播后数据：", broadcasted_sample_1.numpy())

输出：
原始数据： [1 2 3 4 5 6]
广播后数据： [[1 2 3 4 5 6]
 [1 2 3 4 5 6]
 [1 2 3 4 5 6]
 [1 2 3 4 5 6]]

代码：

# 运算时，当两个数组的形状不同时，与 numpyy 一样，TensorFlow 将自动触发广播机制。 
a = tf.constant([[0, 0, 0],
                 [10, 10, 10],
                 [20, 20, 20],
                 [30, 30, 30]])
b = tf.constant([1, 2, 3])
print(a + b)

输出：
tf.Tensor(
[[ 1  2  3]
 [11 12 13]
 [21 22 23]
 [31 32 33]], shape=(4, 3), dtype=int32)

1.6 张量的算术运算

1.6.1 算术运算符

算术运算主要包括了：加(tf.add)、减(tf.subtract)、乘(tf.multiply)、除(tf.divide)、取对数

（tf.math.log）和指数（tf.pow）等。因为调用比较简单，下面只演示一个加法例子。

a = tf.constant([[3, 5], [4, 8]])
b = tf.constant([[1, 6], [2, 9]])
print(tf.add(a, b))

输出：
tf.Tensor(
[[ 4 11]
 [ 6 17]], shape=(2, 2), dtype=int32)

1.6.2 矩阵乘法运算

矩阵乘法运算的实现通过调用 tf.matmul。

代码：

tf.matmul(a, b)

输出：
<tf.Tensor: id=134, shape=(2, 2), dtype=int32, numpy=
array([[13, 63],
       [20, 96]], dtype=int32)>

1.6.3 张量的数据统计

张量的数据统计主要包括：

l tf.reduce_min/max/mean()：求解最小值最大值和均值函数；
l tf.argmax()/tf.argmin()：求最大最小值位置；
l tf.equal()：逐个元素判断两个张量是否相等；
l tf.unique()：除去张量中的重复元素。
l tf.nn.in_top_k(prediction, target, K):用于计算预测值和真是值是否相等，返回一个 bool 类型的张量。

下面演示 tf.argmax()的用法：返回最大值所在的下标

l tf.argmax(input,axis)：
l input：输入张量；
l axis：按照 axis 维度，输出最大值。

代码：

argmax_sample_1 = tf.constant([[1, 3, 2], [2, 5, 8], [7, 5, 9]])
print("输入张量：", argmax_sample_1.numpy())
max_sample_1 = tf.argmax(argmax_sample_1, axis=0)
max_sample_2 = tf.argmax(argmax_sample_1, axis=1)
print("按列寻找最大值的位置：", max_sample_1.numpy())
print("按行寻找最大值的位置：", max_sample_2.numpy())

输出：
输入张量： [[1 3 2]
 [2 5 8]
 [7 5 9]]
按列寻找最大值的位置： [2 1 2]
按行寻找最大值的位置： [1 2 2]

1.7 基于维度的算术操作

TensorFlow 中，tf.reduce_*一系列操作等都造成张量维度的减少。这一系列操作都可以对一个张量在维度上的元素进行操作，如按行求平均，求取张量中所有元素的乘积等。

常用的包括：tf.reduce_sum(加法)、tf.reduce_prod（乘法）、tf.reduce_min（最小）、 tf.reduce_max（最大）、tf.reduce_mean（均值）、tf.reduce_all（逻辑和）、tf.reduce_any

（逻辑或）和 tf.reduce_logsumexp（log(sum(exp)))操作）等。

这些操作的使用方法都相似，下面只演示 tf.reduce_sum 的操作案例。计算一个张量的各个维度上元素的总和

tf.reduce_sum(input_tensor, axis=None, keepdims=False,name=None)：

l input_tensor：输入张量；
l axis：指定需要计算的轴，如果不指定，则计算所有元素的均值;
l keepdims：是否降维度，设置为 True，输出的结果保持输入 tensor 的形状，设置为 False，输出结果会降低维度;
l name：操作名称。

reduce_sample_1 = tf.constant([1, 2, 3, 4, 5, 6], shape=[2, 3])
print("原始数据", reduce_sample_1.numpy())
print("计算张量中所有元素的和（axis=None）：", tf.reduce_sum(reduce_sample_1, axis=None).numpy())
print("按列计算，分别计算各列的和（axis=0）：", tf.reduce_sum(reduce_sample_1, axis=0).numpy())
print("按行计算，分别计算各列的和（axis=1）：", tf.reduce_sum(reduce_sample_1, axis=1).numpy())

输出：
原始数据 [[1 2 3]
 [4 5 6]]
计算张量中所有元素的和（axis=None）： 21
按列计算，分别计算各列的和（axis=0）： [5 7 9]
按行计算，分别计算各列的和（axis=1）： [ 6 15]

1.8 张量的拼接与分割

1.8.1 张量的拼接

TensorFlow 中，张量拼接的操作主要包括：

l tf.contact()：将向量按指定维连起来，其余维度不变。
l tf.stack() ：将一组 R 维张量变为 R+1 维张量，拼接前后维度变化。

tf.concat(values, axis, name='concat')：

l values：输入张量；
l axis：指定拼接维度；
l name：操作名称。

concat_sample_1 = tf.random.normal([4, 100, 100, 3])
concat_sample_2 = tf.random.normal([40, 100, 100, 3])
print("原始数据的尺寸分别为：", concat_sample_1.shape, concat_sample_2.shape)
concated_sample_1 = tf.concat([concat_sample_1, concat_sample_2], axis=0)
print("拼接后数据的尺寸：", concated_sample_1.shape)

输出：
原始数据的尺寸分别为： (4, 100, 100, 3) (40, 100, 100, 3)
拼接后数据的尺寸： (44, 100, 100, 3)

在原来矩阵基础上增加了一个维度，也是同样的道理，axis 决定维度增加的位置。

tf.stack(values, axis=0, name='stack')：

l values：输入张量；一组相同形状和数据类型的张量。
l axis：指定拼接维度；
l name：操作名称。

stack_sample_1 = tf.random.normal([100, 100, 3])
stack_sample_2 = tf.random.normal([100, 100, 3])
print("原始数据的尺寸分别为：", stack_sample_1.shape, stack_sample_2.shape)
# 拼接后维度增加。axis=0，则在第一个维度前增加维度。
stacked_sample_1 = tf.stack([stack_sample_1, stack_sample_2], axis=0)
print("拼接后数据的尺寸：", stacked_sample_1.shape)

输出：
原始数据的尺寸分别为： (100, 100, 3) (100, 100, 3)
拼接后数据的尺寸： (2, 100, 100, 3)

1.8.2 张量的分割

TensorFlow 中，张量分割的操作主要包括：

l tf.unstack()：将张量按照特定维度分解。
l tf.split()：将张量按照特定维度划分为指定的分数。

与 tf.unstack()相比，tf.split()更佳灵活。

tf.unstack(value,num=None,axis=0,name='unstack')：

l value：输入张量；
l num：表示输出含有 num 个元素的列表，num 必须和指定维度内元素的个数相等。通常可以忽略不写这个参数。
l axis：指明根据数据的哪个维度进行分割；
l name：操作名称。

# 按照第一个维度对数据进行分解，分解后的数据以列表形式输出。
tf.unstack(stacked_sample_1, axis=0)

输出：
[<tf.Tensor: id=176, shape=(100, 100, 3), dtype=float32, numpy=
 array([[[-0.6100131 ,  1.1552308 ,  1.9557871 ],
         [ 0.7781739 , -0.97797275,  1.1395042 ],
         [ 1.487099  , -2.3994513 ,  0.6791377 ],
         ...,
         [ 0.00845545, -0.7138963 , -0.40552953],
         [-0.38446733,  0.01316335, -0.6392299 ],
         [-0.523189  , -1.0822618 , -0.7537402 ]],

tf.split(value, num_or_size_splits, axis=0)：

l value：输入张量；
l num_or_size_splits：准备切成几份
l axis：指明根据数据的哪个维度进行分割。

如果 num_or_size_splits 传入的是一个整数，那直接在 axis=D 这个维度上把张量平均切分成几个小张量。
如果 num_or_size_splits 传入的是一个向量，则在 axis=D 这个维度上把张量按照向量的元素值切分成几个小张量。

import numpy as np

split_sample_1 = tf.random.normal([10, 100, 100, 3])
print("原始数据的尺寸为：", split_sample_1.shape)
splited_sample_1 = tf.split(split_sample_1, num_or_size_splits=5, axis=0)
print("当m_or_size_splits=10，分割后数据的尺寸为：", np.shape(splited_sample_1))
splited_sample_2 = tf.split(split_sample_1, num_or_size_splits=[3, 5, 2], axis=0)
print("当num_or_size_splits=[3,5,2]，分割后数据的尺寸分别为：",
      np.shape(splited_sample_2[0]), np.shape(splited_sample_2[1]), np.shape(splited_sample_2[2]))
      
*输出：
原始数据的尺寸为： (10, 100, 100, 3)
当 m_or_size_splits=10，分割后数据的尺寸为： (5, 2, 100, 100, 3)
当 num_or_size_splits=[3,5,2]，分割后数据的尺寸分别为： (3, 100, 100, 3) (5, 100, 100, 3) (2, 100, 100, 3)

1.9 张量排序

TensorFlow 中，张量排序的操作主要包括：

l tf.sort()：按照升序或者降序对张量进行排序，返回排序后的张量。
l tf.argsort()：按照升序或者降序对张量进行排序,但返回的是索引。
l tf.nn.top_k()：返回前 k 个最大值。 tf.sort/argsort(input, direction, axis)：
l input：输入张量；
l direction：排列顺序，可为 DESCENDING 降序或者 ASCENDING（升序）。默认为 ASCENDING（升序）；
l axis：按照 axis 维度进行排序。默认 axis=-1 最后一个维度。

代码：

sort_sample_1 = tf.random.shuffle(tf.range(10))
print("输入张量：", sort_sample_1.numpy())
sorted_sample_1 = tf.sort(sort_sample_1, direction="ASCENDING")
print("生序排列后的张量：", sorted_sample_1.numpy())
sorted_sample_2 = tf.argsort(sort_sample_1, direction="ASCENDING")
print("生序排列后，元素的索引：", sorted_sample_2.numpy())

输出：
输入张量： [4 3 5 0 6 2 8 1 7 9]
生序排列后的张量： [0 1 2 3 4 5 6 7 8 9]
生序排列后，元素的索引： [3 7 5 1 0 2 4 8 6 9]

tf.nn.top_k(input,K,sorted=TRUE):

l input：输入张量；
l K：需要输出的前 k 个值及其索引。
l sorted： sorted=TRUE 表示升序排列；sorted=FALSE 表示降序排列。

返回两个张量：

l values：也就是每一行的最大的 k 个数字
l indices：这里的下标是在输入的张量的最后一个维度的下标

values, index = tf.nn.top_k(sort_sample_1, 5)
print("输入张量：", sort_sample_1.numpy())
print("升序排列后的前 5 个数值：", values.numpy())
print("升序排列后的前 5 个数值的索引：", index.numpy())

输出：
输入张量： [4 3 5 0 6 2 8 1 7 9]
升序排列后的前 5 个数值： [9 8 7 6 5]
升序排列后的前 5 个数值的索引： [9 6 8 4 2]

1.10 TensorFlow2 Eager Execution 模式

Eager Execution 介绍：

TensorFlow 的 Eager Execution 模式是一种命令式编程（imperative programming），这和原生 Python 是一致的，当你执行某个操作时，可以立即返回结果的。

Graph 模式介绍：

TensorFlow1.0 一直是采用 Graph 模式，即先构建一个计算图，然后需要开启 Session，喂进实际的数据才真正执行得到结果。

Eager Execution 模式下，我们可以更容易 debug 代码，但是代码的执行效率更低。

下面我们在 Eager Execution 和 Graph 模式下，用 TensorFlow 实现简单的乘法，来对比两个模式的区别。

x = tf.ones((2, 2), dtype=tf.dtypes.float32)
y = tf.constant([[1, 2],
                 [3, 4]], dtype=tf.dtypes.float32)
z = tf.matmul(x, y)
print(z)

输出：
tf.Tensor(
[[4. 6.]
 [4. 6.]], shape=(2, 2), dtype=float32)

# 在 TensorFlow 2 版本中使用 1.X 版本的语法；可以使用 2.0 中的 v1 兼容包来沿用 1.x 代码，并在代码中关闭 eager运算。
import tensorflow.compat.v1 as tf

tf.disable_eager_execution()
# 创建graph，定义计算图
a = tf.ones((2, 2), dtype=tf.dtypes.float32)
b = tf.constant([[1, 2],
                 [3, 4]], dtype=tf.dtypes.float32)
c = tf.matmul(a, b)
# 开启绘画，进行运算后，才能取出数据。
with tf.Session() as sess:
    print(sess.run(c))
    
输出：
[[4. 6.]
 [4. 6.]]

首先重启一下 kernel，使得 TensorFlow 恢复到 2.0 版本并打开 eager execution 模式。 Eager Execution 模式的另一个优点是可以使用 Python 原生功能，比如下面的条件判断：

import tensorflow as tf
import numpy as np

thre_1 = tf.random.uniform([], 0, 1)
x = tf.reshape(tf.range(0, 4), [2, 2])
print(thre_1)
if thre_1.numpy() > 0.5:
    y = tf.matmul(x, x)
else:
    y = tf.add(x, x)

输出：
tf.Tensor(0.8043928, shape=(), dtype=float32)

这种动态控制流主要得益于 eager 执行得到 Tensor 可以取出 numpy 值，这避免了使用 Graph 模式下的 tf.cond 和 tf.while 等算子。

1.11 TensorFlow2 AutoGraph

当使用 tf.function 装饰器注释函数时，可以像调用任何其他函数一样调用它。它将被编译成图，这意味着可以获得更高效地在在 GPU 或 TPU 上运行。此时函数变成了一个 TensorFlow 中的 operation。我们可以直接调用函数，输出返回值，但是函数内部是在 graph 模式下执行的，无法直接查看中间变量数值

@tf.function
def simple_nn_layer(w, x, b):
    print(b)

    return tf.nn.relu(tf.matmul(w, x) + b)


w = tf.random.uniform((3, 3))
x = tf.random.uniform((3, 3))
b = tf.constant(0.5, dtype='float32')

simple_nn_layer(w, x, b)


输出：
Tensor("b:0", shape=(), dtype=float32)
<tf.Tensor: id=40, shape=(3, 3), dtype=float32, numpy=
array([[0.5868423, 0.6898268, 0.8843413],
       [0.8371662, 0.847257 , 1.1481965],
       [1.017222 , 1.1640502, 1.46533  ]], dtype=float32)>

通过输出结果可知，无法直接查看函数内部 b 的数值，而返回值可以通过.numpy()查看。通过相同的操作（执行一层 lstm 计算），比较 graph 和 eager execution 模式的性能。

# timeit 测量小段代码的执行时间 
import timeit

# 创建一个卷积层。
CNN_cell = tf.keras.layers.Conv2D(filters=100, kernel_size=2, strides=(1, 1))


# 利用@tf.function，将操作转化为 graph。 @tf.function
def CNN_fn(image):
    return CNN_cell(image)


image = tf.zeros([100, 200, 200, 3])

# 比较两者的执行时间CNN_cell(image) CNN_fn(image)
# 调用timeit.timeit，测量代码执行 10 次的时间
print("eager execution 模式下做一层 CNN 卷积层运算的时间:", timeit.timeit(lambda: CNN_cell(image), number=10))
print("graph 模式下做一层 CNN 卷积层运算的时间:", timeit.timeit(lambda: CNN_fn(image), number=10))


输出：
eager execution 模式下做一层 CNN 卷积层运算的时间: 53.275061096
graph 模式下做一层 CNN 卷积层运算的时间: 47.896033531

通过比较，我们可以发现 graph 模式下代码执行效率要高出许多。因此我们以后，可以多尝试用@tf.function 功能，提高代码运行效率。

2. TensorFlow 2 常用模块介绍

本节将为大家介绍 TensorFlow 2 常用模块，主要包括：

l tf.data：实现对数据集的操作；

包括读取从内存中直接读取数据集、读取 CSV 文件、读取 tfrecord 文件和数据增强等。
l tf.image：实现对图像处理的操作；

包括图像亮度变换、饱和度变换、图像尺寸变换、图像旋转和边缘检测等操作。
l tf.gfile：实现对文件的操作；

包括对文件的读写操作、文件重命名和文件夹操作等。
l tf.keras：用于构建和训练深度学习模型的高阶 API；
l tf.distributions 等等。

2.1 模型构建

2.1.1 模型堆叠（tf.keras.Sequential）

最常见的模型构建方法是层的堆叠，我们通常会使用 tf.keras.Sequential。

代码：

import tensorflow.keras.layers as layers
import tensorflow as tf

model = tf.keras.Sequential()
model.add(layers.Dense(32, activation='relu'))
model.add(layers.Dense(32, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

2.1.2 函数式模型构建

函数式模型主要利用 tf.keras.Input 和 tf.keras.Model 构建，比 tf.keras.Sequential 模型要复杂，但是效果很好，可以同时/分阶段输入变量，分阶段输出数据；你的模型需要多于一个的输出，那么需要选择函数式模型。

模型堆叠（.Sequential）vs 函数式模型（Model）：

tf.keras.Sequential 模型是层的简单堆叠，无法表示任意模型。使用 Keras 的函数式模型可以构建复杂的模型拓扑，例如：

l 多输入模型；
l 多输出模型；
l 具有共享层的模型；
l 具有非序列数据流的模型（例如，残差连接）。

# 以上一层的输出作为下一层的输入
x = tf.keras.Input(shape=(32,))
h1 = layers.Dense(32, activation='relu')(x)
h2 = layers.Dense(32, activation='relu')(h1)
y = layers.Dense(10, activation='softmax')(h2)
model_sample_2 = tf.keras.models.Model(x, y)

# 打印模型信息
model_sample_2.summary()

输出：
Model: "model"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
input_1 (InputLayer)         [(None, 32)]              0         
_________________________________________________________________
dense_3 (Dense)              (None, 32)                1056      
_________________________________________________________________
dense_4 (Dense)              (None, 32)                1056      
_________________________________________________________________
dense_5 (Dense)              (None, 10)                330       
=================================================================
Total params: 2,442
Trainable params: 2,442
Non-trainable params: 0
_________________________________________________________________

2.1.3 网络层构建（tf.keras.layers）

tf.keras.layers 模块的主要作用为配置神经网络层。其中常用的类包括：

l tf.keras.layers.Dense：构建全连接层；
l tf.keras.layers.Conv2D：构建 2 维卷积层；
l tf.keras.layers.MaxPooling2D/AveragePooling2D：构建最大/平均池化层；
l tf.keras.layers.RNN：构建循环神经网络层；
l tf.keras.layers.LSTM/tf.keras.layers.LSTMCell：构建 LSTM 网络层/LSTM unit；
l tf.keras.layers.GRU/tf.keras.layers.GRUCell：构建 GRU unit/GRU 网络层；
l tf.keras.layers.Embedding 嵌入层将正整数（下标）转换为具有固定大小的向量，如 [[4],[20]]->[[0.25,0.1],[0.6,-0.2]]。Embedding 层只能作为模型的第一层；
l tf.keras.layers.Dropout：构建 dropout 层等。

下面主要讲解 tf.keras.layers.Dense、 tf.keras.layers.Conv2D、 tf.keras.layers.MaxPooling2D/AveragePooling2D 和 tf.keras.layers.LSTM/tf.keras.layers.LSTMCell。

tf.keras.layers 中主要的网络配置参数如下：

l activation：设置层的激活函数。默认情况下，系统不会应用任何激活函数。
l kernel_initializer 和 bias_initializer：创建层权重（核和偏置）的初始化方案。默认为 “Glorot uniform” 初始化器。
l kernel_regularizer 和 bias_regularizer：应用层权重（核和偏置）的正则化方案，例如 L1 或 L2 正则化。默认情况下，系统不会应用正则化函数。

2.3.1.1.1 tf.keras.layers.Dense

tf.keras.layers.Dense 可配置的参数，主要有：

l units: 神经元个数；
l activation: 激活函数；
l use_bias: 是否使用偏置项。默认为使用；
l kernel_initializer: 创建层权重核的初始化方案；
l bias_initializer: 创建层权重偏置的初始化方案；
l kernel_regularizer: 应用层权重核的正则化方案；
l bias_regularizer: 应用层权重偏置的正则化方案；
l activity_regularizer：施加在输出上的正则项，为 Regularizer 对象；
l kernel_constraint: 施加在权重上的约束项；
l bias_constraint: 施加在权重上的约束项。

# 创建包含 32 个神经元的全连接层，其中的激活函数设置为 sigmoid。
# activation 参数可以是函数名称字符串，如'sigmoid'；也可以是函数对象，如 tf.sigmoid。 
layers.Dense(32, activation='sigmoid')
layers.Dense(32, activation=tf.sigmoid)

# 设置kernel_initializer 参数
layers.Dense(32, kernel_initializer=tf.keras.initializers.he_normal)
# 设置kernel_regularizer 为L2 正则
layers.Dense(32, kernel_regularizer=tf.keras.regularizers.l2(0.01))

输出：
<tensorflow.python.keras.layers.core.Dense at 0x7fd1299c51d0>

2.3.1.1.1 tf.keras.layers.Conv2D

tf.keras.layers.Conv2D 可配置的参数，主要有：

l filters：卷积核的数目（即输出的维度）；
l kernel_size：卷积核的宽度和长度；
l strides：卷积的步长。
l padding：补 0 策略。

padding=“valid”代表只进行有效的卷积，即对边界数据不处理。padding=“same”代表保留边界处的卷积结果，通常会导致输出 shape 与输入 shape 相同；
l activation：激活函数；
l data_format：数据格式，为“channels_first”或“channels_last”之一。以 128x128 的 RGB 图像为例，“channels_first”应将数据组织为（3,128,128），而“channels_last”应将数据组织为（128,128,3）。该参数的默认值是~/.keras/keras.json 中设置的值，若从未设置过，则为 “channels_last”。
l 其他参数还包括：use_bias；kernel_initializer；bias_initializer；kernel_regularizer； bias_regularizer；activity_regularizer；kernel_constraints；bias_constraints。

layers.Conv2D(64, [1, 1], 2, padding='same', activation="relu")

输出：
<tensorflow.python.keras.layers.convolutional.Conv2D at 0x7fd12991b410>

2.3.1.1.1 tf.keras.layers.MaxPooling2D/AveragePooling2D

tf.keras.layers.MaxPooling2D/AveragePooling2D 可配置的参数，主要有：

l pool_size：池化 kernel 的大小。如取矩阵（2，2）将使图片在两个维度上均变为原长的一半。为整数意为各个维度值都为该数字。
l strides：步长值。
l 其他参数还包括：padding；data_format。

layers.MaxPooling2D(pool_size=(2, 2), strides=(2, 1))

输出：
<tensorflow.python.keras.layers.pooling.MaxPooling2D at 0x7fd1299d7ed0>

2.3.1.1.1 tf.keras.layers.LSTM/tf.keras.layers.LSTMCell

tf.keras.layers.LSTM/tf.keras.layers.LSTMCell 可配置的参数，主要有：

l units：输出维度；
l input_shape (timestep, input_dim),timestep 可以设置为 None,input_dim 为输入数据维度；
l activation：激活函数；
l recurrent_activation: 为循环步施加的激活函数；
l return_sequences：=True 时，返回全部序列；=False 时，返回输出序列中的最后一个 cell 的输出；
l return_state: 布尔值。除了输出之外是否返回最后一个状态；
l dropout：0~1 之间的浮点数，控制输入线性变换的神经元断开比例；
l recurrent_dropout：0~1 之间的浮点数，控制循环状态的线性变换的神经元断开比例。

import numpy as np

inputs = tf.keras.Input(shape=(3, 1))
lstm = layers.LSTM(1, return_sequences=True)(inputs)
model_lstm_1 = tf.keras.models.Model(inputs=inputs, outputs=lstm)

inputs = tf.keras.Input(shape=(3, 1))
lstm = layers.LSTM(1, return_sequences=False)(inputs)
model_lstm_2 = tf.keras.models.Model(inputs=inputs, outputs=lstm)

# t1, t2, t3 序列
data = [[[0.1],
         [0.2],
         [0.3]]]
print(data)
print("当 return_sequences=True 时的输出", model_lstm_1.predict(data))
print("当 return_sequences=False 时的输出", model_lstm_2.predict(data))

**输出：
[[[0.1], [0.2], [0.3]]]
当 return_sequences=True 时的输出 [[[-0.0106758 ] [-0.02711176]
[-0.04583194]]]
当 return_sequences=False 时的输出 [[0.05914127]]

LSTMcell 是 LSTM 层的实现单元。

l LSTM 是一个 LSTM 网络层
l LSTMCell 是一个单步的计算单元，即一个 LSTM UNIT。

# LSTM
tf.keras.layers.LSTM(16, return_sequences=True)

# LSTMCell
x = tf.keras.Input((None, 3))
y = layers.RNN(layers.LSTMCell(16))(x)
model_lstm_3 = tf.keras.Model(x, y)

2.2 训练与评估

2.2.1 模型编译，确定训练流程。

构建好模型后，通过调用 compile 配置该模型的学习流程：

l compile( optimizer=‘rmsprop’, loss=None, metrics=None, loss_weights=None):
l optimizer：优化器；
l loss：损失函数，对于二分类任务就是交叉熵，回归任务就是 mse 之类的；
l metrics：在训练和测试期间的模型评估标准。比如 metrics = [‘accuracy’]。指定不同的评估标准，需要传递一个字典，如 metrics = {‘output_a’：‘accuracy’}。
l loss_weights: 如果的模型有多个任务输出，在优化全局 loss 的时候，需要给每个输出指定相应的权重。

model = tf.keras.Sequential()
model.add(layers.Dense(10, activation='softmax'))
# 确定优化器（optimizer）、损失函数（loss）、模型评估方法（metrics）
model.compile(optimizer=tf.keras.optimizers.Adam(0.001),
              loss=tf.keras.losses.categorical_crossentropy, metrics=[tf.keras.metrics.categorical_accuracy])

2.2.2 模型训练

fit(x=None, y=None, batch_size=None, epochs=1, verbose=1, callbacks=None, validation_split=0.0, validation_data=None, shuffle=True, class_weight=None, sample_weight=None, initial_epoch=0, steps_per_epoch=None, validation_steps=None):

l x: 输入训练数据；
l y: 目标（标签）数据；
l batch_size: 每次梯度更新的样本数。如果未指定，默认为 32；
l epochs：训练模型迭代轮次；
l verbose：0, 1 或 2。日志显示模式。 0 = 不显示, 1 = 进度条, 2 = 每轮显示一行；
l callbacks：在训练时使用的回调函数；
l validation_split：验证集与训练数据的比例；
l validation_data：验证集；这个参数会覆盖 validation_split；
l shuffle：是否在每轮迭代之前混洗数据。当 steps_per_epoch 非 None 时，这个参数无效；
l initial_epoch: 开始训练的轮次，常用于恢复之前的训练权重；
l steps_per_epoch：steps_per_epoch = 数据集大小/batch_size；
l validation_steps：只有在指定了 steps_per_epoch 时才有用。停止前要验证的总步数（批次样本）。

import numpy as np

train_x = np.random.random((1000, 36))
train_y = np.random.random((1000, 10))

val_x = np.random.random((200, 36))
val_y = np.random.random((200, 10))

model.fit(train_x, train_y, epochs=10, batch_size=100, validation_data=(val_x, val_y))

输出：
Train on 1000 samples, validate on 200 samples
Epoch 1/10
1000/1000 [==============================] - 1s 969us/sample - loss: 12.6233 - categorical_accuracy: 0.1030 - val_loss: 12.8527 - val_categorical_accuracy: 0.1050
Epoch 2/10
1000/1000 [==============================] - 0s 108us/sample - loss: 12.6198 - categorical_accuracy: 0.1030 - val_loss: 12.8505 - val_categorical_accuracy: 0.1050
Epoch 3/10
1000/1000 [==============================] - 0s 91us/sample - loss: 12.6178 - categorical_accuracy: 0.1030 - val_loss: 12.8481 - val_categorical_accuracy: 0.1050
Epoch 4/10
1000/1000 [==============================] - 0s 85us/sample - loss: 12.6146 - categorical_accuracy: 0.1030 - val_loss: 12.8449 - val_categorical_accuracy: 0.1050
Epoch 5/10
1000/1000 [==============================] - 0s 87us/sample - loss: 12.6109 - categorical_accuracy: 0.1030 - val_loss: 12.8407 - val_categorical_accuracy: 0.1050
Epoch 6/10
1000/1000 [==============================] - 0s 376us/sample - loss: 12.6105 - categorical_accuracy: 0.1030 - val_loss: 12.8426 - val_categorical_accuracy: 0.1050
Epoch 7/10
1000/1000 [==============================] - 0s 93us/sample - loss: 12.6102 - categorical_accuracy: 0.1030 - val_loss: 12.8418 - val_categorical_accuracy: 0.1050
Epoch 8/10
1000/1000 [==============================] - 0s 81us/sample - loss: 12.6101 - categorical_accuracy: 0.1030 - val_loss: 12.8417 - val_categorical_accuracy: 0.1050
Epoch 9/10
1000/1000 [==============================] - 0s 84us/sample - loss: 12.6093 - categorical_accuracy: 0.1030 - val_loss: 12.8402 - val_categorical_accuracy: 0.1050
Epoch 10/10
1000/1000 [==============================] - 0s 87us/sample - loss: 12.6074 - categorical_accuracy: 0.1030 - val_loss: 12.8387 - val_categorical_accuracy: 0.1050
<tensorflow.python.keras.callbacks.History at 0x7ff6013f2750>

对于大型数据集可以使用 tf.data 构建训练输入。

dataset = tf.data.Dataset.from_tensor_slices((train_x, train_y))
dataset = dataset.batch(32)
dataset = dataset.repeat()
val_dataset = tf.data.Dataset.from_tensor_slices((val_x, val_y))
val_dataset = val_dataset.batch(32)
val_dataset = val_dataset.repeat()

model.fit(dataset, epochs=10, steps_per_epoch=30, validation_data=val_dataset, validation_steps=3)

输出：
Train for 30 steps, validate for 3 steps
Epoch 1/10
30/30 [==============================] - 1s 20ms/step - loss: 12.5710 - categorical_accuracy: 0.1031 - val_loss: 12.6103 - val_categorical_accuracy: 0.0938
Epoch 2/10
30/30 [==============================] - 0s 4ms/step - loss: 12.6300 - categorical_accuracy: 0.1026 - val_loss: 12.6063 - val_categorical_accuracy: 0.0938
Epoch 3/10
30/30 [==============================] - 0s 3ms/step - loss: 12.5923 - categorical_accuracy: 0.0972 - val_loss: 12.5991 - val_categorical_accuracy: 0.0938
Epoch 4/10
30/30 [==============================] - 0s 3ms/step - loss: 12.5959 - categorical_accuracy: 0.1015 - val_loss: 12.5924 - val_categorical_accuracy: 0.0938
Epoch 5/10
30/30 [==============================] - 0s 3ms/step - loss: 12.5987 - categorical_accuracy: 0.1015 - val_loss: 12.5859 - val_categorical_accuracy: 0.0938
Epoch 6/10
30/30 [==============================] - 0s 4ms/step - loss: 12.5951 - categorical_accuracy: 0.1015 - val_loss: 12.5804 - val_categorical_accuracy: 0.0938
Epoch 7/10
30/30 [==============================] - 0s 3ms/step - loss: 12.5632 - categorical_accuracy: 0.1015 - val_loss: 12.5750 - val_categorical_accuracy: 0.0938
Epoch 8/10
30/30 [==============================] - 0s 4ms/step - loss: 12.5913 - categorical_accuracy: 0.1036 - val_loss: 12.5709 - val_categorical_accuracy: 0.0938
Epoch 9/10
30/30 [==============================] - 0s 4ms/step - loss: 12.5877 - categorical_accuracy: 0.1047 - val_loss: 12.5667 - val_categorical_accuracy: 0.0938
Epoch 10/10
30/30 [==============================] - 0s 3ms/step - loss: 12.6003 - categorical_accuracy: 0.1036 - val_loss: 12.5641 - val_categorical_accuracy: 0.0938
<tensorflow.python.keras.callbacks.History at 0x7ff60196a490>

2.2.3 回调函数

回调函数是传递给模型以自定义和扩展其在训练期间的行为的对象。我们可以编写自己的自定义回调，或使用tf.keras.callbacks 中的内置函数，常用内置回调函数如下：

tf.keras.callbacks.ModelCheckpoint：定期保存模型。
tf.keras.callbacks.LearningRateScheduler：动态更改学习率。
tf.keras.callbacks.EarlyStopping：提前终止。
tf.keras.callbacks.TensorBoard：使用 TensorBoard。

# 超参数设置
Epochs = 10


# 定义一个学习率动态设置函数
def lr_Scheduler(epoch):
    if epoch > 0.9 * Epochs:
        lr = 0.0001
    elif epoch > 0.5 * Epochs:
        lr = 0.001
    elif epoch > 0.25 * Epochs:
        lr = 0.01
    else:
        lr = 0.1

    print(lr)
    return lr


callbacks = [
    # 早 停 ：
    tf.keras.callbacks.EarlyStopping(
        # 不再提升的关注指标
        monitor='val_loss',
        # 不再提升的阈值
        min_delta=1e-2,
        # 不再提升的轮次
        patience=2),

    # 定 期 保 存 模 型 ：
    tf.keras.callbacks.ModelCheckpoint(
        # 模型路径
        filepath='testmodel_{epoch}.h5',
        # 是否保存最佳模型
        save_best_only=True,
        # 监控指标
        monitor='val_loss'),

    # 动态更改学习率
    tf.keras.callbacks.LearningRateScheduler(lr_Scheduler),

    # 使用 TensorBoard
    tf.keras.callbacks.TensorBoard(log_dir='./logs')]
model.fit(train_x, train_y, batch_size=16, epochs=Epochs,
          callbacks=callbacks, validation_data = (val_x, val_y))

输出：
Train on 1000 samples, validate on 200 samples
0.1
Epoch 1/10
1000/1000 [==============================] - 0s 334us/sample - loss: 12.6352 - categorical_accuracy: 0.1080 - val_loss: 12.1066 - val_categorical_accuracy: 0.1150
0.1
Epoch 2/10
1000/1000 [==============================] - 0s 234us/sample - loss: 12.6656 - categorical_accuracy: 0.0820 - val_loss: 12.2066 - val_categorical_accuracy: 0.0950
0.1
Epoch 3/10
1000/1000 [==============================] - 0s 215us/sample - loss: 12.5260 - categorical_accuracy: 0.0920 - val_loss: 12.1053 - val_categorical_accuracy: 0.1100
<tensorflow.python.keras.callbacks.History at 0x7f7fe15e2690>

2.2.4 评估与预测

评估和预测函数：tf.keras.Model.evaluate 和 tf.keras.Model.predict 方法。

# 模型评估
test_x = np.random.random((1000, 36))
test_y = np.random.random((1000, 10))
model.evaluate(test_x, test_y, batch_size=32)

输出：
1000/1000 [==============================] - 0s 45us/sample - loss: 12.2881 -
categorical_accuracy: 0.0770
[12.288104843139648, 0.077]


# 模型预测
pre_x = np.random.random((10, 36))
result = model.predict(test_x, )
print(result)

输出：
[[0.0460458  0.08133552 0.27336136 ... 0.05372529 0.15784709 0.06589693]
 [0.07072002 0.07391042 0.2307739  ... 0.06366149 0.08080809 0.12174617]
 [0.07114598 0.07659262 0.31846598 ... 0.03336082 0.05275346 0.05002784]
 ...
 [0.03928034 0.07010722 0.46011814 ... 0.03338903 0.04595451 0.07160679]
 [0.04240561 0.04399079 0.4240673  ... 0.04155495 0.0740051  0.06719721]
 [0.05728028 0.03738481 0.3684643  ... 0.05326979 0.09295851 0.09666349]]

2.3 模型保存与恢复

2.3.1 保存和恢复整个模型

代码：

import numpy as np  # 模型保存

model.save('model/the_save_model.h5')
# 导入模型
new_model = tf.keras.models.load_model('model/the_save_model.h5')
new_prediction = new_model.predict(test_x)
# np.testing.assert_allclose: 判断两个对象的近似程度是否超出了指定的容差限。若是，则抛出异常。:
# atol:指定的容差限
np.testing.assert_allclose(result, new_prediction, atol=1e-6)  # 预测结果一样

模型保存后可以在对应的文件夹中找到对应的权重文件。

2.3.2 只保存和加载网络权重

若权重名后有.h5 或.keras 后缀，则保存为 HDF5 格式文件，否则默认为 TensorFlow Checkpoint格式文件。

代码：

model.save_weights('model/model_weights')
model.save_weights('model/model_weights.h5')
# 权重加载
model.load_weights('model/model_weights')
model.load_weights('model/model_weights.h5')

3. 利用 TensorFlow 进行手写数字识别

手写数字识别是常见的图像识别任务，计算机通过手写体图片来识别图片中的字，与印刷字体不同的是，不同人的手写体风格迥异，大小不一，造成了计算机对手写识别任务的困难，此项目通过应用深度学习和 tensorflow 工具对 MNIST 手写数据集进行训练并建模。

读取 mnist 手写数字数据集；
利用简单数学模型入门 tensorflow；
高级 API 实现 softmax 回归；
构建多层卷积网络 CNN；
高级 API 实现卷积网络 CNN；
预测结果可视化；

3.1 数据集介绍

1). MNIST 数据集来自美国国家标准与技术研究所（National Institute of Standards and Technology ，简称 NIST)；

2). 该数据集由来自 250 个不同人手写的数字构成，其中 50%是高中学生，50%来自人口普查局的工组人员；

3). 数据集可在 http://yann.lecun.com/exdb/mnist/ 获取, 它包含了四个部分:

- Training set images: train-images-idx3-ubyte.gz (9.9 MB, 解压后 47 MB, 包含 60,000 个样本)

- Training set labels: train-labels-idx1-ubyte.gz (29 KB, 解压后 60 KB, 包含 60,000 个标签)

- Test set images: t10k-images-idx3-ubyte.gz (1.6 MB, 解压后 7.8 MB, 包含 10,000个样本)

- Test set labels: t10k-labels-idx1-ubyte.gz (5KB, 解压后 10 KB, 包含 10,000 个标签) 4). mnist 是一个入门级的计算机视觉数据集，它包含各种手写数字图片：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oj84g3QQ-1594520426345)(images/image-20200707142939032.png)]

它也包含每一张图片对应的标签，告诉我们这个是数字几，比如说，上面这四张图片的标签分别是5,0,4,1。

3.1.1 mnist 数据集读取

从 tensorflow 直接读取数据集，联网下载解压；

代码：

import os
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, optimizers, datasets
from matplotlib import pyplot as plt
import numpy as np

# 省略掉一些无关信息的打印
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
# 防止libiomp5.dylib 报错
os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"

(x_train_raw, y_train_raw), (x_test_raw, y_test_raw) = datasets.mnist.load_data()

print(y_train_raw[0])
print(x_train_raw.shape, y_train_raw.shape)
print(x_test_raw.shape, y_test_raw.shape)

# 将分类标签变为 onehot 编码
num_classes = 10
y_train = keras.utils.to_categorical(y_train_raw, num_classes)
y_test = keras.utils.to_categorical(y_test_raw, num_classes)
print(y_train[0])

输出：
5
(60000, 28, 28) (60000,)
(10000, 28, 28) (10000,)
[0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]

在 mnist 数据集中，images 是一个形状为[60000,28,28]的张量，第一个维度数字用来索引图片，第二、三个维度数字用来索引每张图片中的像素点。在此张量里的每一个元素，都表示某张图片里的某个像素的强度值，介于 0,255 之间。

标签数据是"one-hot vectors",一个 one-hot 向量除了某一位数字是 1 之外，其余各维度数字都是 0，如标签 1 可以表示为([0,1,0,0,0,0,0,0,0,0,0]),因此， labels 是一个 [60000, 10] 的数字矩阵。

3.2 数据集预处理及可视化

3.2.1 数据可视化

绘制前 9 张图片

plt.figure()
for i in range(9):
    plt.subplot(3, 3, i + 1)
    plt.imshow(x_train_raw[i])
    # plt.ylabel(y[i].numpy()) 
    plt.axis('off')
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yrz6Fq5r-1594520426347)(images/number.png)]

数据处理，因为我们构建的是全连接网络所以输出应该是向量的形式，而非现在图像的矩阵形式。因此我们需要把图像整理成向量。

# 将 28*28 的图像展开成 784*1 的向量
x_train = x_train_raw.reshape(60000, 784)
x_test = x_test_raw.reshape(10000, 784)

现在像素点的动态范围为 0 到 255。处理图形像素值时，我们通常会把图像像素点归一化到 0 到 1 的范围内。

# 将图像像素值归一化
x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

3.3 DNN 网络构建

3.3.1 DNN 构建网络

# 创建模型。模型包括 3 个全连接层和两个 RELU 激活函数
model = keras.Sequential([
    layers.Dense(512, activation='relu', input_dim=784),
    layers.Dense(256, activation='relu'),
    layers.Dense(124, activation='relu'),
    layers.Dense(num_classes, activation='softmax')])

model.summary()

输出：
Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
dense (Dense)                (None, 512)               401920    
_________________________________________________________________
dense_1 (Dense)              (None, 256)               131328    
_________________________________________________________________
dense_2 (Dense)              (None, 124)               31868     
_________________________________________________________________
dense_3 (Dense)              (None, 10)                1250      
=================================================================
Total params: 566,366
Trainable params: 566,366
Non-trainable params: 0

其中 layer.Dense()表示全连接层，activation 参数表示使用的激活函数。

3.3.2 编译 DNN 模型

Optimizer = optimizers.Adam(0.001)
model.compile(loss=keras.losses.categorical_crossentropy,
              optimizer=Optimizer, metrics=['accuracy'])

以上定义了模型的损失函数为“交叉熵”，优化算法为“Adam”梯度下降方法。

3.3.3 DNN 模型训练

# 使用 fit 方法使模型对训练数据拟合
model.fit(x_train, y_train,
          batch_size=128, epochs=10, verbose=1)
          
输出：
Train on 60000 samples
Epoch 1/10
60000/60000 [==============================] - 8s 132us/sample - loss: 0.2395 - accuracy: 0.9289
Epoch 2/10
60000/60000 [==============================] - 9s 155us/sample - loss: 0.0855 - accuracy: 0.9736
Epoch 3/10
60000/60000 [==============================] - 9s 149us/sample - loss: 0.0564 - accuracy: 0.9820
Epoch 4/10
60000/60000 [==============================] - 8s 129us/sample - loss: 0.0402 - accuracy: 0.9872
Epoch 5/10
60000/60000 [==============================] - 9s 142us/sample - loss: 0.0324 - accuracy: 0.9888
Epoch 6/10
60000/60000 [==============================] - 8s 138us/sample - loss: 0.0263 - accuracy: 0.9911
Epoch 7/10
60000/60000 [==============================] - 7s 120us/sample - loss: 0.0175 - accuracy: 0.9944
Epoch 8/10
60000/60000 [==============================] - 7s 121us/sample - loss: 0.0183 - accuracy: 0.9942
Epoch 9/10
60000/60000 [==============================] - 9s 153us/sample - loss: 0.0174 - accuracy: 0.9942
Epoch 10/10
60000/60000 [==============================] - 7s 120us/sample - loss: 0.0161 - accuracy: 0.9944

其中 epoch 表示批次，表示将全量的数据迭代 10 次。

3.3.4 DNN 模型评估

score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])

输出：
Test loss: 0.08009832046656702
Test accuracy: 0.9811

经过评估，模型准确率为 0.87，迭代了 10 次训练。

3.3.5 保存模型

model.save('model/final_DNN_model.h5')

3.4 构建 CNN 网络

之前用传统方法构建 CNN 网络，可以更清楚的了解内部的网络结构，但是代码量比较多，所以我们尝试用高级 API 构建网络，以简化构建网络的过程。

3.4.1 CNN 构建网络

代码：

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, optimizers, datasets
import numpy as np
import os

# 省略掉一些无关信息的打印
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
# 防止libiomp5.dylib 报错
os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"

(x_train_raw, y_train_raw), (x_test_raw, y_test_raw) = datasets.mnist.load_data()

# 将分类标签变为 onehot 编码
num_classes = 10
y_train = keras.utils.to_categorical(y_train_raw, num_classes)
y_test = keras.utils.to_categorical(y_test_raw, num_classes)
print(y_train[0])

# 将 28*28 的图像展开成 784*1 的向量
x_train = x_train_raw.reshape(60000, 784)
x_test = x_test_raw.reshape(10000, 784)

# 将图像像素值归一化
x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

model = keras.Sequential()  # 创建网络序列 ## 添加第一层卷积层和池化层
model.add(keras.layers.Conv2D(filters=32, kernel_size=5, strides=(1, 1),
                              padding='same', activation=tf.nn.relu, input_shape=(28, 28, 1)))
model.add(keras.layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding='valid'))
## 添加第二层卷积层和池化层
model.add(keras.layers.Conv2D(filters=64, kernel_size=3, strides=(1, 1), padding='same', activation=tf.nn.relu))
model.add(keras.layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding='valid'))
# 添加dropout 层 以减少过拟合
model.add(keras.layers.Dropout(0.25))
model.add(keras.layers.Flatten())
# 添加两层全连接层
model.add(keras.layers.Dense(units=128, activation=tf.nn.relu))
model.add(keras.layers.Dropout(0.5))
model.add(keras.layers.Dense(units=10, activation=tf.nn.softmax))

以上网络中，我们利用 keras.layers 添加了两个卷积池化层，之后又添加了 dropout 层，防止过拟合，最后添加了两层全连接层。

3.4.2 CNN 网络编译和训练

# 将数据扩充维度，以适应 CNN 模型
X_train = x_train.reshape(60000, 28, 28, 1)
X_test = x_test.reshape(10000, 28, 28, 1)
model.compile(optimizer=tf.optimizers.Adam(), loss="categorical_crossentropy", metrics=['accuracy'])
model.fit(x=X_train, y=y_train, epochs=5, batch_size=128)

输出：
[0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]
Epoch 1/5
469/469 [==============================] - 49s 105ms/step - loss: 0.2675 - accuracy: 0.9175
Epoch 2/5
469/469 [==============================] - 57s 121ms/step - loss: 0.0878 - accuracy: 0.9736
Epoch 3/5
469/469 [==============================] - 55s 117ms/step - loss: 0.0686 - accuracy: 0.9796
Epoch 4/5
469/469 [==============================] - 47s 101ms/step - loss: 0.0552 - accuracy: 0.9839
Epoch 5/5
469/469 [==============================] - 45s 96ms/step - loss: 0.0474 - accuracy: 0.9854

在训练时，网络训练数据只迭代了 5 次，可以再增加网络迭代次数，自行尝试看效果如何。

3.4.3 CNN 模型验证

test_loss, test_acc = model.evaluate(x=X_test, y= datasets.mnist.test.labels)
print("Test Accuracy %.2f" % test_acc)

输出：
313/313 [==============================] - 2s 6ms/step - loss: 0.0235 - accuracy: 0.9925
Test Accuracy 0.99

最终结果也达到了 99%的准确率。

3.4.4 CNN 模型保存

model.save('model/final_DNN_model.h5')

3.5 预测结果可视化

3.5.1 加载 CNN 保存模型

from tensorflow.keras.models import load_model

new_model = load_model('model/final_CNN_model.h5')
new_model.summary()

输出：
Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d (Conv2D)              (None, 28, 28, 32)        832       
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 14, 14, 32)        0         
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 14, 14, 64)        18496     
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 7, 7, 64)          0         
_________________________________________________________________
dropout (Dropout)            (None, 7, 7, 64)          0         
_________________________________________________________________
flatten (Flatten)            (None, 3136)              0         
_________________________________________________________________
dense (Dense)                (None, 128)               401536    
_________________________________________________________________
dropout_1 (Dropout)          (None, 128)               0         
_________________________________________________________________
dense_1 (Dense)              (None, 10)                1290      
=================================================================
Total params: 422,154
Trainable params: 422,154
Non-trainable params: 0
_________________________________________________________________

用将预测结果可视化

# 测试集输出结果可视化
import matplotlib.pyplot as plt
% matplotlib inline


def res_Visual(n):
    final_opt_a = new_model.predict_classes(X_test[0:n])  # 通过模型预测测试集
    fig, ax = plt.subplots(nrows=int(n / 5), ncols=5)
    ax = ax.flatten()
    print('前{}张图片预测结果为：'.format(n))
    for i in range(n):
        print(final_opt_a[i], end=',')
        if int((i + 1) % 5) == 0:
            print('\t')
        # 图片可视化展示
        img = X_test[i].reshape((28, 28))  # 读取每行数据，格式为 Ndarry
        plt.axis("off")
        ax[i].imshow(img, cmap='Greys', interpolation='nearest')  # 可视化
        ax[i].axis("off")
    print('测试集前{}张图片为：'.format(n))


res_Visual(20)

输出：
前20张图片预测结果为：
7,2,1,0,4,	
1,4,9,5,9,	
0,6,9,0,1,	
5,9,7,8,4,	
测试集前20张图片为：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qtaSs7IX-1594520426349)(images/image-20200707183818758.png)]

你可能感兴趣的:(笔记,tensorflow,机器学习,深度学习)

日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
【花了N长时间读《过犹不及》，不断练习，可以越通透】君君Love
我已经记不清花了多长时间去读《过犹不及》，读书笔记都写了42页，这算是读得特别精细的了。是一本难得的好书，虽然书中很多内容和圣经吻合，我不是基督徒，却觉得这样的文字值得细细品味，和我们的生活息息相关。我是个界线建立不牢固的人，常常愧疚，常常害怕他人的愤怒，常常不懂拒绝，还有很多时候表达不了自己真实的感受，心里在说不嘴里却在说好……这本书给我很多的启示，让我学会了怎样去建立属于自己的清晰的界限。建立
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
第八课: 写作出版你最关心的出书流程和市场分析（无戒学堂复盘）人在陌上
今天是周六，恰是圣诞节。推掉了两个需要凑腿的牌局，在一个手机，一个笔记本，一台电脑，一杯热茶的陪伴下，一个人静静地回听无戒学堂的最后一堂课。感谢这一个月，让自己的习惯开始改变，至少，可以静坐一个下午而不觉得乏味枯燥难受了，要为自己点个赞。我深知，这最后一堂课的内容，以我的资质和毅力，可能永远都用不上。但很明显，无戒学堂是用了心的，毕竟，有很多优秀学员，已经具备了写作能力，马上就要用到这堂课的内容。
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
《感官品牌》读书笔记 1 西红柿阿达
原文:最近我在东京街头闲逛时，与一位女士擦肩而过，我发现她的香水味似曾相识。“哗”的一下，记亿和情感立刻像潮水般涌了出来。这个香水味把我带回了15年前上高中的时候，我的一位亲密好友也是用这款香水。一瞬间，我呆站在那里，东京的街景逐渐淡出，取而代之的是我年少时的丹麦以及喜悦、悲伤、恐惧、困惑的记忆。我被这熟悉的香水味征服了。感想:感官是有记忆的，你所听到，看到，闻到过的有代表性的事件都会在大脑中深深
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
我不想再当知识的搬运工楚煜楚尧
因为学校课题研究的需要，这个暑假我依然需要完成一本书的阅读笔记。我选的是管建刚老师的《习课堂十讲》。这本书，之前我读过，所以重读的时候，感到很亲切，摘抄起来更是非常得心应手。20页，40面，抄了十天，终于在今天大功告成了。这对之前什么事都要一拖再拖的我来说，是破天荒的改变。我发现至从认识小尘老师以后，我的确发生了很大的改变。遇到必须做却总是犹豫不去做的事，我学会了按照小尘老师说的那样，在心里默默数
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
20210517坚持分享53天读书摘抄笔记非暴力沟通——爱自己 f79a6556cb19
让生命之花绽放在赫布·加德纳（HerbGardner）编写的《一千个小丑》一剧中，主人公拒绝将他12岁的外甥交给儿童福利院。他郑重地说道：“我希望他准确无误地知道他是多么特殊的生命，要不，他在成长的过程中将会忽视这一点。我希望他保持清醒，并看到各种奇妙的可能。我希望他知道，一旦有机会，排除万难给世界一点触动是值得的。我还希望他知道为什么他是一个人，而不是一张椅子。”然而，一旦负面的自我评价使我们看
Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
数据中台中的数据科学工作台：Jupyter集成方案 AI大数据智能洞察大数据与AI人工智能 jupyter 信息可视化 ide ai
数据中台中的数据科学工作台：Jupyter集成方案关键词：数据中台、数据科学工作台、JupyterNotebook、数据科学、机器学习、数据可视化、协作开发摘要：本文深入探讨了在数据中台架构中集成JupyterNotebook作为数据科学工作台的完整解决方案。我们将从数据中台的基本概念出发，详细分析Jupyter在数据科学工作流中的核心作用，介绍多种集成方案和技术实现细节，并通过实际案例展示如何构
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Redis 分布式锁深度解析：过期时间与自动续期机制爱恨交织围巾分布式事务 redis 分布式数据库微服务学习 go
Redis分布式锁深度解析：过期时间与自动续期机制在分布式系统中，Redis分布式锁的可靠性很大程度上依赖于对锁生命周期的管理。上一篇文章我们探讨了分布式锁的基本原理，今天我们将聚焦于一个关键话题：如何通过合理设置过期时间和实现自动续期机制，来解决分布式锁中的死锁与锁提前释放问题。一、为什么过期时间是分布式锁的生命线？你的笔记中提到"服务挂掉时未删除锁可能导致死锁"，这正是过期时间要解决的核心问题
08.学习闭环三部曲：预习、实时学习、复习 0058b195f4dc
人生就是一本效率手册，你怎样对待时间，时间就会给你同比例的回馈。单点突破法。预习，实时学习，复习。1、预习：凡事提前【计划】（1）前一晚设置三个当日目标。每周起始于每周日。（2）提前学习。预习法进行思考。预不预习效果相差20％，预习法学会提问。（3）《学会提问》。听电子书。2.实时学习（1）（10％）相应场景，思维导图，快速笔记。灵感笔记。（2）大纲，基本记录，总结篇。3.复习法则，（70％），最
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
基于随机森林的白酒风味智能分类系统：从数据到洞察的完整实践笙囧同学 python
作者：笙囧同学|中科院计算机大模型方向硕士|全栈开发爱好者座右铭：偷懒是人生进步的阶梯联系方式：[email protected]各大平台账号/公众号：笙囧同学前言大家好，我是笙囧同学！今天给大家分享一个超级有趣且技术含量爆表的项目——白酒风味智能分类系统。作为一个既爱技术又爱美酒的程序员，我花了大量时间研究如何用机器学习的方法来"品酒"，让AI帮我们识别白酒的风味特征。这个项目融合了机器学习、数
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio