深度学习在机器视觉上的应用
卷积神经网络也称convnet,多应用于图像分类问题
卷积神经网络接收形状为 (image_height, image_width, image_channels)
的输入张量(不包括批量维度)。
简单卷积神经网络构成
import keras
keras.__version__
from keras import layers
from keras import models
model = models.Sequential() #添加容器
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.summary() #显示当前神经网络架构
高度和宽度两个维度的尺寸都会随着网络加深而变小。
添加分类器
我们将进行 10 类别分类,最后一层使用带 10 个输出的 softmax 激活。现在网络的架构如下:
#添加分类器
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))
#再次显示网络架构
model.summary()
可以看出,在进入两个Dense层之前,形状(3,3,64)的输出被展平为(576,)的向量
from keras.datasets import mnist
from keras.utils import to_categorical
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255
test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)
model.compile(optimizer='rmsprop',
loss='categorical_crossentropy',
metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=5, batch_size=64)
#在测试数据上对模型进行评估
test_loss, test_acc = model.evaluate(test_images, test_labels)
#测试精度
test_acc