gefeng1209

Unet模型tensorflow实现代码分析--在Carvana数据集训练

1.数据集下载即代码目录结构

我们使用Kaggle上Carvana Image Masking Challenge[download]的数据集对U-net模型进行训练，下载得到的压缩包中包含以下文件：

然后我们对U-net模型进行训练只需要解压，train.zip和train_masks.zip。解压到datasets，目录结构如下图所示:

train目录和train_masks目录下分别有5088张原图及其对应的mask图片，其中mask图片格式为gif格式。

data和model目录下的__init__.py为空，它所起的作用是为了方便其他目录下的文件能够将该目录作为模块导入。例如，我们要在model/unet.py下导入data/read_tfrecord模块，我们需要在unet.py中添加以下代码：

import sys
sys.path.append("../data")
from data import read_tfrecords

这里我遇到的一个问题是在unet.py中导入同个目录下的models和utils，编译器竟然报错，找不到模块，然后我google了一下，找到解决方案是将unet.py所在目录model标记为Sources Root：在pycharm中，鼠标右键点击model目录，Mark Directory as==>Sources Root

2.数据准备与数据处理

先执行scripts目录下transform_images.py:把../datasets/train/下文件以灰度图方式读取到../datasets/CarvanaImages/train/下把../datasets/train_masks/下文件以灰度图方式读取到../datasets/CarvanaImages/train_masks/下,gif==>jpg

import os
# import cv2 # Opencv can not read GIF image directly!
from PIL import Image


if __name__ == '__main__':
    #数据集所在目录
    data_root = "../datasets"
    
    #将train目录下文件名保存进image_names列表中
    image_names = os.listdir(os.path.join(data_root, "train"))
    
    #分别处理train目录和train_masks目录下的文件
    for filename in ["train", "train_masks"]:
        for image_name in image_names:
            #train目录下的图片
            if filename is "train":
                #得到每张训练原图片的文件名路径 e.g. ../datasets/train/0cdf5b5d0ce1_01.jpg
                image_file = os.path.join(data_root, filename, image_name)
                
                #PIL的Image类读取图像
                #convert()函数，用于不同模式图像之间的转换,L表示灰度转换为灰度图像
                image = Image.open(image_file).convert("L")

                #创建../datasets/CarvanaImages/train/
                if not os.path.exists(os.path.join("../datasets/CarvanaImages", filename)):
                    os.makedirs(os.path.join("../datasets/CarvanaImages", filename))
                #保存图片路径../datasets/CarvanaImages/train_masks/image_name(0cdf5b5d0ce1_01.jpg)
                image.save(os.path.join("../datasets/CarvanaImages", filename, image_name))

            if filename is "train_masks":
                # 得到每张训练mask图片的文件名路径：e.g. ../datasets/train_masks/0cdf5b5d0ce1_01_mask.gif
                image_file = os.path.join(data_root, filename, image_name[:-4] + "_mask.gif")
                image = Image.open(image_file).convert("L")
                
                # 创建../datasets/CarvanaImages/train_mask/
                if not os.path.exists(os.path.join("../datasets/CarvanaImages", filename)):
                    os.makedirs(os.path.join("../datasets/CarvanaImages", filename))
                
                # 保存图片路径：../datasets/CarvanaImages/train_masks/image_name(0cdf5b5d0ce1_01_mask.gif==>0cdf5b5d0ce1_01_mask.jpg)
                image.save(os.path.join("../datasets/CarvanaImages", filename, 
                    image_name[:-4] + "_mask.jpg"))

在执行scripts目录下build_tfrecords.py:将原图像及其mask图像以序列化为字符串的形式写入到一个tfrecord文件中，tfrecord数据文件是一种将图像数据和标签统一存储的二进制文件，能更好的利用内存，在tensorflow中快速的复制，移动，读取，存储等。

import os
# import glob # Can use os.listdir(data_dir) replace glob.glob(os.path.join(data_dir, "*.jpg"))
# to get every image name, do not include path.
import tensorflow as tf

if __name__ == '__main__':
    #灰度图像所在目录
    data_root = "../datasets/CarvanaImages"
    #将CarvanaImages/train目录下文件名保存进image_names列表中
    image_names = os.listdir(os.path.join(data_root, "train")) # return JPEG image names.
    
    # 创建../datasets/tfrecords/目录
    if not os.path.exists(os.path.join("../datasets", "tfrecords")):
        os.makedirs(os.path.join("../datasets", "tfrecords"))

    #tf.python_io.TFRecordWriter.__init__(path)
    # 第1步：创建文件../datasets/tfrecords/Carvana.tfrecords，为该文件创建TFRecordWriter准备写入数据
    writer = tf.python_io.TFRecordWriter(os.path.join("../datasets", "tfrecords",
        "Carvana.tfrecords"))

    for image_name in image_names:
        #得到训练原图像路径 e.g.datasets/CarvanaImages/train/0cdf5b5d0ce1_01.jpg
        image_raw_file = os.path.join(data_root, "train", image_name)
        #得到训练图像mask 路径 e.g.datasets/CarvanaImages/train_masks/0cdf5b5d0ce1_01_mask.jpg
        image_label_file = os.path.join(data_root, "train_masks", 
            image_name[:-4] + "_mask.jpg")

        #第2步：读取没有经过解码的原图及其mask(即label)
        # tf.gfile.FastGFile('path',mode).read()函数：读取没有经过解码的原始图像，如果要显示读入的图像，那就需要经过解码过程，读取的图像是一个字符串，没法显示
        # tensorflow里面提供解码的函数有两个，tf.image.decode_jepg和tf.image.decode_png分别用于解码jpg格式和png格式的图像进行解码，得到图像的像素值
        image_raw = tf.gfile.FastGFile(image_raw_file, 'rb').read() # image data type is string. 
        # read and binary.
        image_label = tf.gfile.FastGFile(image_label_file, 'rb').read()

        #tfrecord文件包含了tf.train.Example 协议缓冲区(protocol buffer，协议缓冲区包含了特征 Features)。
        # 你可以写一段代码获取你的数据， 将数据填入到Example协议缓冲区(protocol buffer)，将协议缓冲区序列化为一个字符串，
        # 并且通过tf.python_io.TFRecordWriter class写入到TFRecords文件。

        #tf.train.Example(features=tf.train.Features(feature={key:value,key:value,...})
        #value类型：tfrecord支持整型、浮点数和二进制三种格式，分别是
        # tf.train.Feature(int64_list=tf.train.Int64List(value=[int_scalar]))
        # tf.train.Feature(bytes_list=tf.train.BytesList(value=[array_string_or_byte]))
        # tf.train.Feature(bytes_list=tf.train.FloatList(value=[float_scalar]))
        # write bytes to Example proto buffer.
        
        #第3步：将raw及其label填入到tfrecord文件的Example缓冲区中
        example = tf.train.Example(features=tf.train.Features(feature={
            "image_raw": tf.train.Feature(bytes_list=tf.train.BytesList(value=[image_raw])),
            "image_label": tf.train.Feature(bytes_list=tf.train.BytesList(value=[image_label]))
            }))

        #第4步：将Example缓冲区序列化的写入到datasets/tfrecords/Carvana.tfrecords文件中
        writer.write(example.SerializeToString()) # Serialize To String
    
    writer.close()

3. main函数代码

只关注训练阶段的代码

main.py:

import tensorflow as tf
import numpy as np
from model import unet
import cv2


def main(argv):
    #tf.app.flags.FLAGS接受命令行传递参数或者tf.app.flags定义的默认参数
    tf_flags = tf.app.flags.FLAGS

    # gpu config.
    #tf.ConfigProto()函数用在创建session的时候，用来对session进行参数配置
    config = tf.ConfigProto()
    
    #tf提供了两种控制GPU资源使用的方法，第一种方式就是限制GPU的使用率:
    config.gpu_options.per_process_gpu_memory_fraction = 0.5    #占用50%显存
    #第二种是让TensorFlow在运行过程中动态申请显存，需要多少就申请多少:
    # config.gpu_options.allow_growth = True

    if tf_flags.phase == "train":
        #使用上面定义的config设置session
        with tf.Session(config=config) as sess: 
        # when use queue to load data, not use with to define sess
            #定义Unet模型
            train_model = unet.UNet(sess, tf_flags)
            #训练Unet网络，参数：batch_size,训练迭代步......
            train_model.train(tf_flags.batch_size, tf_flags.training_steps, 
                              tf_flags.summary_steps, tf_flags.checkpoint_steps, tf_flags.save_steps)
    else:
        with tf.Session(config=config) as sess:
            # test on a image pair.
            test_model = unet.UNet(sess, tf_flags)
            #test阶段:加载checkpoint文件的数据给模型参数初始化
            test_model.load(tf_flags.checkpoint)
            image, output_masks = test_model.test()
            # return numpy ndarray.
            
            # save two images.
            filename_A = "input.png"
            filename_B = "output_masks.png"
            
            cv2.imwrite(filename_A, np.uint8(image[0].clip(0., 1.) * 255.))
            cv2.imwrite(filename_B, np.uint8(output_masks[0].clip(0., 1.) * 255.))

            # Utilize cv2.imwrite() to save images.
            print("Saved files: {}, {}".format(filename_A, filename_B))

if __name__ == '__main__':
    #tf.app.flags可以定义一些默认参数，相当于接受python文件命令行执行时后面给的的参数
    tf.app.flags.DEFINE_string("output_dir", "model_output", 
                               "checkpoint and summary directory.")
    tf.app.flags.DEFINE_string("phase", "train", 
                               "model phase: train/test.")
    tf.app.flags.DEFINE_string("training_set", "./datasets", 
                               "dataset path for training.")
    tf.app.flags.DEFINE_string("testing_set", "./datasets/test", 
                               "dataset path for testing one image pair.")
    tf.app.flags.DEFINE_integer("batch_size", 64, 
                                "batch size for training.")
    tf.app.flags.DEFINE_integer("training_steps", 100000, 
                                "total training steps.")
    tf.app.flags.DEFINE_integer("summary_steps", 100, 
                                "summary period.")
    tf.app.flags.DEFINE_integer("checkpoint_steps", 1000, 
                                "checkpoint period.")
    tf.app.flags.DEFINE_integer("save_steps", 500, 
                                "checkpoint period.")
    tf.app.flags.DEFINE_string("checkpoint", None, 
                                "checkpoint name for restoring.")
    tf.app.run(main=main)

4.Unet模型实现代码

网络输入shape：[batch_size,512,512,1],输出shape：[batch_size,324,324,1]

需要注意的是，在编码器的5个卷积层中，对图像进行裁剪后的图只负责与解码过程中相同分辨率的图进行拼接，池化操作是在裁剪前的图上操作的。

model目录下的models.py：

import tensorflow as tf

def Unet(name, in_data, reuse=False):
    # Not use BatchNorm or InstanceNorm.
    #确认输入非空
    assert in_data is not None
    #reuse=False：不共享变量
    with tf.variable_scope(name, reuse=reuse):
        #每经过两个卷积层就裁剪一次为了与加码器特征图合并，对卷积后的特征图池化分辨率缩小一半，不是对裁剪后的
        #size=[None,512,512,1]==>[None,510,510,64]
        conv1_1 = tf.layers.conv2d(in_data, 64, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0)) # Use Xavier init.
        # Arguments: inputs, filters, kernel_size, strides((1, 1)), padding(VALID). 
        # Appoint activation, use_bias, kernel_initializer, bias_initializer=tf.zeros_initializer().
        # In Keras's implement, kernel_initializer is he_normal, i.e. 
        # mean = 0.0, stddev = sqrt(2 / fan_in).

        #size=[None,510,510,64]==>[None,508,508,64]
        conv1_2 = tf.layers.conv2d(conv1_1, 64, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #(90, 90), (90, 90):上下左右裁掉的像素值size[None,508,508,64]==>[None,328,328,64]
        crop1 = tf.keras.layers.Cropping2D(cropping=((90, 90), (90, 90)))(conv1_2)

        #size=[None,508,508,64]==>[None,254,254,64]
        pool1 = tf.layers.max_pooling2d(conv1_2, 2, 2)

        #size=[None,254,254,64]==>[None,252,252,128]
        conv2_1 = tf.layers.conv2d(pool1, 128, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #size=[None,252,252,128]==>[None,250,250,128]
        conv2_2 = tf.layers.conv2d(conv2_1, 128, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #裁剪：size=[None,250,250,128]==>[None,168,168,128]
        crop2 = tf.keras.layers.Cropping2D(cropping=((41, 41), (41, 41)))(conv2_2)

        #size=[None,250,250,128]==>[None,125,125,128]
        pool2 = tf.layers.max_pooling2d(conv2_2, 2, 2)

        #size=[None,125,125,128]==>[None,123,123,256]
        conv3_1 = tf.layers.conv2d(pool2, 256, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #size=[None,123,123,256]==>[None,121,121,256]
        conv3_2 = tf.layers.conv2d(conv3_1, 256, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #size=[None,121,121,256]==>[None,88,88,256]
        crop3 = tf.keras.layers.Cropping2D(cropping=((16, 17), (16, 17)))(conv3_2)

        # size=[None,121,121,256]==>[None,60,60,256]
        pool3 = tf.layers.max_pooling2d(conv3_2, 2, 2)

        #size=[None,60,60,256]==>[None,58,58,512]
        conv4_1 = tf.layers.conv2d(pool3, 512, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #size=[None,58,58,512]==>[None,56,56,512]
        conv4_2 = tf.layers.conv2d(conv4_1, 512, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #[None,56,56,512]
        drop4 = tf.layers.dropout(conv4_2)
        # Arguments: inputs, rate=0.5.

        #size=[None,56,56,512]==>[None,48,48,512]
        crop4 = tf.keras.layers.Cropping2D(cropping=((4, 4), (4, 4)))(drop4)

        #[None,56,56,512]==>[None,28,28,512]
        pool4 = tf.layers.max_pooling2d(drop4, 2, 2)

        #[None,28,28,512]==>[None,26,26,1024]
        conv5_1 = tf.layers.conv2d(pool4, 1024, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #[None,26,26,1024]==>[None,24,24,1024]
        conv5_2 = tf.layers.conv2d(conv5_1, 1024, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #[None,24,24,1024]
        drop5 = tf.layers.dropout(conv5_2)



        #解码器：
        #上采样：[None,24,24,1024]==>[None,48,48,1024]
        up6_1 = tf.keras.layers.UpSampling2D(size=(2, 2))(drop5)
        '''
        Class UpSampling2D, Upsampling layer for 2D inputs. Arguments:
        size: int, or tuple of 2 integers. The upsampling factors for rows and columns.
        '''
        #每次上采样后有一个2*2的same卷积降维，[None,48,48,1024]=>[None,48,48,512]
        up6 = tf.layers.conv2d(up6_1, 512, 2, padding="SAME", activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #每次上采样后与编码器对应分辨率图像合并(concatenate)=>[None,48,48,1024]
        merge6 = tf.concat([crop4, up6], axis=3) # concat channel
        # values: A list of Tensor objects or a single Tensor.

        #[None,48,48,1024]==>[None,46,46,512]
        conv6_1 = tf.layers.conv2d(merge6, 512, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #[None, 46, 46, 1024]==[None,44,44,512]
        conv6_2 = tf.layers.conv2d(conv6_1, 512, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #上采样：[None,44,44,512]==>[None,88,88,512]
        up7_1 = tf.keras.layers.UpSampling2D(size=(2, 2))(conv6_2)

        #[None,88,88,256]
        up7 = tf.layers.conv2d(up7_1, 256, 2, padding="SAME", activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #[None,88,88,512]
        merge7 = tf.concat([crop3, up7], axis=3) # concat channel

        #[None,88,88,512]==>[None,86,86,256]
        conv7_1 = tf.layers.conv2d(merge7, 256, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #[None,86,86,256]==[None,84,84,256]
        conv7_2 = tf.layers.conv2d(conv7_1, 256, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #[None,84,84,256]==[None,168,168,256]
        up8_1 = tf.keras.layers.UpSampling2D(size=(2, 2))(conv7_2)
        #[None,168,168,256]==>[None,168,168,128]
        up8 = tf.layers.conv2d(up8_1, 128, 2, padding="SAME", activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))
        #[None,168,168,256]
        merge8 = tf.concat([crop2, up8], axis=3) # concat channel

        #[None,168,168,256]==>[None,166,166,128]
        conv8_1 = tf.layers.conv2d(merge8, 128, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))
        #[None,166,166,256]==>[None,164,164,128]
        conv8_2 = tf.layers.conv2d(conv8_1, 128, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #[None,164,164,128]==>[None,328,328,128]
        up9_1 = tf.keras.layers.UpSampling2D(size=(2, 2))(conv8_2)
        #[None,328,328,64]
        up9 = tf.layers.conv2d(up9_1, 64, 2, padding="SAME", activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))
        #[None,328,328,128]
        merge9 = tf.concat([crop1, up9], axis=3) # concat channel

        #[None,328,328,128]==>[None,326,326,64]
        conv9_1 = tf.layers.conv2d(merge9, 64, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))
        #[None,326,326,64]==>[None,324,324,64]
        conv9_2 = tf.layers.conv2d(conv9_1, 64, 3, activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))
        #[None,324,324,2]
        conv9_3 = tf.layers.conv2d(conv9_2, 2, 3, padding="SAME", activation=tf.nn.relu,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))

        #[None,324,324,2]=>[None,324,324,1]
        conv10 = tf.layers.conv2d(conv9_3, 1, 1,
            kernel_initializer = tf.contrib.layers.xavier_initializer())
            # kernel_initializer = tf.variance_scaling_initializer(scale=2.0))
        # 1 channel.

    return conv10

5. Unet类代码

model目录下的unet.py:

import os
import logging
import time
from datetime import datetime
import tensorflow as tf
from models import Unet
from utils import save_images
import sys
sys.path.append("../data")
from data import read_tfrecords
import numpy as np
import cv2
import glob

class UNet(object):
    def __init__(self, sess, tf_flags):
        self.sess = sess
        self.dtype = tf.float32
        
        #模型保存的文件夹：e.g. model_output_20190305195925/
        self.output_dir = tf_flags.output_dir
        #checkpoint文件保存目录 e.g. model_output_20190305195925/checkpoint/
        self.checkpoint_dir = os.path.join(self.output_dir, "checkpoint")
        #checkpoint文件前缀名
        self.checkpoint_prefix = "model"
        self.saver_name = "checkpoint"
        #summary文件保存的目录 e.g. model_output_20190305195925/summary/
        self.summary_dir = os.path.join(self.output_dir, "summary")

        self.is_training = (tf_flags.phase == "train")
        #初始学习率
        self.learning_rate = 0.001

        # data parameters
        #设置网络输入图像size=512*512*1
        self.image_w = 512
        self.image_h = 512 # The raw and mask image is 1918 * 1280.
        self.image_c = 1

        #输入大小：[None,512,512,1]
        self.input_data = tf.placeholder(self.dtype, [None, self.image_h, self.image_w, 
            self.image_c])
        #mask大小：[None,324,324,1]
        self.input_masks = tf.placeholder(self.dtype, [None, 324, 324, 
            self.image_c])
        # TODO: The shape of image masks. Refer to the Unet in model.py, the output image is
        # 324 * 324 * 1. But is not good.

        #定义学习率占位符
        self.lr = tf.placeholder(self.dtype)

        # train
        if self.is_training:
            #训练集目录
            self.training_set = tf_flags.training_set
            self.sample_dir = "train_results"

            #创建summary_dir，checkpoint_dir，sample_dir
            self._make_aux_dirs()

            # 定义 loss，优化器，summary，saver
            self._build_training()

            # 日志文件路径
            log_file = self.output_dir + "/Unet.log"
            logging.basicConfig(format='%(asctime)s [%(levelname)s] %(message)s',   #handler使用指明的格式化字符串:日志时间 日志级别名称 日志信息
                                filename=log_file,                                  #日志文件名
                                level=logging.DEBUG,                                #日志级别：只有级别高于DEBUG的内容才会输出
                                filemode='w')                                       #打开日志文件的模式
            #logging.getLogger()创建一个记录器
            #addHandler()添加一个StreamHandler处理器
            logging.getLogger().addHandler(logging.StreamHandler())
        else:
            # test
            self.testing_set = tf_flags.testing_set
            # build model
            self.output = self._build_test()

    def _build_training(self):
        '''
        定义self.loss,self.opt,self.summary,self.writer,self.saver
        '''
        # Unet input_data:[None,512,512,1]
        #output：[None,324,324,1]
        self.output = Unet(name="UNet", in_data=self.input_data, reuse=False)

        # loss.
        self.loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(
            labels=self.input_masks, logits=self.output))
        # self.loss = tf.reduce_mean(tf.squared_difference(self.input_masks,
        #     self.output))
        # Use Tensorflow and Keras at the same time.
        # self.loss = tf.reduce_mean(tf.keras.losses.binary_crossentropy(
        #     self.input_masks, self.output))
        
        # optimizer
        #定义Adam优化器
        self.opt = tf.train.AdamOptimizer(learning_rate=self.lr).minimize(
            self.loss, name="opt")
        
        # summary
        tf.summary.scalar('loss', self.loss)
        
        self.summary = tf.summary.merge_all()
        # summary and checkpoint
        self.writer = tf.summary.FileWriter(
            self.summary_dir, graph=self.sess.graph)
        #最多保存10个最新的checkpoint文件
        self.saver = tf.train.Saver(max_to_keep=10, name=self.saver_name)
        self.summary_proto = tf.Summary()


    def train(self, batch_size, training_steps, summary_steps, checkpoint_steps, save_steps):
        '''
        参数：
        batch_size:
        training_steps:训练要经过多少迭代步
        summary_steps:每经过多少步就保存一次summary
        checkpoint_steps:每经过多少步就保存一次checkpoint文件
        save_steps:每经过多少步就保存一次图像
        '''
        step_num = 0
        # restore last checkpoint e.g. model_output_20180314110555/checkpoint/model-10000.index
        latest_checkpoint = tf.train.latest_checkpoint("model_output_20180314110555/checkpoint")
        

        #存在checkpoint文件
        if latest_checkpoint:
            step_num = int(os.path.basename(latest_checkpoint).split("-")[1])
            assert step_num > 0, "Please ensure checkpoint format is model-*.*."
            
            #使用最新checkpoint文件restore模型
            self.saver.restore(self.sess, latest_checkpoint)
            logging.info("{}: Resume training from step {}. Loaded checkpoint {}".format(datetime.now(), 
                step_num, latest_checkpoint))
        else:
            #不存在checkpoint文件，初始化模型参数
            self.sess.run(tf.global_variables_initializer()) # init all variables
            logging.info("{}: Init new training".format(datetime.now()))

        #定义Read_TFRecords类的对象tf_reader
        tf_reader = read_tfrecords.Read_TFRecords(filename=os.path.join(self.training_set, 
            "Carvana.tfrecords"),
            batch_size=batch_size, image_h=self.image_h, image_w=self.image_w, 
            image_c=self.image_c)

        #[batch_size,512,512,1],[batch_size,324,324,1]
        images, images_masks = tf_reader.read()
        logging.info("{}: Done init data generators".format(datetime.now()))

        #线程协调器
        self.coord = tf.train.Coordinator()
        #使用tf.train.start_queue_runners之后，才会启动填充队列的线程，这时系统就不再“停滞”。
        # 此后计算单元就可以拿到数据并进行计算，整个程序也就跑起来了
        threads = tf.train.start_queue_runners(sess=self.sess, coord=self.coord)
        try:
            # train
            c_time = time.time()
            lrval = self.learning_rate
            for c_step in range(step_num + 1, training_steps + 1):
                # 5000个step后，学习率减半
                if c_step % 5000 == 0:
                    lrval = self.learning_rate * .5
                
                batch_images, batch_images_masks = self.sess.run([images, images_masks])
                #实现反向传播需要的参数
                c_feed_dict = {
                    # TFRecord
                    self.input_data: batch_images,
                    self.input_masks: batch_images_masks,
                    self.lr: lrval
                }
                self.sess.run(self.opt, feed_dict=c_feed_dict)

                # save summary
                if c_step % summary_steps == 0:
                    #summary loss
                    c_summary = self.sess.run(self.summary, feed_dict=c_feed_dict)
                    #写summary文件
                    self.writer.add_summary(c_summary, c_step)

                    e_time = time.time() - c_time
                    time_periter = e_time / summary_steps
                    logging.info("{}: Iteration_{} ({:.4f}s/iter) {}".format(
                        datetime.now(), c_step, time_periter,
                        self._print_summary(c_summary)))        #self._print_summary(c_summary)：(loss=0.665075540543)
                    c_time = time.time() # update time

                # save checkpoint
                if c_step % checkpoint_steps == 0:
                    self.saver.save(self.sess,
                        os.path.join(self.checkpoint_dir, self.checkpoint_prefix),
                        global_step=c_step)
                    logging.info("{}: Iteration_{} Saved checkpoint".format(
                        datetime.now(), c_step))

                #保存图片
                if c_step % save_steps == 0:
                    #预测的分割mask和ground truth的mask
                    _, output_masks, input_masks = self.sess.run(
                        [self.input_data, self.output, self.input_masks],
                        feed_dict=c_feed_dict)
                    #[batch_size,324,324,1]
                    save_images(None, output_masks, input_masks,
                        #self.sample_dir：train_results
                        input_path = './{}/input_{:04d}.png'.format(self.sample_dir, c_step),
                        image_path = './{}/train_{:04d}.png'.format(self.sample_dir, c_step))
        except KeyboardInterrupt:
            print('Interrupted')
            self.coord.request_stop()
        except Exception as e:
            self.coord.request_stop(e)
        finally:
            #主线程计算完成，停止所有采集数据的进程
            self.coord.request_stop()
            #等待其他线程结束
            self.coord.join(threads)
        logging.info("{}: Done training".format(datetime.now()))

    def _build_test(self):
        # network.
        output = Unet(name="UNet", in_data=self.input_data, reuse=False)

        self.saver = tf.train.Saver(max_to_keep=10, name=self.saver_name) 
        # define saver, after the network!

        return output

    def load(self, checkpoint_name=None):
        # restore checkpoint
        print("{}: Loading checkpoint...".format(datetime.now())),
        if checkpoint_name:
            checkpoint = os.path.join(self.checkpoint_dir, checkpoint_name)
            self.saver.restore(self.sess, checkpoint)
            print(" loaded {}".format(checkpoint_name))
        else:
            # restore latest model
            latest_checkpoint = tf.train.latest_checkpoint(
                self.checkpoint_dir)
            if latest_checkpoint:
                self.saver.restore(self.sess, latest_checkpoint)
                print(" loaded {}".format(os.path.basename(latest_checkpoint)))
            else:
                raise IOError(
                    "No checkpoints found in {}".format(self.checkpoint_dir))

    def test(self):
        # Test only in a image.
        image_name = glob.glob(os.path.join(self.testing_set, "*.jpg"))
        
        # In tensorflow, test image must divide 255.0.
        image = np.reshape(cv2.resize(cv2.imread(image_name[0], 0), 
            (self.image_h, self.image_w)), (1, self.image_h, self.image_w, self.image_c)) / 255.
        # OpenCV load image. the data format is BGR, w.t., (H, W, C). The default load is channel=3.

        print("{}: Done init data generators".format(datetime.now()))

        c_feed_dict = {
            self.input_data: image
        }

        output_masks = self.sess.run(
            self.output, feed_dict=c_feed_dict)

        return image, output_masks
        # image: 1 * 512 * 512 * 1
        # output_masks: 1 * 324 * 342 * 1.

    def _make_aux_dirs(self):
        if not os.path.exists(self.summary_dir):
            os.makedirs(self.summary_dir)
        if not os.path.exists(self.checkpoint_dir):
            os.makedirs(self.checkpoint_dir)
        if not os.path.exists(self.sample_dir):
            os.makedirs(self.sample_dir)

    def _print_summary(self, summary_string):
        #解析loss summary中的值
        self.summary_proto.ParseFromString(summary_string)
        result = []
        for val in self.summary_proto.value:
            result.append("({}={})".format(val.tag, val.simple_value))
        return " ".join(result)

6.Read_TFRecords类的代码

data目录read_tfrecords.py：

import tensorflow as tf


class Read_TFRecords(object):
    def __init__(self, filename, batch_size=64,
        image_h=256, image_w=256, image_c=1, num_threads=8, capacity_factor=3, min_after_dequeue=1000):
        '''
        filename: TFRecords file path.
        num_threads: TFRecords file load thread.
        capacity_factor: capacity.
        '''
        self.filename = filename
        self.batch_size = batch_size
        self.image_h = image_h
        self.image_w = image_w
        self.image_c = image_c
        self.num_threads = num_threads
        self.capacity_factor = capacity_factor
        self.min_after_dequeue = min_after_dequeue

    def read(self):
        # read a TFRecords file, return tf.train.batch/tf.train.shuffle_batch object.

        #从TFRecords文件中读取数据
        #第1步：需要用tf.train.string_input_producer生成一个文件名队列。
        filename_queue = tf.train.string_input_producer([self.filename])

        #第2步：调用tf.TFRecordReader创建读取器
        reader = tf.TFRecordReader()
        #读取文件名队列，返回serialized_example对象
        key, serialized_example = reader.read(filename_queue)
        

        #第3步：调用tf.parse_single_example操作将Example协议缓冲区(protocol buffer)解析为张量字典
        features = tf.parse_single_example(serialized_example,
            features={
                "image_raw": tf.FixedLenFeature([], tf.string),
                "image_label": tf.FixedLenFeature([], tf.string),
            })

        #第4步：对图像张量解码并进行一些处理resize,归一化...
        ## tensorflow里面提供解码的函数有两个，tf.image.decode_jepg和tf.image.decode_png分别用于解码jpg格式和png格式的图像进行解码，得到图像的像素值
        image_raw = tf.image.decode_jpeg(features["image_raw"], channels=self.image_c,
            name="decode_image")
        image_label = tf.image.decode_jpeg(features["image_label"], channels=self.image_c,
            name="decode_image")

        #将图片resize为模型指定输入大小[1918,1280]=>[512,512],[1918,1280]==>[324,324]
        if self.image_h is not None and self.image_w is not None:
            image_raw = tf.image.resize_images(image_raw, [self.image_h, self.image_w], 
                method=tf.image.ResizeMethod.BICUBIC)
            image_label = tf.image.resize_images(image_label, [324, 324], 
                method=tf.image.ResizeMethod.BICUBIC)
            # TODO: The shape of image masks. Refer to the Unet in model.py, the output image is
            # 324 * 324 * 1. But is not good.

        #像素值类型转换为tf.float32，归一化
        image_raw = tf.cast(image_raw, tf.float32) / 255.0 # convert to float32
        image_label = tf.cast(image_label, tf.float32) / 255.0 # convert to float32

        # tf.train.batch/tf.train.shuffle_batch object.
        #tf.train.shuffle_batch()该函数将会使用一个队列，函数读取一定数量的tensors送入队列，将队列中的tensor打乱，
        # 然后每次从中选取batch_size个tensors组成一个新的tensors返回出来
        #参数：
        #tensors：要入队的tensor列表
        #batch_size:表示进行一次批处理的tensors数量
        #capacity:为队列的长度，建议capacity的取值如下：min_after_dequeue + (num_threads + a small safety margin) * batch_size
        #min_after_dequeue:意思是队列中，做dequeue（取数据）的操作后，线程要保证队列中至少剩下min_after_dequeue个数据。
        #                   如果min_after_dequeue设置的过少，则即使shuffle为True，也达不到好的混合效果,过大则会占用更多的内存
        #num_threads:决定了有多少个线程进行入队操作，如果设置的超过一个线程，它们将从不同文件不同位置同时读取，可以更加充分的混合训练样本,设置num_threads的值大于1,使用多个线程在tensor_list中读取文件
        #allow_smaller_final_batch(False)：当allow_smaller_final_batch为True时，如果队列中的张量数量不足batch_size，将会返回小于batch_size长度的张量，如果为False，剩下的张量会被丢弃
        # Using asynchronous queues

        #第5步：tf.train.shuffle_batch将训练集打乱，每次返回batch_size份数据
        input_data, input_masks = tf.train.shuffle_batch([image_raw, image_label],
            batch_size=self.batch_size,
            capacity=self.min_after_dequeue + self.capacity_factor * self.batch_size,
            min_after_dequeue=self.min_after_dequeue,
            num_threads=self.num_threads,
            name='images')
        
        return input_data, input_masks # return list or dictionary of tensors.

7. 图片保存代码

model目录下的utils.py

import numpy as np
import cv2

def save_images(input, output1, output2, input_path, image_path, max_samples=4):
    #在图片宽度上concatenate=>[batch_size,324,648,1](横向)
    image = np.concatenate([output1, output2], axis=2) # concat 4D array, along width.
    #纵向concatenate的图片个数=min(max_samples,batch_size)
    if max_samples > int(image.shape[0]):
        max_samples = int(image.shape[0])
    
    image = image[0:max_samples, :, :, :]
    #[
    image = np.concatenate([image[i, :, :, :] for i in range(max_samples)], axis=0)
    # concat 3D array, along axis=0, i.e. along height. shape: (648, 648, 1).

    # save image.
    # scipy.misc.toimage(), array is 2D(gray, reshape to (H, W)) or 3D(RGB).
    # scipy.misc.toimage(image, cmin=0., cmax=1.).save(image_path) # image_path contain image path and name.
    #clip这个函数将将数组中的元素限制在a_min, a_max之间，大于a_max的就使得它等于 a_max，小于a_min,的就使得它等于a_min
    cv2.imwrite(image_path, np.uint8(image.clip(0., 1.) * 255.))

    # save input
    if input is not None:
        input_data = input[0:max_samples, :, :, :]
        #[1024,256,3]
        input_data = np.concatenate([input_data[i, :, :, :] for i in range(max_samples)], axis=0)
        cv2.imwrite(input_path, np.uint8(input_data.clip(0., 1.) * 255.))

你可能感兴趣的:(Unet模型tensorflow实现代码分析--在Carvana数据集训练)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
2022-10-20 体力劳动者
不因感觉稍纵即逝就不加记录。在女儿睡觉后我记下今天的小故事。接手新班级后，今天是第二次收到家长的感谢信（微信）。是我表扬次数最多的两位学生家长致来的感谢，他们明显感受到孩子自信、阳光了不少，写作业由被动变为了主动，家庭氛围也由鸡飞狗跳变成了其乐融融。在被顽皮的学生气得头晕之后，我感到了久违的价值感，责任感甚至使命感，我回复家长这样一句话：我们也需要家长的反馈好让我们的教育工作更有劲头。我也认识到，
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
IK分词初心myp
实现简单的分词功能，智能化分词添加依赖配置：4.10.4org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-analyzers-common${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucenel
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
2023-11-02 一帆f
发现浸润心田的感觉：今天一个机缘之下突然想分享我的婆媳关系，我一边分享一边回忆我之前和儿媳妇关系的微妙变化，特别是分享到我能感受到儿媳妇的各种美好，现在也能心平气和的和老公平等对话，看到自己看到老公，以己推人以人推己自然而然的换位思考，心中有一种美好的能量在涌动，一种浸润心田的感觉从心胸向全身扩散，美好极了……我很想记住这种感觉，赶紧把它写下来以留纪念，也就是当我看见他人的美好，美好的美妙的浸润心
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
日更50天有什么收益？星湾二宝
坚持在平台上日更50天了，平台也为我生成了日更50天徽章，小开心一下这份坚持。日更50天徽章那坚持50天都有哪些收益呢？收益一，就是最直观的那些钻和贝，我这边确实不太高，但是这些贝足够支撑我保持会员的资格，能够在发文的时候帮助友友们去除广告，方便阅读。钻和贝收益二，文章的收获，日更50天，坚持写作3.7万文字，书写的文字也从开始的流水账/碎碎念逐渐加入自己的思考和观点。以前，一个念头会一晃而过，如
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
读书能沁润心灵平等乡马回营小学方燕姣
书，是一泓清澈的溪水，是一片充满生机的芳草地。读书能让孩子的心变得宁静、诗意、豁达。在美好年纪，美好的时光里，我们要创造一切可以创造的机会，让孩子去遨游浩瀚的书海，浸润美好的人生。每个早晨，一股花草的清香扑了个满怀，清脆的读书声响彻了整个校园，回荡在空中久久不能停息。自然界的清韵声音有：鸟鸣声、溪流声、松风声、雨打芭蕉声，而惟读书声最为动听。孩子们的读书声，混和着树上的鸟鸣声，还有微风吹动竹叶的声
Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
第28章汇编语言--- 异常处理 hummhumm 汇编算法开发语言程序设计高级语言异常处理汇编语言
在汇编语言中，异常处理是一个重要的概念，它涉及到处理器如何响应和处理程序运行时发生的非正常情况。异常可以是硬件错误（例如除零错误、非法指令）或者软件触发的中断（例如系统调用）。当发生异常时，处理器会暂停当前正在执行的程序，并转移到一个预先定义好的位置来处理这个异常。为了详细阐述第28章关于汇编语言中的异常处理，我们可以考虑一个简化的例子，展示异常处理的基本结构。请注意，实际的代码将取决于具体的处理
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
《实际生活是我们的指南针》——教育中寻找曙光托克托126何芳
陶行知先生的文章相对《致青年教师》比较难理解，但是他热爱学生,在书中处处能感受到。在《实际生活是我们的指南针》文中他说道:“我虽觉得我有好多地方可以帮助诸位,但指志针确是有些不敢当。我和诸位同是在乡村里摸路的人。我们的真正指南针只是实际生活。”这些话不仅使人感到他非常谦虛,既不夸大自己的作用也不轻视自己的作用。图片发自App我们的真正指南针只是实际生活。实际生活向我们供给无穷的问题,要求不断的解决
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
高省邀请码哪个级别最高?高省原始高级邀请码500888 凌风导师
高省是杭州长孚科技有限公司开辟的一个项目（高省APP），已获数千万投资，主打外交电商+新零售，提供淘宝好省京东等主流电商途径的大额优惠券（直接在淘宝等途径购买是没有该优惠券的）。用户们可以利用这些软件享受折扣买东西优惠，一起来看看购物省钱app网上买东西省钱的软件有哪些吧！网购省钱软件靠谱吗包围淘宝等途径产品的左右，也便是你可以大概在高省买你的确想买的任何产品，并且享受额定优惠，优惠力度为-（大部
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag