weixin_37958272

TensorRT教程

参考链接：https://docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html#unique_1139626899

3.1. Importing TensorRT Into Python

Procedure

Import TensorRT:
```
import tensorrt as trt
```
实现一个日志接口，TensorRT通过该接口报告错误、警告和信息。下面的代码展示了如何实现日志接口。在本例中，我们抑制了informational messages，只报告警告和错误。TensorRT的Python绑定中包含了一个简单的logger。

3.2. Creating A Network Definition In Python

使用TensorRT进行推理的第一步是从您的模型创建一个TensorRT网络。

最简单的方法是使用TensorRT解析器库导入模型，(参见使用Python中的解析器导入模型、使用Python从Caffe导入、使用Python从TensorFlow导入和使用Python从ONNX导入)，它支持以下格式的序列化模型。

Caffe (both BVLC and NVCaffe)
Supports ONNX releases up to ONNX 1.6, and ONNX opsets 7 to 11, and
UFF (used for TensorFlow)

另一种方法是直接使用 TensorRT 网络 API 来定义模型，(参见使用 Python API 从头开始创建网络定义)。这需要你进行少量的API调用来定义网络图中的每一层，并为模型的训练参数实现自己的导入机制。

注意：TensorRT Python API并非适用于所有平台。更多信息，请参见 TensorRT Support Matrix。

3.2.1. Creating A Network Definition From Scratch Using The Python API

创建网络时，必须首先定义engine ，并创建一个用于推理的builder对象。Python API用于从网络API中创建网络和engine 。网络定义引用用于向网络添加各种层。

下面的代码说明了如何创建一个具有Input、Convolution、Pooling、FullyConnected、Activation和SoftMax层的简单网络。

# Create the builder and network
with trt.Builder(TRT_LOGGER) as builder, builder.create_network() as network:
	# Configure the network layers based on the weights provided. In this case, the weights are imported from a pytorch model. 
	# Add an input layer. The name is a string, dtype is a TensorRT dtype, and the shape can be provided as either a list or tuple.
	input_tensor = network.add_input(name=INPUT_NAME, dtype=trt.float32, shape=INPUT_SHAPE)

	# Add a convolution layer
	conv1_w = weights['conv1.weight'].numpy()
	conv1_b = weights['conv1.bias'].numpy()
	conv1 = network.add_convolution(input=input_tensor, num_output_maps=20, kernel_shape=(5, 5), kernel=conv1_w, bias=conv1_b)
	conv1.stride = (1, 1)

	pool1 = network.add_pooling(input=conv1.get_output(0), type=trt.PoolingType.MAX, window_size=(2, 2))
	pool1.stride = (2, 2)
	conv2_w = weights['conv2.weight'].numpy()
	conv2_b = weights['conv2.bias'].numpy()
	conv2 = network.add_convolution(pool1.get_output(0), 50, (5, 5), conv2_w, conv2_b)
	conv2.stride = (1, 1)

	pool2 = network.add_pooling(conv2.get_output(0), trt.PoolingType.MAX, (2, 2))
	pool2.stride = (2, 2)

	fc1_w = weights['fc1.weight'].numpy()
	fc1_b = weights['fc1.bias'].numpy()
	fc1 = network.add_fully_connected(input=pool2.get_output(0), num_outputs=500, kernel=fc1_w, bias=fc1_b)

	relu1 = network.add_activation(fc1.get_output(0), trt.ActivationType.RELU)

	fc2_w = weights['fc2.weight'].numpy()
	fc2_b = weights['fc2.bias'].numpy()
	fc2 = network.add_fully_connected(relu1.get_output(0), OUTPUT_SIZE, fc2_w, fc2_b)

	fc2.get_output(0).name =OUTPUT_NAME
	network.mark_output(fc2.get_output(0))

3.2.2. Importing A Model Using A Parser In Python

要使用parse导入模型，您需要执行以下high-level步骤。

Create the TensorRTbuilder and network.
为特定格式创建TensorRT parse。
使用parse解析导入的模型并填充网络。

builder 必须在网络之前创建，因为它是网络的工厂。不同的builder有不同的机制来标记网络输出。更多信息，请参见 UFF Parser API, Caffe Parser API, and ONNX Parser API。

3.2.3. Importing From Caffe Using Python

下面的步骤说明了如何使用CaffeParser和Python API直接导入Caffe模型。

Procedure

Import TensorRT.
```
import tensorrt as trt
```
Define the data type. In this example, we will use float32.
```
datatype = trt.float32
```
Additionally, define some paths. Change the following paths to reflect where you placed the model included with the samples:
```
deploy_file = 'data/mnist/mnist.prototxt'
model_file = 'data/mnist/mnist.caffemodel'
```

Create the builder, network, and parser:

with trt.Builder(TRT_LOGGER) as builder, builder.create_network() as network, trt.CaffeParser() as parser:
model_tensors = parser.parse(deploy=deploy_file, model=model_file, network=network, dtype=datatype)

parse返回model_tensors，这是一个包含从张量名称到ITensor对象的映射表。

3.2.4. Importing From TensorFlow Using Python

Procedure

Import TensorRT:
```
import tensorrt as trt
```
Create a frozen TensorFlow model for the tensorflow model. The instructions on freezing a TensorFlow model into a stream can be found in Freezing A TensorFlow Graph.
Use the UFF converter to convert a frozen tensorflow model to a UFF file. Typically, this is as simple as:
```
convert-to-uff frozen_inference_graph.pb
```
根据你安装 TensorRT 的方式，convert-to-uff 工具可能没有安装在你的系统路径中。在这种情况下，直接调用底层的Python脚本。它应该位于UFF模块的bin目录下; 例如, ~/.local/lib/python3.6/site-packages/uff/bin/convert_to_uff.py.

要找到UFF模块的位置，运行python -c "import uff; print(uff.path) "命令。

另外，你也可以使用 UFF Parser API，直接转换TensorFlow GraphDef。
Define some paths. Change the following paths to reflect where you placed the model that is included with the samples:
```
model_file = '/data/mnist/mnist.uff'
```

Create the builder, network, and parser:

with builder = trt.Builder(TRT_LOGGER) as builder, builder.create_network() as network, trt.UffParser() as parser:
    	parser.register_input("Placeholder", (1, 28, 28))
    	parser.register_output("fc2/Relu")
parser.parse(model_file, network)

3.2.5. Importing From ONNX Using Python

以下步骤说明了如何使用 Onnx Parser 和 Python API 直接导入 ONNX 模型。

一般来说，较新版本的OnnxParser是为了向后兼容而设计的，因此，遇到较早版本的ONNX导出器制作的模型文件应该不会有问题。可能会有一些例外情况，当变化不向后兼容时。在这种情况下，请将早期的ONNX模型文件转换为后期支持的版本。有关此问题的更多信息，请参见 ONNX Model Opset Version Converter。

用户模型也有可能是由支持比TensorRT附带的ONNX解析器更晚的opset的导出工具生成的。在这种情况下，请检查发布到 GitHub 的最新版本 TensorRT onnx-tensorrt 是否支持所需版本。

支持的版本由 onnx_trt_backend.cpp 中的 BACKEND_OPSET_VERSION 变量定义。从GitHub下载并构建最新版本的ONNXTensorRT Parse。

在TensorRT 7.0中，ONNX解析器只支持full-dimensions mode，这意味着必须使用 explicitBatch flag set创建网络定义。有关详细信息，请参见 Working With Dynamic Shapes。

Procedure

Import TensorRT:
```
import tensorrt as trt
```

Create the builder, network, and parser:

EXPLICIT_BATCH = 1 << (int)(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH)
with trt.Builder(TRT_LOGGER) as builder, builder.create_network(EXPLICIT_BATCH) as     network, trt.OnnxParser(network, TRT_LOGGER) as parser:
with open(model_path, 'rb') as model:
if not parser.parse(model.read()):
    for error in range(parser.num_errors):
        print(parser.get_error(error))

3.2.6. Importing From PyTorch And Other Frameworks

使用 TensorRT 与 PyTorch (或任何其他具有 NumPy 兼容权重的框架) 涉及使用 TensorRT API复制网络架构， (请参阅 Creating A Network Definition From Scratch Using The Python API)，然后从 PyTorch 复制权重。如需了解更多信息，请参阅 Working With PyTorch And Other Frameworks。

要执行推理，请按照Performing Inference In Python中概述的说明进行。

3.3. Building An Engine In Python

构建器的功能之一是在其CUDA内核目录中搜索最快的实现，因此有必要使用相同的GPU进行构建，就像优化引擎将在其上运行一样。

IBuilderConfig有很多属性，你可以设置这些属性来控制网络运行的精度，以及自动调优参数，比如TensorRT在确定哪个内核最快时，应该给每个内核计时多少次（迭代次数越多，运行时间越长，但对噪声的敏感度越低），你还可以查询builder，找出硬件本机支持的混合精度类型。

一个特别重要的属性是最大工作空间大小(maximum workspace size)。

Layer algorithms通常需要临时工作空间。这个参数限制了网络中任何层可以使用的最大尺寸。如果提供的scratch 不足，TensorRT有可能无法找到给定层的实现。

For more information about building an engine in Python, see the Introduction To Importing Caffe, TensorFlow And ONNX Models Into TensorRT Using Python

Procedure

Build the engine using the builder object:

with trt.Builder(TRT_LOGGER) as builder, builder.create_builder_config() as config:
    config.max_workspace_size = 1 << 20 # This determines the amount of memory 		# available to the builder when building an optimized engine and should 		# generally be set as high as possible.
    with builder.build_engine(network, config) as engine:

# Do inference here.

当engine建立后，TensorRT会对权重进行复制。

要执行推理，请遵循在Performing Inference In Python中概述的说明。

3.4. Serializing A Model In Python

从这里开始，您可以序列化engine，也可以直接使用engine进行推理。在使用模型进行推理之前，序列化和反序列化(Serializing and deserializing)模型是可选的步骤—如果需要，可以直接使用engine对象进行推理。

序列化时，您正在将engine转换为一种格式，以便在以后进行推理时存储和使用。要用于推断，只需反序列化engine(deserialize the engine)。序列化和反序列化是可选的。由于从网络定义创建engine可能非常耗时，因此可以避免每次应用程序重新运行时都重新生成engine，方法是将其序列化一次，并在推断时反序列化。因此，在构建engine之后，用户通常希望将其序列化，以便以后使用。

注意:序列化engine不能跨平台或TensorRT版本移植。除了平台和TensorRT版本之外，engine是特定于它们所建立的GPU模型的。

将模型序列化为一个modelstream:
```
serialized_engine = engine.serialize()
```

反序列化modelstream来执行推理。反序列化需要创建一个运行时对象:

with trt.Runtime(TRT_LOGGER) as runtime:    
	engine = runtime.deserialize_cuda_engine(serialized_engine)

也可以将序列化的engine保存到文件中，并从文件中读回。

Serialize the engine and write to a file:

with open(“sample.engine”, “wb”) as f:
		f.write(engine.serialize())

Read the engine from the file and deserialize:

with open(“sample.engine”, “rb”) as f, trt.Runtime(TRT_LOGGER) as runtime:
		engine = runtime.deserialize_cuda_engine(f.read())

3.5. Performing Inference In Python

下面的步骤说明了如何在Python中执行推理，现在你已经有了一个engine。

为输入和输出分配一些主机和设备buffer。这个例子假设context.all_binding_dimensions == True，并且engine在binding_index=0处有一个输入，在binding_index=1处有一个输出。

# Determine dimensions and create page-locked memory buffers (i.e. won't be swapped #to disk) to hold host inputs/outputs.
		h_input = cuda.pagelocked_empty(trt.volume(context.get_binding_shape(0)), 				dtype=np.float32)
		h_output = cuda.pagelocked_empty(trt.volume(context.get_binding_shape(1)), 				 dtype=np.float32)
		# Allocate device memory for inputs and outputs.
		d_input = cuda.mem_alloc(h_input.nbytes)
		d_output = cuda.mem_alloc(h_output.nbytes)
		# Create a stream in which to copy inputs/outputs and run inference.
		stream = cuda.Stream()

创建一些空间来存储中间激活值。由于engine 持有网络定义和训练参数，因此需要额外的空间。这些都是在execution context中保存的。

with engine.create_execution_context() as context:
		# Transfer input data to the GPU.
		cuda.memcpy_htod_async(d_input, h_input, stream)
		# Run inference.
		context.execute_async_v2(bindings=[int(d_input), int(d_output)], stream_handle=stream.handle)
		# Transfer predictions back from the GPU.
		cuda.memcpy_dtoh_async(h_output, d_output, stream)
		# Synchronize the stream
		stream.synchronize()
		# Return the host output. 
return h_output

一个engine可以有多个execution contexts，允许将一组权重用于多个重叠的推理任务。例如，您可以使用一个engine和one context per stream在并行的CUDA流中处理图像。每个context 将在与engine相同的GPU上创建。

4. Extending TensorRT With Custom Layers

NVIDIA® TensorRT™支持多种类型的层，其功能也在不断扩展；但是，在某些情况下，所支持的层可能无法满足模型的特定需求。

在这种情况下，用户可以通过使用C++和Python API的IPluginV2Ext类实现自定义层来扩展TensorRT功能。自定义层，通常被称为plugins，由应用程序实现和实例化，它们的生存期必须在TensorRT engine中使用( and their lifetime must span their use within a TensorRT engine)。

TensorRT层（不包括TopK）预计将以zero workspace size工作，然而，如果没有使用zero workspaces的实现，则可能忽略所要求的精度。在后一种情况下，即使精度设置为其他，该层也会在FP32上运行。

4.2. Adding Custom Layers Using The Python API

虽然C++ API是实现自定义层的首选语言；但由于可以轻松访问CUDA和cuDNN等库，您可以在Python应用程序中使用自定义层。

您可以使用 C++ API 创建一个自定义层，使用pythd11在python中打包该层，然后将插件加载到 Python 应用程序中。更多信息，请参见Creating A Network Definition In Python。

4.2.1. Example: Adding A Custom Layer to a TensorRT Network Using Python

可以使用插件节点(plugin nodes)将自定义层添加到Python中的任何TensorRT网络中。

Python API 有一个叫做 add_plugin_v2的函数，它可以让你向网络中添加一个插件节点。下面的例子说明了这一点。它创建了一个简单的TensorRT网络，并通过查找TensorRT Plugin Registry添加了一个Leaky ReLU插件节点。

import numpy as np

TRT_LOGGER = trt.Logger()

trt.init_libnvinfer_plugins(TRT_LOGGER, '')
PLUGIN_CREATORS = trt.get_plugin_registry().plugin_creator_list

def get_trt_plugin(plugin_name):
        plugin = None
        for plugin_creator in PLUGIN_CREATORS:
            if plugin_creator.name == plugin_name:
                lrelu_slope_field = trt.PluginField("neg_slope", np.array([0.1], \							dtype=np.float32), trt.PluginFieldType.FLOAT32)
                field_collection = trt.PluginFieldCollection([lrelu_slope_field])
                plugin = plugin_creator.create_plugin(name=plugin_name, 									field_collection=field_collection)
        return plugin

def main():
    with trt.Builder(TRT_LOGGER) as builder, builder.create_network() as network:
        builder.max_workspace_size = 2**20
        input_layer = network.add_input(name="input_layer", dtype=trt.float32, shape=						(1, 1))
        lrelu = network.add_plugin_v2(inputs=[input_layer], 						   						   plugin=get_trt_plugin("LReLU_TRT"))
        lrelu.get_output(0).name = "outputs"
        network.mark_output(lrelu.get_output(0))

4.2.2. Example: Adding A Custom Layer That Is Not Supported In UFF Using Python

TensorFlow网络可以转换为UFF格式，并使用Python接口与TensorRT一起运行。

为了做到这一点，我们利用了GraphSurgeon API。如果你正在编写自己的插件，你需要用C++实现它，实现IPluginExt和IPluginCreator类，如： Example: Adding A Custom Layer Using C++.

下面的步骤说明了如何使用在TensorRT Plugin Registry注册的插件节点，使用UFF parser运行自定义图层。

Procedure

通过调用trt.init_libnvinfer_plugins(TRT_LOGGER, ‘’)来注册TensorRT插件（或者加载你已经注册了自己的插件的.so文件）。

准备网络并检查TensorFlow的输出:

tf_sess = tf.InteractiveSession()
tf_input = tf.placeholder(tf.float32, name="placeholder")
tf_lrelu = tf.nn.leaky_relu(tf_input, alpha=lrelu_alpha, name="tf_lrelu")
tf_result = tf_sess.run(tf_lrelu, feed_dict={tf_input: lrelu_args})
tf_sess.close()

准备namespace mappings。op name LReLU\TRT对应于TensorRT附带的Leaky ReLU plugin插件。

trt_lrelu = gs.create_plugin_node(name="trt_lrelu", op="LReLU_TRT", negSlope=lrelu_alpha)
namespace_plugin_map = {
            "tf_lrelu": trt_lrelu
 }

使用GraphSurgeon转换TensorFlow图并保存到UFF：

dynamic_graph = gs.DynamicGraph(tf_lrelu.graph)
dynamic_graph.collapse_namespaces(namespace_plugin_map)

运行UFF parse并将结果与TensorFlow进行比较：

uff_model = uff.from_tensorflow(dynamic_graph.as_graph_def(), ["trt_lrelu"], output_filename=model_path, text=True)
parser = trt.UffParser()
parser.register_input("placeholder", [lrelu_args.size])
parser.register_output("trt_lrelu")
parser.parse(model_path, trt_network)

For more information, see the Adding A Custom Layer To Your TensorFlow Network In TensorRT In Python (uff_custom_plugin) sample.

4.3. Using Custom Layers When Importing A Model From A Framework

TensorRT parse使用layer operation字段来标识网络中的特定层是否是支持TensorFlow的操作。

TensorFlow
与之前发布的TensorRT相比，TensorFlow中的自定义图层如何使用TensorRT UFF解析器运行有一些变化。对于TensorFlow模型，使用UFF转换器将你的图转换为UFF文件。在这个过程中，如果网络中包含插件层，还需要将这些层的操作字段映射到TensorRT中对应注册的插件名称。这些插件可以是TensorRT附带的插件，也可以是你编写的自定义插件。网络中的插件字段名也应该与插件所期望的字段相匹配。这可以使用GraphSurgeon来完成，正如在Preprocessing A TensorFlow Graph Using the Graph Surgeon API中所解释的那样，以及在位于GitHub仓库中的Object Detection With A TensorFlow SSD Network (sampleUffSSD)中所演示的那样，通过使用带有UFF转换器的配置文件来完成。

与TensorRT的早期版本相比，TensorFlow中的自定义层如何使用TensorRT UFF parser运行有一些变化。对于TensorFlow模型，使用UFF转换器将你的图转换为UFF文件。在此过程中，如果网络包含插件层，则还需要将这些层的operation字段映射到TensorRT中对应注册的插件名称。这些插件可以是TensorRT附带的插件，也可以是您编写的自定义插件。网络中的插件字段名称也应该与插件所期望的字段匹配。这可以使用GraphSurgeon来完成，如Preprocessing A TensorFlow Graph Using the Graph Surgeon API中所述，以及在位于GitHub仓库中的 Object Detection With A TensorFlow SSD Network (sampleUffSSD)中所演示的那样，通过使用带有UFF转换器的配置文件来完成。

UFF parser将为每个不支持的operation查找插件注册表。如果发现与任何已注册的插件名称匹配，parser将解析输入网络中的插件字段参数，并使用它们创建一个插件对象。然后将此对象添加到网络中。在以前版本的TensorRT中，您必须实现nvuffparser：：IPluginFactoryExt并手动将插件参数传递给createPlugin（…）函数。尽管这个流仍然可以使用，但是对于插件API的新添加，它不再是必需的。有关详细信息，请参阅：

IPluginV2Ext and IPluginCreator in the C++ API
IPluginV2Ext and IPluginCreator in the Python API

ONNX

对于ONNX模型，ONNX parse将自动尝试将无法识别的ops 作为插件导入。如果在注册表中找到与该节点具有相同 op_type的插件，解析器将从ONNX模型中解析插件字段参数，并使用相应的creator 创建一个plugin实例。默认情况下，它将尝试加载plugin version 1。可以通过在相应的ONNX节点中设置plugin_version字符串参数来重写这种行为。

在某些情况下，您可能希望在将ONNX graph导入TensorRT之前对其进行修改；例如，添加上面提到的plugin_version属性，或者用plugin节点替换一组ops。要实现这一点，您可以使用 ONNX GraphSurgeon 实用程序。

For the Python usage of custom layers with TensorRT, refer to:

Adding A Custom Layer To Your TensorFlow Network In TensorRT In Python (uff_custom_plugin) and Object Detection With SSD In Python (uff_ssd) samples for UFF networks
TensorRT Inference Of ONNX Models With Custom Layers (onnx_packnet) sample for ONNX

4.3.1. Example: Adding A Custom Layer To A TensorFlow Model

为了使用TensorRT运行TensorFlow网络，必须首先将其转换为UFF格式。在转换过程中，可以使用graphsurgeon工具将自定义层标记为plugin 节点。

然后，UFF转换器将处理后的图转换为UFF格式，然后由UFF parser运行。然后由UFF parser将plugin 节点添加到TensorRT网络中。

For details using the Python API, see Example 2: Adding A Custom Layer That Is Not Supported In UFF Using Python. Additionally, the Object Detection With SSD In Python (uff_ssd) sample demonstrates an end-to-end workflow in Python for running TensorFlow object detection networks using TensorRT.

4.4. Plugin API Description

虽然IPluginV2和IPluginV2Ext接口仍然支持向后兼容TensorRT 5.1和6.0.x，但我们建议您编写新plugin 或重构现有plugin ，以IPluginV2DynamicExt或IPluginV2IOExt接口为目标，如第4.1节所述。
为了使用最新的Plugin层特性，您的自定义Plugin应该实现IPluginV2DynamicExt或IPluginV2IOExt接口。

The new features in

IPluginV2DynamicExt

are as follows:

virtual DimsExprs getOutputDimensions(int outputIndex, const DimsExprs* inputs, int nbInputs, IExprBuilder& exprBuilder) = 0;

virtual bool supportsFormatCombination(int pos, const PluginTensorDesc* inOut, int nbInputs, int nbOutputs) = 0;

virtual void configurePlugin(const DynamicPluginTensorDesc* in, int nbInputs, const DynamicPluginTensorDesc* out, int nbOutputs) = 0;

virtual size_t getWorkspaceSize(const PluginTensorDesc* inputs, int nbInputs, const PluginTensorDesc* outputs, int nbOutputs) const = 0;

virtual int enqueue(const PluginTensorDesc* inputDesc, const PluginTensorDesc* outputDesc, const void* const* inputs, void* const* outputs, void* workspace, cudaStream_t stream) = 0;

The new features in IPluginV2IOExt are as follows:

virtual void configurePlugin(const PluginTensorDesc* in, int nbInput, const PluginTensorDesc* out, int nbOutput) = 0;

virtual bool supportsFormatCombination(int pos, const PluginTensorDesc* inOut, int nbInputs, int nbOutputs) const = 0;

迁移到IPluginV2DynamicExt或IPluginV2IOExt的指南。

getOutputDimensions实现给定输入的输出张量维度的表达式。
supportsFormatCombination检查plugin是否支持指定输入/输出的格式和数据类型。
configurePlugin模仿IPluginV2Ext中等效configurePlugin的行为，但接受张量描述符(tensor descriptors)。
getWorkspaceSize和enqueue模仿IPluginV2Ext中等价API的行为，但接受张量描述符(tensor descriptors)。

See the API description in IPluginV2 API Description for more details about the API.

4.5. Best Practices For Custom Layers Plugin

Converting User-Defined Layers

要创建一个自定义层实现作为TensorRT plugin，你需要为你的plugin实现IPluginV2Ext类和IPluginCreator类。

For more information about both API classes, see Plugin API Description.

Using The UFF Plugin API

For an example of how to use plugins with UFF in both C++ and Python, see Example: Adding A Custom Layer Using C++ and Example: Adding A Custom Layer That Is Not Supported In UFF Using Python.

Debugging Custom Layer Issues

插件中分配的内存必须被释放，以确保不发生内存泄漏。如果资源是在initialize()函数中获取的，则需要在 terminate()函数中释放。所有其他的内存分配最好在插件类的destructor或destroy()方法中释放。Adding Custom Layers Using The C++ API详细概述了这一点，还提供了一些使用插件时的最佳实践注意事项。

5. Working With Mixed Precision

混合精度是指在一种计算方法中综合使用不同的数值精度。NVIDIA® TensorRT™可以以32位浮点、16位浮点或量化的8位整数来存储权重和激活以及execute层。

使用比FP32更低的精度可以减少内存的使用，从而可以部署更大的网络。数据传输所需时间更短，计算性能也会提高，特别是在该精度的Tensor Core支持的GPU上。

默认情况下，TensorRT使用FP32推理，但它也支持FP16和INT8。在运行FP16推理时，它会自动将FP32权重转换为FP16权重。

您可以使用以下API检查平台上支持的精度。

if (builder->platformHasFastFp16()) { … }; 
if (builder->platformHasFastInt8()) { … };

指定网络的精度可定义应用程序的最小可接受精度。如果对于某些特定的内核参数集，或者如果不存在较低精度的内核，则可以选择精度较高的内核。您可以设置生成器配置标志BuilderFlag:：kSTRICT\u TYPES来强制网络或层精度，这可能没有最佳性能。仅建议出于调试目的使用此标志。

如果平台支持，你也可以选择同时设置INT8和FP16模式。同时使用INT8和FP16模式将允许TensorRT从FP32、FP16和INT8内核中选择，从而从推理中得到最优化的引擎。

Mixed Precision Using The Python API

5.2.1. Setting The Layer Precision Using Python

In Python, you can specify the layer precision using the precision flag:

layer.precision = trt.int8

你可以设置输出张量数据类型，以符合层的实现。

layer.set_output_type(out_tensor_index, trt.int8)

Ensure that the builder understands to force the precision:

builder.strict_type_constraints = true

For more information, see the INT8 Calibration In Python (int8_caffe_mnist) sample.

5.2.2. Enabling FP16 Inference Using Python

In Python, set the fp16_mode flag as follows:

builder.fp16_mode = True

Force 16-bit precision by setting the builder flag:

builder.strict_type_constraints = True

5.2.3. Enabling INT8 Inference Using Python

Enable INT8 mode by setting the builder flag:

builder.int8_mode = True

与C++ API类似，您可以使用动态范围或使用ITE8校准来选择每激活张量的动态范围。

INT8校准可以与动态范围API一起使用。手动设置动态范围将覆盖INT8校准生成的动态范围。

5.2.3.1. Setting Per-Tensor Dynamic Range Using Python

为了执行INT8推理，您必须为每个网络张量设置动态范围。您可以使用不同的方法来推导动态范围值，包括量化感知训练或简单地记录每个张量在上一个训练时段的最小值和最大值。要设置动态范围，请使用:

layer = network[layer_index]
tensor = layer.get_output(output_index)
tensor.dynamic_range = (min_float, max_float)

您还需要设置网络输入的动态范围。

input_tensor = network.get_input(input_index)
input_tensor.dynamic_range = (min_float, max_float)

5.2.3.2. INT8 Calibration Using Python

INT8校准提供了一种替代方法来生成每个激活张量的动态范围。这种方法可以被归类为后训练技术，以生成适当的量化尺度。下面的步骤说明了如何使用Python API创建一个INT8 calibrator 对象。默认情况下，TensorRT支持INT8校准。

Procedure

Import TensorRT:
```
import tensorrt as trt
```
与test/validation文件类似，使用一组输入文件作为校准文件数据集。确保校准文件代表整个推断数据文件。为了让TensorRT使用校准文件，我们需要创建一个batchstream对象。batchstream对象将用于configure the calibrator。
```
NUM_IMAGES_PER_BATCH = 5
batchstream = ImageBatchStream(NUM_IMAGES_PER_BATCH, calibration_files)
```
Create an Int8_calibrator object with input nodes names and batch stream:
```
Int8_calibrator = EntropyCalibrator(["input_node_name"], batchstream)
```
Set INT8 mode and INT8 calibrator:
```
config.set_flag(trt.BuilderFlag.INT8)
config.int8_calibrator = Int8_calibrator
```
其余的engine创建和推理逻辑类似于 Importing From ONNX Using Python.

5.2.4. Working With Explicit Precision Using Python

要使用Python API创建一个显式精度网络，请将EXPLICIT_PRECISION标志传递给构建器。

network_creation_flag = 1 << int(trt.NetworkDefinitionCreationFlag.EXPLICIT_PRECISION)
self.network = self.builder.create_network(network_creation_flag)

See Setting The Layer Precision Using Python for more information on setting the precision.

6. Working With Reformat-Free Network I/O Tensors

Requirements from Automotive Safety Integrity Level ，要求从NvMedia DLA安全路径中删除对GPU地址空间的访问。为了实现这一目标，引入了免重新格式化的网络I/O tensors，让您可以在将数据传递给NVIDIA® TensorRT™之前，指定NvMedia tensor所支持的I/O格式。

另一方面，由于小于6.0.1的TensorRT假设网络I/O tensors是FP32，因此张量重格式化的潜在开销会导致性能问题。在多个TensorRT子网络嵌入到一个大型网络的情况下，（例如，TensorFlow），精度为INT8或FP16，不可避免的从FP32到FP32的I/O重新格式化可能会浪费大量的内存流量时间。同样的问题也可能发生在用户定义的插件上。现在您可以明确地将网络I/O tensors指定为INT8或FP16格式，以消除这些不必要的重新格式化。

6.1. Building An Engine With Reformat-Free Network I/O Tensors

您可以使用以下API来指定网络I/O tensors的格式。

Python API:

network.get_input(0).allowed_formats = formats
network.get_output(0).allowed_formats = formats

6.3. Calibration For A Network With INT8 I/O Tensors

INT8 I/O tensors支持INT8自动校准。在这种情况下，您需要为校准提供FP32数据，为推理提供INT8 I/O tensors。

使用INT8 I/O网络，TensorRT希望校准数据达到FP32精度，以生成校准缓存。在使用INT8 I/O张量进行推理期间，builder将在内部使用校准缓存数据。

INT8 I/O网络需要FP32校准数据的这种限制将在未来的版本中放宽。现在，您只需将INT8 I/O校准数据转换为FP32精度即可创建FP32校准数据。您还应确保FP32 cast校准数据应在[-128.0f，127.0f]范围内，并且可以转换为INT8数据而不会造成任何精度损失。

为具有INT8 I/O Tensors的网络设置校准器与具有FP32 I/O Tensors的网络完全相同。

7. Working With Dynamic Shapes

动态形状是指在运行前推迟指定部分或全部张量尺寸的能力。动态形状可以通过C++和Python接口来使用。
下面的章节提供了更多的细节，但是，这里是一个关于使用动态形状构建引擎的步骤的概述。

Dynamic shapes是指在运行前推迟指定部分或全部张量尺寸的能力。

以下各节提供了更详细的信息；但是，下面概述了使用Dynamic shapes构建engine的步骤：

网络定义不能有隐式batch维度。

C++

创建INetworkDefinition的方法是调用

IBuilder::createNetworkV2(1U <<
        static_cast(NetworkDefinitionCreationFlag::kEXPLICIT_BATCH))

Python

创建tensorrt.INetworkDefinition的方法是调用

create_network(1 <<
        int(tensorrt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH))

这些调用要求网络没有隐含的batch维度。

通过使用-1作为维度的占位符来指定输入张量的每个运行时维度。
在构建时指定一个或多个optimization profiles，这些optimization profiles指定了具有运行时维度的输入指定允许的维度范围，以及auto-tuner应该优化的维度。更多信息，请参见Optimization Profiles。
To use the engine:
a. 从engine创建execution context，和没有dynamic shapes一样。
b. 从步骤3中指定包含输入维度的optimization profiles。
c. 指定execution context的输入维度。设置输入维度后，可以得到TensorRT为给定输入维度计算的输出维度。
d. 排队工作(Enqueue work).

要更改运行时维度，请重复步骤4b和4c，在输入维度更改之前不必重复这些步骤。

7.1. Specifying Runtime Dimensions

你可能感兴趣的:(TensorRT教程)

三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
淘宝内部优惠劵领取教程，淘宝内部优惠劵软件使用方法！测评君高省
淘宝优惠券一般分为2种：第1种：是你在淘宝上买东西经常能看到的那种店铺优惠券，商家主动将一些有门槛的优惠券摆在旁边，这种券一般需要你满足消费金额或者去邀请好友才能减个几块钱。第2种：就是淘宝内部优惠券，商家为了打造爆款时会低价促销从而发放一些低价优惠券，只要下单就能立减，而且优惠的金额都非常高。但是为了控制成本并设置一定的销售目标，一旦达成预订销售额，就会停止发送优惠券。优惠劵导购平台哪个好？今天
Selenium基础教程 lemontree1945 selenium python 测试工具
1.Selenium环境安装1.1浏览器安装Chrome和ChromeDriver下载地址:https://googlechromelabs.github.io/chrome-for-testing/注意：驱动版本号要和浏览器版本号一致；安装后关闭浏览器自动更新:services.msc:打开系统服务找到和google相关的服务，全部修改为禁用1.2安装第三方库seleniumpipinstall
京东优惠劵在哪领取，分享京东优惠劵领取渠道使用教程氧惠全网优惠
大家好，我是氧惠遇见晴空，很多人京东优惠劵在哪领，在哪可以领取京东大额优惠劵，今天把方法分享给大家；一、京东app领券中心可以选择自己想要的类别查看，很多实用的券。还有几个整点的秒杀券，一般都是全品券之类的含金量很高的券。大家可以多多关注领券中心。如果没有时间盯着、不知道哪些券有用的话，可以加一些购物群，有好券会及时提醒领，但是我建议大家使用下面的方法更划算！二、氧惠app，（邀请码111999）
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
搭建云手机教程云博客-资源宝智能手机
搭建云手机教程本教程由分享：ziyouhua资源宝整理分享：www.httple.net首先检查自己vps是否支持这个项目sudoaptinstallcpu-checkerkvm-ok如果显示INFO:/dev/kvmexistsKVMaccelerationcanbeused表示支持，可以继续往下看ac13首先安装dockercurl-fsSLhttps://get.docker.com|sud
最新二级域名分发系统网站源码可商用 huihuixxx 程序源码小鬼授权系统源码全解密源码授权代码二级域名分发系统网站源码
介绍：1.源码楼主网上买的没有后门是旧版本2.支付接口调用的是码支付来进行的3.支付接口需要登陆管理员后台安装4.支付接口必须信息正确只能装一次5.在线充值默认的充值比例是1：1【搭建教程】1.把源码上传主机并解压2.绑定根目录和域名并解析3.访问你的域名即可提示安装4.后台登陆地址：你的域名/admin5.登陆后台安装你的支付接口（需要的话）6.码支付怎么使用方法百度一下！网盘下载地址：http
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
2025最新系统 Git 教程（七）（完结）嘿rasa 2025最新教程系列 git
第4章分布式Git4.1分布式Git-分布式工作流程你现在拥有了一个远程Git版本库，能为所有开发者共享代码提供服务，在一个本地工作流程下，你也已经熟悉了基本Git命令。你现在可以学习如何利用Git提供的一些分布式工作流程了。这一章中，你将会学习如何作为贡献者或整合者，在一个分布式协作的环境中使用Git。你会学习为一个项目成功地贡献代码，并接触一些最佳实践方式，让你和项目的维护者能轻松地完成这个过
2025最新Mybatis-plus教程（二）
三、CRUD（一）BaseMapper接口方法介绍BaseMapper中提供了crud方法，具体方法如下：//插入一条记录intinsert(Tentity);//根据entity条件，删除记录intdelete(@Param(Constants.WRAPPER)Wrapperwrapper);//删除（根据ID批量删除）intdeleteBatchIds(@Param(Constants.COL
2025最新Mybatis-plus教程（四）
五、MyBatis-Plus的service封装（一）通用Service简介MyBatis-Plus除了通用的Mapper还有通用的Service层，这也减少了相对应的代码工作量，把通用的接口提取到公共。其实按照mp的这种思想，可以自己也实现一些通用的Controller。（二）通用Service方法介绍/***插入一条记录（选择字段，策略插入）**@paramentity实体对象*/defaul
2025最新Mybatis-plus教程（三）
四、MyBatis-Plus条件构造器（一）条件构造器介绍在MyBatis-Plus中提了构造条件的类Wrapper，它可以根据自己的意图定义我们需要的条件。Wrapper是一个抽象类，一般情况下我们用它的子类QueryWrapper来实现自定义条件查询。（二）selectOne方法@TestpublicvoidtestSelectOne(){ QueryWrapperqueryWrapper=n
高省邀请码怎么获得?邀请码填写步骤教学! 柚子导师
今天说说：高省邀请码千万不要随便填写,不然会后悔！高省邀请码怎么获取高省邀请码多少?官方邀请码及邀请码填写教程高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码【555555这个是花桃APP的佣金比高省高出一倍】，注册送2皇冠会员，送万元推广大
实时行情接口使用教程 kk_stoper 区块链 python 开发语言后端数据结构
市场数据接口主要分为实时行情接口和延时行情接口两种。它们最根本的区别在于数据更新的频率和时效性。延时行情，顾名思义，提供的是滞后于市场真实情况的数据，通常会有10到15分钟的时间延迟。这种延迟意味着你看到的价格和交易量并不是此刻市场上的最新数据。而实时行情则能提供几乎没有延迟的、毫秒级别的最新报价和交易信息。这种瞬间性对于交易者而言至关重要，因为市场的微小变动都可能影响交易结果。因此，选择哪种接口
2025 最强 Agent 智能体学习笔记 (71) 一刀7段学习笔记人工智能
Agent智能体的系统学习与职业发展核心内容概览本集是《2025最强Agent智能体全套教程》的第72集，聚焦Agent智能体领域的系统学习方法与职业发展路径，系统梳理了从入门到专家的能力体系、关键学习资源、职业方向选择及行业发展机遇。内容结合技术趋势与职场需求，为不同背景的学习者（学生、开发者、转行人士）提供清晰的成长蓝图，帮助其在Agent智能体领域高效成长，实现职业目标。系统学习的能力体系与
Mac安装navicat17版本教程mac下载Navicat Premium for Mac v17.1.9【好用】光头才能变强 Mac软件 macos navicat
Mac安装NavicatPremiumforMacv17.1.9【亲测】安装提示“已损坏无法打开，你应该将它移到废纸篓！”肯定还有朋友走完上面流程还是不行安装包获取今天给大家分享下Mac系统安装navicat17.1.9版本，文末下载安装包！亲测好用，旧版本的还保存不了密码，这个版本很稳定！安装直接双击打开下载的安装包左侧应用拖入右侧文件夹提示“已损坏无法打开，你应该将它移到废纸篓！”别慌，接着往
ESP32-s3开发板按键中断处理详解 - 从零开始实现Boot按键功能
ESP32-s3开发板按键中断处理详解-从零开始实现Boot按键功能前言各位小伙伴们好！今天给大家带来一篇ESP32开发板上按键中断处理的干货教程。在嵌入式开发中，按键是最基础但也最常用的输入方式，掌握了按键中断的处理，你就能实现更加灵活的人机交互功能。本文将带你一步步实现ESP32开发板上Boot按键的中断检测功能，希望能对你的项目开发有所帮助！目录开发环境准备按键硬件介绍官方示例代码运行从零创
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
9、Docker Compose 实战小醉你真好 #部署不求人 docker 容器运维
DockerCompose实战教程（含完整Nginx案例+配置项详解）适合读者：开发者、后端工程师、运维工程师、初学者环境要求：CentOS9+Docker已安装教程亮点：实战驱动、配置项详解、挂载说明、可直接复制使用标签：#Docker#DockerCompose#运维实战#Nginx部署一、什么是DockerCompose？DockerCompose是Docker官方推出的多容器应用编排工具，
CentOS 7 安装最新版Docker教程朽～ docker centos
CentOS7Docker安装教程1、更新yum2、安装`yum-utils`3、通过`yum-config-manager`添加dockerrepository4、安装docker4.1、直接安装最新版本4.2、或者安装指定版本5、启动docker6、测试7、卸载dockerdocker安装官方文档：InstallDockerEngineonCentOS1、更新yumyumupdate-y2、安
Navicat Premium 17.1 的详细使用教程春云资源 mysql
下载地址：NavicatPremium17.1最新官方版|春云资源#NavicatPremium17.1功能全解析与使用教程指南在当今数字化的时代，数据库管理的高效性与便捷性成为众多企业和开发者追求的目标。NavicatPremium17.1作为一款备受瞩目的数据库管理工具，以其强大的功能和友好的用户界面脱颖而出。以下将为您详细介绍其使用方法，助力您轻松驾驭数据库管理工作。##一、下载与安装流程开
＜六＞ CentOS 8 配置YUM源超详细教程（本地源+网络源）随风fraya Docker centos 网络 linux
一、本地YUM源配置（离线环境适用）1.挂载ISO镜像创建挂载目录并执行挂载命令：sudomkdir-p/mnt/cdrom sudomount/app/CentOS-8.1.1911-x86_64-dvd1.iso/mnt/cdrom #mount后第一个参数为ISO文件路径，也可替换为/dev/sr0为光驱设备注意：若提示设备未就绪，需检查虚拟机光驱设置或ISO文件完整性13。2.配置仓库文件
Nvivo20 中文版安装包免费下载附详细安装教程|Nvivo20软件下载
[下载通道]:迅雷网盘[下载链接]:点击高速下载https://pan.xunlei.com/s/VOWJoryt_BBFsPixpPJxB1f0A1?pwd=5cei#⚠️:先用手机下载迅雷网盘保存到手机中，再用电脑登录下载，否则下载后文件容易报错❗保存的朋友点赞支持一下❗更多免费软件，影视，歌曲，游戏点这里https://docs.qq.com/sheet/DRkdWVFFCWm9UeGJP?
不会PS也不会建模，却想把敦煌鸣沙山塞进小方块里！自律的音律
掐指一算，好像很久没出特殊玩法的教程了~刚好前几天有小伙伴提问：有没有立体图表可以参考一下？由此延伸到以前发的一篇文章，里面整合了一些高质量的立体图表：我知道，PPT自带的图表你已经看腻了，是时候养养眼啦！那么问题来了，文章中的这种效果，要是只会PPT能不能做？经过@隔壁家老廖的提醒，通过关键词microworld找到了一些参考图：仔细想了想，似乎也没有很难，主要是用到了裸眼3D效果，结合切面光影
LLaMA-Factory微调教程1：LLaMA-Factory安装及使用 Cachel wood LLM和AIGC llama python 开发语言 react.js javascript 前端 microsoft
文章目录环境搭建LLaMA-Factory安装教程模型大小选择环境搭建Windows系统RTX4060Ti（16G显存）python3.10cuda=12.6cudnntorch==2.7.1+cu126torchvision==0.22.1+cu126torchaudio==2.7.1+cu126PSC:\Users\18098>nvidia-smiTueJul2201:52:192025+<
GIT教程+面试问答（完整） Little_monster. 代码版本控制工具 git
GIT文章目录GITGit笔记git的安装git的使用使用前配置gitconfig--globaluser.name提交人姓名gitconfig--globaluser.email提交人邮箱查看配置信息：gitconfig--list面试问答什么是git，git与svn有什么不同？git有哪些常用的图形界面客户端工具？在线Git代码托管平台有哪些？git的基本使用（常用命令）？Git笔记git的安
Grid布局参考资料 kiterumer
Grid布局张鑫旭-写给自己看的display:grid布局教程阮一峰-CSSGrid网格布局教程在Grid布局中，float，display:inline-block，display:table-cell，vertical-align以及column-*这些属性和声明对grid子项是没有任何作用的。这个可以说是Grid布局中的常识，面试经常会问的，一定要记得。Grid布局则适用于更大规模的布局（
基于RSS与KNN的室内定位技术实现火箭统
本文还有配套的精品资源，点击获取简介：室内定位技术对于智能建筑和物联网至关重要，在没有GPS信号的环境中尤其重要。RSS位置指纹法利用特定位置的无线信号强度来确定设备位置，而KNN算法能够基于信号强度找到最近的已知位置进行预测。本教程详细讲解了如何在MATLAB中通过”positioning_simulation.m”代码实现RSS位置指纹法与KNN算法的结合，涵盖数据预处理、算法实现、位置预测、
DevOps CI/CD流水线配置实战：GitHub Actions与Jenkins详细教程火烧屁屁lo devops ci/cd github
现代软件开发中，持续集成与持续交付（CI/CD）是DevOps核心实践。通过自动化构建、测试和部署流程，团队能够快速交付高质量软件。本文将深入探讨两种主流工具（GitHubActions和Jenkins）的配置方法，并提供完整代码示例。GitHubActions配置指南GitHubActions是GitHub原生的CI/CD工具，直接集成在代码仓库中。以下为典型工作流配置：创建基础工作流文件在项目
Langchain学习笔记(十)：文档加载与处理详解
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建基于大语言模型的应用时，文档处理是一个至关重要的环节。无论是构建RAG（检索增强生成）系统，还是进行知识库问答，我们都需要将各种格式的文档转换为模型可以理解和处理的形式。Langchain提供了强大的文档加载和处理功能，支持多种文件格式，并提
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep