Object detection API 调试中的错误

Object detection API 调试中的错误

absl.flags._exceptions.UnparsedFlagAccessError: Trying to access flag –model_dir before flags were parsed.

使用更新后的API版本,运行model_main.py时 运行报错。
参考链接:https://github.com/tensorflow/models/issues/4794

2.使用回旧版本的API,运行模型时,加载速度特别慢,无法使用gpu。

Object detection API 调试中的错误_第1张图片
这个问题时好时坏,只要内存和gpu够用就不会报错了。

3.运行0.75depth的模型时,报错

Object detection API 调试中的错误_第2张图片

这是因为路径写错了 只写到train,应该是train/cpkt。

4.tensorflow和darknet不能同时使用。

tensorflow在默认情况下会占用所有的gpu,训练时指定使用哪块gpu即可。

方法1:
打开新的终端
CUDA_VISIBLE_DEVICES=1 python object_detection/train75.py

方法2:
export CUDA_VISIBLE_DEVICES=1
python object_detection/train75.py

5.训练过程中,保存checkpoint太频繁,浪费了大量的训练时间。

找到trainer.py下的saver函数,发现保存的时间是用这个参数控制的
Object detection API 调试中的错误_第3张图片
本来使用的默认值,我们给他重新定义下,train.config也是从默认的pipelineconfig读取的
于是在config文件中加入这一行,使他的保存时间为4小时保存一次。
Object detection API 调试中的错误_第4张图片

6.checkpoint保存一次要数十分钟,解决后速度提升不少,然而summary保存也很浪费时间,默认是2分钟一次,我们改为20分种一次,直接更改trainer.py下的参数即可。

Object detection API 调试中的错误_第5张图片

此时训练顺畅了许多,然而其中某些步骤训练时间很长,暂时找不到原因
Object detection API 调试中的错误_第6张图片

你可能感兴趣的:(深度学习)