关于wandb: Network error的问题

关于wandb: Network error的问题

我的情况:

vscode远程服务器,服务器才重启过,wandb之前一直正常,重启后就出现错误:

wandb: Network error (ConnectionError), entering retry loop.
wandb: W&B API key is configured. Use wandb login --relogin to force relogin
wandb: Network error (ConnectionError), entering retry loop.

首先想着那就不上传到wandb了,采用了offline的方法(dryrun和offline两种都试了):

os.environ['WANDB_MODE'] = 'dryrun'
os.environ["WANDB_MODE"] = "offline"

这样可以正常运行,但是发现没有output.log文件生成,也就无法看到终端输出的那些信息


所以就开始排查网络的问题,在终端输入

ping www.baidu.com

报错ping: www.baidu.com: Temporary failure in name resolution
表明远程服务器的 DNS 配置存在问题,无法解析域名。这是导致 W&B 同步失败的根本原因。

解决方案

1.在终端输入

sudo nano /etc/resolv.conf

2.然后对文件进行修改,将原本的注释掉,加上:

nameserver 8.8.8.8

也就是这样:
关于wandb: Network error的问题_第1张图片
3.修改完成后,保存文件并退出 nano 编辑器,按 Ctrl + X 退出,然后按 Y 确认保存更改,再按 Enter 确定文件名。
现在再尝试ping www.baidu.com就可以成功啦

能够ping通网络之后,就可以正常使用wandb了

你可能感兴趣的:(一些小问题,linux)