vscode远程服务器,服务器才重启过,wandb之前一直正常,重启后就出现错误:
wandb: Network error (ConnectionError), entering retry loop.
wandb: W&B API key is configured. Use wandb login --relogin to force relogin
wandb: Network error (ConnectionError), entering retry loop.
首先想着那就不上传到wandb了,采用了offline的方法(dryrun和offline两种都试了):
os.environ['WANDB_MODE'] = 'dryrun'
os.environ["WANDB_MODE"] = "offline"
这样可以正常运行,但是发现没有output.log文件生成,也就无法看到终端输出的那些信息
所以就开始排查网络的问题,在终端输入
ping www.baidu.com
报错ping: www.baidu.com: Temporary failure in name resolution
表明远程服务器的 DNS 配置存在问题,无法解析域名。这是导致 W&B 同步失败的根本原因。
1.在终端输入
sudo nano /etc/resolv.conf
2.然后对文件进行修改,将原本的注释掉,加上:
nameserver 8.8.8.8
也就是这样:
3.修改完成后,保存文件并退出 nano 编辑器,按 Ctrl + X 退出,然后按 Y 确认保存更改,再按 Enter 确定文件名。
现在再尝试ping www.baidu.com就可以成功啦
能够ping通网络之后,就可以正常使用wandb了