scrapy项目中pymysql与虚拟机mysql连接异常的解决方案-2004 time out连接

问题描述:

我们在python中使用scapy爬取数据后想要将数据存储到虚拟机的mysql数据库中,可以在scrapy项目中的settings.py文件中设置对应的数据库参数,但是我们在做好一切工作后依然会遇到报错,例如 2004 time out

注:本解决方案用到的虚拟机版本为CentOs7

解决方案:

1.以下是在scrapy项目中settings.py写入的内容

DB_HOST = '192.168.131.128'
DB_PORT = 3306

# USER要填数据库中赋予了远程连接的用户名
DB_USER = 'root'
# PASSWORD也是被允许远程连接的用户的密码
DB_PASSWORD = 'Hgy123456!'
DB_NAME = 'spider01'
DB_CHARSET = 'utf8'

2.配置root运行远程登录:

注意: 极易犯错!!!很多人在创建虚拟机mysql的初始用户时并没有赋予其远程连接的权限 在第一步中的 DB_USER 填入无远程连接权限的初始用户会报错 2004 time out ,默认情况下,root用户是不允许远程登录的,只允许在MySQL所在的Linux服务器登陆MySQL系统

2.1mysql8.0配置root运行远程登录

# 第一次设置root远程登录,并配置远程密码使用如下SQL命令

create user 'root'@'%' IDENTIFIED WITH mysql_native_password BY '密码';

# 密码需要符合:大于8位,有大写字母,有特殊符号,不能是连续的简单语句如123,abc

2.2mysql5.7配置root运行远程登录

grant all privileges on *.* to root@"IP地址" identified by '密码' with grant option;

# IP地址即允许登陆的IP地址,也可以填写%,表示允许任何地址
# 密码表示给远程登录独立设置密码,和本地登陆的密码可以不同

flush privileges;
# 刷新权限,生效

3.配置完远程登陆还有极其重要的一点:

确保用户 'root' 具有足够的权限来访问数据库 'spider01'
否则报错 1044, "Access denied for user 'root'@'%' to database 'spider01'"
这个错误意味着 MySQL 拒绝了用户 'root'@'%' 对数据库 'spider01' 的访问,因为该用户在尝试访问该数据库时没有足够的权限。

GRANT ALL PRIVILEGES ON spider01.* TO 'root'@'%';
FLUSH PRIVILEGES;
#这将为用户 'root' 授予对数据库 'spider01' 的完全权限,并刷新权限以使更改生效。

4.一定要关闭防火墙

否则报错 1045, "Access denied for user 'root'@'192.168.131.1' (using password: YES)"     

这个错误一般表示两点:

4.1检查防火墙和网络设置: 确保 MySQL 服务器所在的主机可以从 Scrapy 所在的主机访问,并且防火墙或网络设置没有阻止连接

A.直接关闭防火墙

systemctl stop firewalld
systemctl disable firewalld

 B.开放端口3306

firewall-cmd --state
# 检查当前防火墙的状态以及是否启用了防火墙
firewall-cmd --zone=public --add-port=3306/tcp --permanent
# 如果防火墙启用,需要允许 MySQL 端口(默认为 3306)的传入连接
firewall-cmd --reload
# 应用新的防火墙规则

4.2检查用户名和密码: 确保您在 Scrapy 中配置的 MySQL 连接信息中的用户名和密码是正确的,并且具有足够的权限来访问指定的数据库。

你可能感兴趣的:(scrapy,python,mysql,centos)