DtypeWarning: Columns (17) have mixed types. Specify dtype option on import or set low_memory=False.

参考:https://blog.csdn.net/virus111222/article/details/128134560

是一个警告,并不会影响程序的正常进行

出现的问题是一列中出现了多个数据类型,会在读取文件时出现问题,默认情况下,读取文件时会自动匹配占用存储最少的数据类型,如果一列出现多个数据类型,那么可能会造成数据的损失。

以上警告中也给出了两种解决办法:

1.Specify dtype option on import(在导入时指定dtype选项)

即在读取文件时制定列的数据类型

如:

dtypes={'order_id':'int32','user_id':'int32','skill_id':'int32','correct':'int8'}
train_df=pd.read_csv(config.FILE_PATH,dtype=dtypes)

2.set low_memory=False

low_memory的意思是低内存,读取文件时会自动匹配占用存储最少的数据类型

把 low_memory设置成False,就不会出现警告了

train_df = pd.read_csv(config.FILE_PATH,low_memory=False)

我采用了第二种方法,就是在读csv的时候,在结尾加上low_memory=False解决了这个问题

你可能感兴趣的:(python,linux,人工智能)