机器学习数据导入方法总结

1、通过标准Python库导入CSV文件

        python提供了一个标准类库CSV,用来处理CSV文件。其中reader()函数用来读入CSV.

        

from csv import reader
import numpy as np
#使用标准的Python类库导入CSV文件
filename='iris.csv'
with open(filename, 'rt') as raw_materials:
    readers=reader(raw_marerials,delimiter=',')
    x=list(readers)
    data=np.array(x).astype('float')
    print (data.shape)

2、通过Numpy导入CSV文件

         使用Numpy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,所有的数据结构(数据类型,例如:不能有的是float,有的是string)是一样的。

from numpy import loadtxt
filename='iris.csv'
with open(filename,'rt') as raw_data:
    data=loadtxt(raw_data,delimiter=',')
    print(data.shape)

3、通过Pandas导入CSV文件

通过pandas来导入csv文件要使用pandas.read_csv()函数。这个函数的返回值是DataFrame,可以方便的进行下一步的处理。这个函数名非常直观,便于代码的阅读和后续对数据的处理工作。在机器学习项目中,经常使用pandas来做数据的清洗和数据准备工作。

from pandas import read_csv
filename='iris.csv'
names=['separ-length','separ-width','petal-length','petal-width','class']
dataset=read_csv(filename,names=names)
print(dataset.shape)

 

你可能感兴趣的:(机器学习,机器学习,数据导入)