python数据清洗

1.处理缺失值

string_data=pd.Series(['aardvark','artichoke',np.nan,'avocado'])
string_data.isnull()

NA 处理方法

dropna 过滤na
fillna 填充na,比如ffill,bfill
isnull 返回表明哪些值是缺失值的布尔值
notnull isnull的反函数

1.1过滤缺失值

data=pd.DataFrame([[1.,6.5,3.],[1.,NA,NA],[NA,NA,NA],[1.,NA,NA]])

cleaned=data.dropna() #删除包含有na的行

cleaned=data.dropna(h

你可能感兴趣的:(数据分析,python)