day4 pandas学习

%pip install openxyxl

找一个自己觉得有意思的文件。我找的是成绩单来玩。

这节学的比较耗时了,大概用了60分钟。

import pandas as pd
data2 =pd.read_csv(r'D:\python代码区\代码随想录挑战-调试区\python训练营\1_计算类专业分流学生成绩排名.csv')
#print(data)
#print(type(data))
#print(data.isnull())
#print(data.head(3))
data =pd.read_excel(r'D:\python代码区\代码随想录挑战-调试区\python训练营\1_计算类专业分流学生成绩排名.xlsx')
#print(data2)
#print("!!!!")
#相等的
#print(data.equals(data2))
#每个元素筛查是否相等
#print(data==data2)
#print(data.info())
#print(data.shape)
#print(data.columns)
#print(data.describe())
#print(data2['学分加权平均分'].median())
#print(data.dtypes)
#print(data.info())
#print(data['学分加权平均分'])
#print(data.isnull().sum())
#print(data.dtypes)
#print(data['学分加权平均分'].isnull().sum())
way=3
if way==1:
    print(type(data['学分加权平均分']))
    median_score=data['学分加权平均分'].median()
    #print(median_score)
    data['学分加权平均分'].fillna(median_score,inplace=True)
#print(data.isnull().sum())
#当然也可以采用众数替换。
if way==2:
    print(type(data['学分加权平均分']))
    mode_score=data['学分加权平均分'].mode()
    print("look:",type(mode_score))
    print(mode_score[0])
    data['学分加权平均分'].fillna(mode_score[0],inplace=True)
print(data.isnull().sum())
#print(type(data.isnull()))
#print(data.columns)
#print(data.dtypes)
print(type(data.columns))
c=data.columns.tolist()
print(type(c))
for i in c:
    if data[i].dtype !='object':
        if data[i].isnull().sum()>0:
            mean_val=data[i].mean()
            data[i].fillna(mean_val,inplace=True)
print(data.isnull().sum())
print(data.dtypes)

@浙大疏锦行

python训练营介绍

你可能感兴趣的:(pandas,学习,python)