python打卡day7

总结日

1.day1-3

认识了python语言的变量与输出

格式化字符串

变量的基础运算

字符串的拼接与裁剪,列表的操作

循环、判断语句

a=1
b=1
c=1
print(a)
print(b)
print(c)

name = "小明"
city = "北京"
print(f"我的名字是{name},我住在{city}。")

num1 = 20
num2 = 8

a = num1 + num2  # 计算和
b = num1 / num2  # 计算商
c = num1 % num2  # 计算余数

# 使用f-string分三行打印结果
print(f"{num1} 加 {num2} 的结果是:{a}")
print(f"{num1} 除以 {num2} 的商是:{b}") 
print(f"{num1} 除以 {num2} 的余数是:{c}")

tech_list = ["Python", "Java", "Go"]

# 2. 获取第一个元素
first_tech = tech_list[0]

# 3. 向列表末尾添加新元素
tech_list.append("JavaScript")

# 4. 修改第二个元素
tech_list[1] = "Ruby"

# 5. 移除元素"Go"
tech_list.remove("Go")

# 6. 计算列表当前长度
current_length = len(tech_list)

# 7. 使用f-string打印结果
print(f"第一个技术是: {first_tech}")
print(f"当前列表长度: {current_length}")
print(f"最终列表内容: {tech_list}")

2.day4-5

学习了pandas库,datafram数据结构,即表格数据

数据的读取和查看,学习了pandas库中的方法和属性如获取列数据.columns

查找缺失值,并填补

离散特征的处理

独热编码

import pandas as pd
data = pd.read_csv(r'data.csv')
type(data)
data.isnull() 
data.head(10)
data.describe()   # 数值列的基本统计量
data.isnull().sum()      # 每列缺失值计数,sum方法为求每一列的和

# 接着之前的,对bool特征进行类型转换
for i in list_final:
    data[i] = data[i].astype(int) # 这里的i就是独热编码后的特征名
data.head()
data.dtypes
data.isnull().sum() # 统计每一列的缺失值个数
# 用均值填补
# 循环遍历这个列表中的每一列
for i in data.columns:
    if data[i].isnull().sum() > 0: # 找到存在缺失值的列
        #计算该列的均值
        mean_value = data[i].mean()
        #用均值填充缺失值
        data[i].fillna(mean_value, inplace=True)

data.isnull().sum()

3.day6

单特征分布可视化

初步认识matplotli库及方法

绘制箱线图,直方图等图形直管描述某类特征的分布情况

#找到所有连续特征值
continuous_features =[]#定义空列表,承载连续特征
for i in data.columns:
    if data[i].dtype != 'object':
        continuous_features.append(i)
        continuous_features

import seaborn as sns # 导入 seaborn 库,用于数据可视化
import matplotlib.pyplot as plt # 导入 matplotlib 库,用于数据可视化
import pandas as pd # 导入 pandas 库,用于数据处理和分析
 
sns.boxplot(x=data['Annual Income']) 
 # 绘制箱线图,用于查看数据的分布情况
plt.title('Annual Income 的箱线图') 
plt.xlabel('Annual income')    # 设置标题
plt.show()

import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

# 设置全局字体为支持中文的字体 (例如 SimHei)
plt.rcParams['font.sans-serif'] = ['SimHei']
# 解决负号'-'显示为方块的问题
plt.rcParams['axes.unicode_minus'] = False

sns.boxplot(x=data['Annual Income'])
plt.title('年收入 箱线图')  # 使用中文标题
plt.xlabel('年收入')      # 使用中文标签
plt.show()

@浙大疏锦行

你可能感兴趣的:(python学习打卡,python,开发语言,前端)