1 数据可视化
画出散点图,还有折线图
导入我们的工具包
拿到我们的数据
把图画岀来
import matplotlib.pyplot as plt
year = [ 3,5,7,9]
pay = [25, 36 , 52, 69]
plt.plot(year, pay)
plt.show()
[
year = [ 3,5,7,9]
pay = [25, 36 , 52, 69]
#plt.scatter(X轴的数据, Y轴的数据)
plt.scatter(year, pay)
plt.show()
3. Python 数据可视化实战案例
观察世界人口变化的趋势数据可视化
导入工具包
拿到数据
把图画出来
3.1 添加 X轴的标签
3.2 添加Y轴的标签
3.3 添加图表的标题
year = [1950, 1951, 1952, 1953, 1954, 1955, 1956, 1957, 1958, 1959, 1960, 1961, 1962, 1963, 1964, 1965, 1966, 1967, 1968, 1969, 1970, 1971, 1972, 1973, 1974, 1975, 1976, 1977, 1978, 1979, 1980, 1981, 1982, 1983, 1984, 1985, 1986, 1987, 1988, 1989, 1990, 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020, 2021, 2022, 2023, 2024, 2025, 2026, 2027, 2028, 2029, 2030, 2031, 2032, 2033, 2034, 2035, 2036, 2037, 2038, 2039, 2040, 2041, 2042, 2043, 2044, 2045, 2046, 2047, 2048, 2049, 2050, 2051, 2052, 2053, 2054, 2055, 2056, 2057, 2058, 2059, 2060, 2061, 2062, 2063, 2064, 2065, 2066, 2067, 2068, 2069, 2070, 2071, 2072, 2073, 2074, 2075, 2076, 2077, 2078, 2079, 2080, 2081, 2082, 2083, 2084, 2085, 2086, 2087, 2088, 2089, 2090, 2091, 2092, 2093, 2094, 2095, 2096, 2097, 2098, 2099, 2100]
pop = [2.53, 2.57, 2.62, 2.67, 2.71, 2.76, 2.81, 2.86, 2.92, 2.97, 3.03, 3.08, 3.14, 3.2, 3.26, 3.33, 3.4, 3.47, 3.54, 3.62, 3.69, 3.77, 3.84, 3.92, 4.0, 4.07, 4.15, 4.22, 4.3, 4.37, 4.45, 4.53, 4.61, 4.69, 4.78, 4.86, 4.95, 5.05, 5.14, 5.23, 5.32, 5.41, 5.49, 5.58, 5.66, 5.74, 5.82, 5.9, 5.98, 6.05, 6.13, 6.2, 6.28, 6.36, 6.44, 6.51, 6.59, 6.67, 6.75, 6.83, 6.92, 7.0, 7.08, 7.16, 7.24, 7.32, 7.4, 7.48, 7.56, 7.64, 7.72, 7.79, 7.87, 7.94, 8.01, 8.08, 8.15, 8.22, 8.29, 8.36, 8.42, 8.49, 8.56, 8.62, 8.68, 8.74, 8.8, 8.86, 8.92, 8.98, 9.04, 9.09, 9.15, 9.2, 9.26, 9.31, 9.36, 9.41, 9.46, 9.5, 9.55, 9.6, 9.64, 9.68, 9.73, 9.77, 9.81, 9.85, 9.88, 9.92, 9.96, 9.99, 10.03, 10.06, 10.09, 10.13, 10.16, 10.19, 10.22, 10.25, 10.28, 10.31, 10.33, 10.36, 10.38, 10.41, 10.43, 10.46, 10.48, 10.5, 10.52, 10.55, 10.57, 10.59, 10.61, 10.63, 10.65, 10.66, 10.68, 10.7, 10.72, 10.73, 10.75, 10.77, 10.78, 10.79, 10.81, 10.82, 10.83, 10.84, 10.85]
import matplotlib.pyplot as plt
# 2. 拿到数据 year pop
# 3. 把图画出来(折线图) plot
plt.plot(year, pop)
plt.xlabel(‘year’)
#plt.ylabel(“标签的内容”)
plt.ylabel(‘pop’)
#plt.title(“标题的内容”)
plt.title(‘pop of world change with year’)
# plt.show()
Text(0.5, 1.0, ‘pop of world change with year’)
4. Python 中字典的使用
字典保存『多组』
用大括号来定义 {}
用逗号 , 来分隔每一组数据
{key1: value1, key2: value2, …}
world = {‘a’: 30, ‘b’: 27, ‘c’: 39}
world[‘a’]
30
6. Python 中字典的常规操作
查找
删除
增加
修改
你要对谁?进行什么操作
europe = {‘西班牙’:‘马德里’, ‘法国’:‘巴黎’,‘德国’:‘柏林’}
europe[‘法国’]
‘巴黎’
europe = {‘西班牙’:‘马德里’, ‘法国’:‘巴黎’,‘德国’:‘柏林’}
del(europe[‘法国’])
europe
{‘西班牙’: ‘马德里’, ‘德国’: ‘柏林’}
europe = {‘西班牙’:‘马德里’, ‘法国’:‘巴黎’,‘德国’:‘柏林’}
europe[“中国”] = “北京”
europe
{‘西班牙’: ‘马德里’, ‘法国’: ‘巴黎’, ‘德国’: ‘柏林’, ‘中国’: ‘北京’}
europe = {‘西班牙’:‘马德里’, ‘法国’:‘巴黎’,‘德国’:‘柏林’}
europe[‘法国’] = ‘维也纳’
europe
{‘西班牙’: ‘马德里’, ‘法国’: ‘维也纳’, ‘德国’: ‘柏林’}
7. Pandas 的基本使用
导入pandas
创建 Dataframe pd.Dataframe(字典)
names = [‘United States’, ‘Australia’, ‘Japan’, ‘India’, ‘Russia’, ‘Morocco’, ‘Egypt’]
cpc = [809, 731, 588, 18, 200, 70, 45]
dic = {“国家名称”: names, ‘汽车排放废气量’: cpc}
import pandas as pd
cars = pd.DataFrame(dic)
cars
国家名称 汽车排放废气量
0 United States 809
1 Australia 731
2 Japan 588
3 India 18
4 Russia 200
5 Morocco 70
6 Egypt 45
8. DataFrame 的查找
DataFrame[‘查询哪一列’][‘哪一行’]
names = [‘United States’, ‘Australia’, ‘Japan’, ‘India’, ‘Russia’, ‘Morocco’, ‘Egypt’]
cpc = [809, 731, 588, 18, 200, 70, 45]
dic = {“国家名称”: names, ‘汽车排放废气量’: cpc}
import pandas as pd
cars = pd.DataFrame(dic)
cars[‘汽车排放废气量’]
if 判断的条件:
执行的代码
if 判断的条件:
条件符合的时候执行的代码
else:
条件不符合的时候执行的代码
if 判斷的條件:
条件符合的时候执行的代码
elif 第二层判断的条件:
第二层条件符合的时候执行的代码
else:
条件不符合的时候执行的代码
a = 4
if a > 5:
print("比五大")
a = 2
if a > 5:
print('比五大')
else:
print('比五小')
比五小
a = 1
if a > 5:
print("比五大")
elif a == 5:
print("这就是五")
else:
print("比五小")
比五小
for 变量 in 要循环的目标:
要循环操作的代码
对于 list numpy 字典 pandas 进行遍历
a_list = [1,2,3]
for a in a_list:
print(a)
1
2
3
import numpy as np
np_a_list = np.array(a_list)
for a in np_a_list:
print(a)
1
2
3
europe = {‘西班牙’:‘马德里’, ‘法国’:‘巴黎’,‘德国’:‘柏林’}
for a in europe:
print(a)
西班牙
法国
德国
europe = {‘西班牙’:‘马德里’, ‘法国’:‘巴黎’,‘德国’:‘柏林’}
for a, b in europe.items():
print(a, b)
西班牙 马德里
法国 巴黎
德国 柏林
names = [‘United States’, ‘Australia’, ‘Japan’, ‘India’, ‘Russia’, ‘Morocco’, ‘Egypt’]
cpc = [809, 731, 588, 18, 200, 70, 45]
dic = {“国家名称”: names, ‘汽车排放废气量’: cpc}
import pandas as pd
cars = pd.DataFrame(dic)
for a, b in cars.iterrows():
print(a, b)
0 国家名称 United States
汽车排放废气量 809
Name: 0, dtype: object
1 国家名称 Australia
汽车排放废气量 731
Name: 1, dtype: object
2 国家名称 Japan
汽车排放废气量 588
Name: 2, dtype: object
3 国家名称 India
汽车排放废气量 18
Name: 3, dtype: object
4 国家名称 Russia
汽车排放废气量 200
Name: 4, dtype: object
5 国家名称 Morocco
汽车排放废气量 70
Name: 5, dtype: object
6 国家名称 Egypt
汽车排放废气量 45
Name: 6, dtype: object