Udacity 数据分析进阶课程笔记L40:特征缩放

  1. 通过衣服尺码的例子,介绍一种使用特征缩放的简单情况
  2. 一种简单的特征缩放公式(归一化)和实现


    Udacity 数据分析进阶课程笔记L40:特征缩放_第1张图片
    归一化特征缩放公式
# Python code
def featureScaling(arr):
    scale = max(arr) - min(arr)
    res = []
    for elem in arr:
        res.append( float(elem - min(arr))/scale )

    return res
  1. sklearn中的Min-Max Scalar特征缩放器
# 课程中与此例不同,直接使用了 fit_trasform() 函数
>>> from sklearn.preprocessing import MinMaxScaler
>>>
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler(copy=True, feature_range=(0, 1))
>>> print(scaler.data_max_)
[  1.  18.]
>>> print(scaler.transform(data))
[[ 0.    0.  ]
 [ 0.25  0.25]
 [ 0.5   0.5 ]
 [ 1.    1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[ 1.5  0. ]]
  1. 哪些算法的结果会收到特征缩放的影响?
    Udacity 数据分析进阶课程笔记L40:特征缩放_第2张图片
    image.png
  2. 特征缩放迷你项目。

你可能感兴趣的:(Udacity 数据分析进阶课程笔记L40:特征缩放)