机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

1411-李同学

发表文章数:148

首页 » 算法 » 正文

特征的预处理: 对数据进行处理

机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

特征预处理的方法

通过特定的统计方法,将数据转换成算法要求的数据

数值型数据:标准缩放:

  • 归一化

  • 标准化

类别型数据:one-hot编码

时间类型:时间的切分

sklearn特征处理API

- sklearn.preprocessing

归一化

机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理
机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

sklearn.preprocessing.MinMaxScaler

机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理
机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

from sklearn.preprocessing import MinMaxScaler


def mm():
    #归一化处理
    mm=MinMaxScaler(feature_range=(2,3))

    data=mm.fit_transform([[90,2,10,40],[60,4,15,45],[75,3,13,46]])
    print(data)

    return None

if __name__=="__main__":
    mm()

机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理
机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

三个特征同等重要,进行归一化

机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

归一化的缺点:异常点对最大值与最小值产生影响

机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

标准化

机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理
机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理
机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理
机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

实例

from sklearn.preprocessing import MinMaxScaler,StandardScaler
def stand():
    #标准化缩放
    std=StandardScaler()

    data=std.fit_transform([[1.,-1.,3.],[2.,4.,2.],[4.,6.,-1.]])

    print(data)
if __name__=="__main__":
    stand()

机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理
机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

如何处理缺失值

机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理
机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理
机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

缺失值填补实例

from sklearn.impute import SimpleImputer
import numpy as np
def im():
    #缺失值
    im=SimpleImputer(missing_values=np.nan, strategy="mean")
    data=im.fit_transform([[1,2],[np.nan,3],[7,6]])
    print(data)
if __name__=="__main__":
    im()

机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理

未经允许不得转载:作者:1411-李同学, 转载或复制请以 超链接形式 并注明出处 拜师资源博客
原文地址:《机器学习算法基础(2):数据特征预处理:归一化,标准化以及缺失值处理》 发布于2020-12-06

分享到:
赞(0) 打赏

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu3.3主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录