Sklearn中Scale, Standardize, Normalize的区别


Update: 2020/05/04

根据@pleomax0730提供的信息,使用RobustScaler来处理outliers会更好一些。在这篇官网的文章中,Compare the effect of different scalers on data with outliers ,从不同scaler的分布图可以看出,StandardScaler,MinMaxScaler都会受到outliers的影响。这个时候使用RobustScaler会更好一些。


Scale, Standardize, or Normalize with Scikit-Learn:这篇文章总结得真好。下面一张图分析了MinMaxScaler, RobustScaler, StandardScaler, and Normalizer这四个的区别什么时候用。MinMaxScaler可以把数据缩小到一个范围内,保存原来的分布,但是对于outlier没有影响。StandardScaler会把数据的分布变为正态分布,对outlier有很好的效果。

欢迎订阅我的博客:RSS feed
知乎: 赤乐君
Blog: BrambleXu
GitHub: BrambleXu
Medium: BrambleXu


文章作者: BrambleXu
版权声明: 本博客所有文章除特別声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 BrambleXu !
评论
  目录