深度学习_深度学习基础知识_数据归一化

大家好，欢迎来到IT知识分享网。

归一化的主要公式

1.将数据归一到[0,1]：

$x^{\prime} =\frac{x – min(x)}{max(x)-min(x)}$

其中 $m a x (x)$ 和 $m i n (x)$ 分别是数据的最大值和最小值。

2.将数据归一化到[-1,1]：

$x^{\prime}=\frac{x-mean(x)}{max(x)-min(x)}$

其中 $m e a n (x)$ 是数据的均值。

3.将数据归一化到均值为0，标准差为1的标准正态分布上：

$x^{\prime}= \frac{x-\mu}{\sigma}$

其中 $\mu$ 和 $\sigma$ 分别是数据的均值和标准差。

4.将数据归一化到[a,b]：

数据归一化：

$x^{\prime}=a+k\times(x-min(x))$

或者

$x^{\prime}=b+k\times(x-max(x))$

归一化的作用

消除数据之间的量纲的影响，是数据的分布一致。（尤其是神经网络一直在算概率）
使数据集的更新速度变得更为一致，容易更快地通过梯度下降找到最优解（加速收敛速度）。如下图所示。
消除异常样本的影响，异常样本会增加网络学习难度，可能导致训练不收敛。
保证输出特征中数值小的特征也可以被充分学习。
避免梯度消失，比如使用Sigmoid激活函数时，数值小于0和大于1时会导致梯度几乎为0。

归一化应用场景

需要用到梯度下降法求解的模型通常需要归一化，如线性回归，罗辑回归，支持向量机和神经网络等模型。

但是对于决策树则并不适用，以C4.5为例，决策树在进行节点分裂时主要依据数据集D关于特征x的信息增益比，而信息增益比跟特征是否经过归一化是无关的，因为归一化并不会改变样本在特征x上的信息增益。

不进行归一化的后果

假设 $w 1$ 的范围在 $[- 10, 10]$ ，而 $w 2$ 的范围在 $[- 100, 100]$ ，梯度每次都前进 1 单位，那么在 $w 1$ 方向上每次相当于前进了 $1 / 20$ ，而在 $w 2$ 上只相当于 $1 / 200$ ！某种意义上来说，在 $w 2$ 上前进的步长更小一些,而 $w 1$ 在搜索过程中会比 $w 2$ “走”得更快。

这样会导致，在搜索过程中更偏向于 $w 1$ 的方向。走出了“L”形状，或者成为“之”字形。

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://haidsoft.com/138889.html

深度学习_深度学习基础知识_数据归一化

归一化的主要公式

归一化的作用

归一化应用场景

不进行归一化的后果

相关推荐

发表回复