CNN中为什么要引入非线性?

我们都知道一般激活函数的作用是引入分线性,但是CNN中为什么要引入分线性呢?或者说CNN是只是线性变换有什么问题呢?
我能想到的两点(纯属个人胡说)
1、矩阵乘以向量,是对该向量的旋转缩放操作,对于大量的样本特征,简单的旋转和缩放操作,无法将他们分开。也许对空间进行一点扭曲(也就非线性)会好一点。
2、现实的数据并不是线性可分的。也就是说线性变换只能处理线性可分的数据。
已邀请:

alex68 - 一般不扯淡~

赞同来自:

因为多层线性操作等价于一层线性操作。

要回复问题请先登录注册