为什么GAN是非监督的学习方法?
2个回答
因为GAN本身并不需要数据有label,GAN是产生人工“假”数据,配合原来的真数据来训练discriminator ,而并非原始数据中的label。
所以说GAN是非监督的。
SofaSofa数据科学社区DS面试题库 DS面经GAN是semi-supervised, 包含generator$G()$和discriminator$D()$。它有两个输出数据,对应两个loss:
1.原始的输出。loss1可以是逻辑回归或线性回归,用于训练$G()$,是监督训练;
2.人造的label,表示是见过的训练数据。loss2是逻辑回归,用于训练 $D(G())$,是非监督训练。关键是loss2的gradient会传到$G()$,从而用人造label训练generator。换句话说人造label会作为正则项限制$G()$中参数的取值范围。Discriminator用到了“存在即合理”的假设,label=1表示“存在”。这点类似于one class svm anomaly detection,把见过的正常数据的表达空间压缩到一个点上(label=1),而label=0表示其余没见过的“非正常”数据。
----------------题外话---------------------
Discriminator可看做是一个正则项,类似对generator参数$w$的L1/L2 norm,提供先验信息(prior),压缩$w$的取值空间$W$。一般overfitting都发生在$W$的边沿,如果限缩了$W$,把那些边沿部分从$W$中去掉,会降低overfitting的概率。
正则项一般来源于数据某种特征的稀疏性,比如$w$的L1/L2 norm,或者图像处理中相邻pixel的差要稀疏(TV, Laplace,Gaussian)。 Discriminator也是一个稀疏表达(sparse representation)的限制条件,这个人造label就是它的特征,把所有训练数据压缩到一个点上。