把矩阵$V$分解成$WH$两个矩阵的乘积,黄色那部分的迭代公式是怎么得到的?
1个回答
原始论文是algorithms-for-non-negative-matrix-factorization。
一般的gradient descent算法下,
其中$\eta_{a\mu}$是步长。
当每个变量步长不同时,
第6等式可变为第4等式
然后论文在数学上证明此方法收敛。
我没有仔细看证明,感觉上是变步长的gradient descent。还不知道(4)和(6)哪个收敛速度更快。
SofaSofa数据科学社区DS面试题库 DS面经