低维嵌入(low dimension embedding)是什么意思?

  统计/机器学习 数据降维 开放问题    浏览次数:7985        分享
0

低维嵌入(low dimension embedding)是什么意思?是和降维一个意思吗?

 

nzsfw   2019-05-24 12:40



   2个回答 
4

是的。降维,即通过某种数学变换将原始高维属性空间转变为一个低维“子空间”,在这子空间样本密度大幅度提升,距离计算变得更加容易。我们的数据虽然是高维的,但是与学习任务相关的也许仅仅是某个低维分布,即高维空间中的一个低维“嵌入”。--西瓜书

SofaSofa数据科学社区DS面试题库 DS面经

ai0425   2019-05-24 12:47

赞,多谢 - nzsfw   2019-05-24 13:21
2

把原始数据从高维投射到低维空间得到的结果就是低维嵌入。

比如原来每个样本可以在$n$维空间内表示为一个有$n$个元素的向量,通过降维变形等手段,我们得到了一个$k$维空间内的新向量。如果$k\lt n$,新向量就是原向量的低维嵌入。

比较典型的例子就是word2vec

SofaSofa数据科学社区DS面试题库 DS面经

Willyd   2019-06-06 13:44

感觉一般都是把分类特征(比如id什么的)进行低维嵌入。 - tbh   2019-06-20 14:25


  相关讨论

维数大于样本数的问题

怎么评价tSNE的降维效果?

为什么LDA降维最多降到类别数k-1?

随机投影的实际效果如何?

高维数据应该用什么聚类模型?

python里怎么实现t-SNE降维?

hashing trick或者feature hashing是什么

分类变量,进行One hot编码,维度升高,如何处理?

非序列数据(任务),针对种类型特征可以用embedding技术吗?

什么时候应该用isomap降维方法?

  随便看看

牛顿法到底是一阶优化算法还是二阶优化算法?

怎么给plt.subplot加一个主标题?

pandas报错: 'DataFrame' object has no attribute 'unique'

推荐系统算法里的cold start是什么意思?

如果样本不是正态分布,还能用t-test或者z-test吗?