我的理解embedding必须在序列任务中,例如文本序列、用户行为序列等等,
但是好像“万物皆可embedding”,针对非序列数据(任务),种类型特征可以用embedding技术吗?
1个回答
embedding的思想是从文本处理那里开始爆发到各个应用的。
文本上的embedding主要是两类,一类就是你说的序列的,比如word2vec那种,一类就是词袋模型,比如LSA那种。
比如你做商品embedding的时候,如果你没有用户的浏览顺序,你可以认为一个购物车里的所有商品都是一个词袋。
SofaSofa数据科学社区DS面试题库 DS面经
谢谢你的回答~最后一句不是很理解,“一个购物车里的所有商品都是一个词袋”,如果把购物车里面的所有商品看做一个词袋,怎么得到每件商品的embedding呢?不是很理解,希望能得到您的解答
-
dzzxjl
2019-11-27 16:20
LSA词袋模型就是把一句话当作词汇的集合,不在乎集合内词汇的顺序。购物车也是类似的,不考虑购物车内物品的顺序,就当作一个大的集合。
-
我小宋
2019-12-26 10:22