gensim里word2vec的window指的是什么?包括的范围是多大?

  统计/机器学习 自然语言处理 Python    浏览次数:2929        分享
0

gensim里word2vec的window指的是什么?包括的范围是多大?

比如下面这句话

The quick brown fox jumps over the lazy dog

如果我设置window是3,那么我的每个样本的长度是不是就是3,比如

[the, quick, brown],已知the brown预测quick

[quick, brown, fox],已知quick fox预测brown

是这么理解的吗?

 

酱油   2019-11-19 13:13



   1个回答 
2

window是指两端到中心词的距离,你上面的例子window=1

window=2,就是x, x, center, x, x

window=4,就是x, x, x, x, center, x, x, x, x

SofaSofa数据科学社区DS面试题库 DS面经

strong.man   2019-11-19 16:27



  相关讨论

gensim.models.word2vec模块的LineSentence有什么用?

怎么把训练好的bin格式的word2vec模型导入到gensim中使用?

教程中的利用Word2Vec判断是否是白话

gensim的word2vec模型是skip-gram还是cbow?

gensim训练出的Word2Vec模型每次都不一样

为什么基于skip-gram的word2vec在低频词汇相比cbow更有效?

word2vec怎么处理一词多义的情况?

gensim word2vec中wmdistance是什么距离?

word2vec的网络里为什么没有bias偏置项

如果不去除stop words,word2vec的结果会受到影响吗?

  随便看看

numpy.array转换为图片并显示出来

plt.bar怎么设置每个bar的颜色?

两个独立的正态随机变量的乘积服从什么分布?

numpy array里怎么用fillna填充nan的值?

怎么理解推荐系统中的NDCG?