训练word2vec时移动窗口的大小怎么选择?有时候是5,有时候是3,有时候是10,这个数字一般是怎么选的?
您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。
dirkdirk 2019-08-22 11:59
一般就是5吧。
window越大,训练越慢。还有一种说法是window越小,得到的结果越关注语法,window越大,得到的结果越关注语意。
zl_pku 2019-08-23 13:52
回答问题时需要注意什么?
我们谢绝在回答前讲“生动”的故事。 我们谢绝答非所问。 我们谢绝自己不会、硬要回答。我们谢绝“这么简单,自己想”、“书上有,自己找”这类回答;如果你认为对方提问方式或者内容不妥,可以直接忽略,不作解答,甚至投反对票。我们感激每一个用户在编写答案时的努力与付出!
相关讨论
gensim里word2vec的window指的是什么?包括的范围是多大?
gensim.models.word2vec模块的LineSentence有什么用?
教程中的利用Word2Vec判断是否是白话
怎么把训练好的bin格式的word2vec模型导入到gensim中使用?
gensim的word2vec模型是skip-gram还是cbow?
word2vec的网络里为什么没有bias偏置项
为什么基于skip-gram的word2vec在低频词汇相比cbow更有效?
gensim训练出的Word2Vec模型每次都不一样
word2vec怎么处理一词多义的情况?
如果不去除stop words,word2vec的结果会受到影响吗?
随便看看
plt.scatter plot怎么让不同的类别有不同的颜色
tsne被忽视?tsne有什么缺点?
关于方差膨胀因子(VIF)的问题
为什么机器学习中的优化问题很少用到牛顿法?
keras里sparse_categorical_crossentropy和categorical_crossentropy什么不同?