keras加载imdb数据时num_words参数是干嘛的?

  统计/机器学习 自然语言处理 Python 人工神经网络 TensorFlow    浏览次数:5130        分享
0

在网上看keras上的教程,其中一个是加载keras自带的imdb电影数据库

imdb.load_data里有个参数num_words,这个是什么意思?

from keras.datasets import imdb
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)
 

yeahyeah   2019-05-14 12:26



   1个回答 
4

num_words=10000的意思是训练集中我们指保留词频最高的前10000个单词。10000名之后的词汇都会被直接忽略,不出现在train_data和test_data中。

SofaSofa数据科学社区DS面试题库 DS面经

tbh   2019-05-14 13:59



  相关讨论

keras无法加载imdb文本:Object arrays cannot be loaded when allow_pickle=False

Keras模型针对同一数据集做fit和evaluation,accuracy值却不相同

keras load_model报错

keras和tensorflow有什么关系?

keras sequential model怎么增加一个dropout层?

keras里的predict,predict_classes,predict_proba有什么区别?

训练完keras模型后怎么画出loss和val_loss的对比图?

怎么在keras中加载MNSIT数据集?

keras怎么设置/改动rmsprop的学习率?

keras.models.Sequential()是一种什么模型

  随便看看

tsne被忽视?tsne有什么缺点?

如何理解VC dimension?

不用洛必达法则证明sin x比上x的极限是1

统计里的IQR是什么意思?

推荐系统里的ALS是什么意思?