在网上看keras上的教程,其中一个是加载keras自带的imdb电影数据库
imdb.load_data里有个参数num_words,这个是什么意思?
from keras.datasets import imdb
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)
1个回答
num_words=10000的意思是训练集中我们指保留词频最高的前10000个单词。10000名之后的词汇都会被直接忽略,不出现在train_data和test_data中。
SofaSofa数据科学社区DS面试题库 DS面经