求一个python里得到n-grams的包
功能是对于给出的一段话,得到所有的n-gram
谢谢指教!
2个回答
sklearn里也有的
from sklearn.feature_extraction.text import CountVectorizer
text = "this is a foo bar sentences and i want to ngramize it"
vectorizer = CountVectorizer(ngram_range=(1,6))
analyzer = vectorizer.build_analyzer()
print(analyzer(text))
仅供参考
SofaSofa数据科学社区DS面试题库 DS面经