文本分类问题怎么做data augmentation?

  统计/机器学习 自然语言处理 数据预处理 开放问题    浏览次数:2340        分享
0

图像分类问题经常会用data augmentation,那文本分类问题怎么做data augmentation?有类似的方法吗?

 

niiii   2020-06-07 23:03



   1个回答 
1

文本分类有很多数据增强的方法:

比如随机打乱、随机删除、随机插入、回译等等

SofaSofa数据科学社区DS面试题库 DS面经

lee   2020-10-22 09:22



  相关讨论

数据批量分析提取,求指点迷津

NLP里的OOV是什么意思?

怎么理解nlp里的good-turing smooth?

请问NLP中这种编码方式有没有什么术语?

机器学习中文数据的训练集的预处理

怎么识别“的”“地”“得”是否用错?

自然语言处理中的分词是什么意思?

自定义CountVectorizera中默认的英语stop_words

如何对中文部分进行独热处理(one-hot)

python去掉中文文本中所有的标点符号

  随便看看

凸优化中局部最优解就是全局最优解吗?

为什么样本方差是除以n-1

huber loss是什么?什么时候用?

numpy里生成单位矩阵?

模型调参时常用到的Grid Search是什么意思?