我用pandas read_csv读取
data= pd.read_csv('data.txt', sep='\t')
报错如下
ParserError: Error tokenizing data. C error: Expected 6 fields in line 2571, saw 7
就是说第2571行数据有错。因为我数据量比较大,所以想直接跳过这一行,有什么办法可以快速跳过报错的行吗?
1个回答
设置error_bad_lines参数为False,可以跳过所有有错误的行
data= pd.read_csv('data.txt', sep='\t', error_bad_lines=False)
不过通常要谨慎,因为如果文件中错误的行很多,你可能需要查看文件类型或者格式是否正确,而不是通过跳过错误的行
SofaSofa数据科学社区DS面试题库 DS面经