我下面的代码读取csv文件
import pandas as pd
data = pd.read_csv('datafile.csv')
然后出现错误
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 12: invalid start byte
这个该如何解决?谢谢!
2个回答
read_csv里默认的encoding是'utf-8',但是你的文件里应该是有utf-8不能识别的乱码,所以需要换个编码方式
试试下面的
data = pd.read_csv('datafile.csv', encoding = "ISO-8859-1")
相关讨论
将pandas DataFrame保存成本地txt并删去列名
pd.read_csv报错Error tokenizing data,如何跳过错误的行?
pd.read_csv出现ParserError: Error tokenizing data. C error: Expected 2 fields in line 3, saw 3
python或者pandas读取excel xlsx文件中指定的一个sheet
随便看看