全部问题问题热门未解答所有标签标签收藏收藏我要提问

pandas读取csv中指定的某些列

统计/机器学习 Python I/O 浏览次数：19520 分享

二维码

手机扫描二维码

案例分析面试常见题？

我有个很多很多列的csv文件，但是我只需要读取其中几列，比如id,age,gender，有什么方法吗？

Beck 2017-09-21 22:24

2个回答

设置参量usecols=['id', 'age', 'gender']

d = pd.read_csv('your_file_name.csv', usecols=['id', 'age', 'gender'])

同样适用于pd.read_table

SofaSofa数据科学社区 DS面试题库 DS面经

Nagozi 2017-09-22 01:16

d = pd.read_csv('your_file_name.csv')
d = d[['id', 'age', 'gender']]

SofaSofa数据科学社区 DS面试题库 DS面经

ZackLi 2017-09-21 23:03

我现在就是这么做的，csv文件太大了，读取时间太久，而我只需要其中的几列而已，所以就想问问有没有可以只读取那几列的方法。 - Beck 2017-09-21 23:59

相关讨论

pd.read_csv报错Error tokenizing data，如何跳过错误的行？

怎么用pandas直接读取被压缩成zip的csv文件？

pandas读取文件夹中所有的csv文件

pandas读取csv文件遇到UnicodeDecodeError

pandas dataframe存入csv文件时怎么忽略dataframe中的index？

python或者pandas读取excel xlsx文件中指定的一个sheet

pd.read_csv出现ParserError: Error tokenizing data. C error: Expected 2 fields in line 3, saw 3

pandas读取文件的前几行

将pandas DataFrame保存成本地txt并删去列名

pandas怎么读入tsv格式的数据

随便看看

'str' object has no attribute 'decode' 代码运行时有错误呢？请高手帮忙解决

随机梯度下降(sgd)的收敛问题

dropout rate一般设置多大？

回归问题中R方可以小于0吗？

Random Forest可以用来做聚类？