把重复的都去掉,只保留最后一个,比如有五行,第一行和第二行一样,第四行是不同的,第三行和第五行是一样的,那么就把第一行和第二行都去掉,第三行第五行也去掉,只保留第四行。有什么方法实现吗?
1个回答
对行去重并且不保留重复
df = df.drop_duplicates(keep=False)
对行去重并且保留重复的第一个
df = df.drop_duplicates(keep='first')
对行去重并且保留重复的最后一个
df = df.drop_duplicates(keep='last')
SofaSofa数据科学社区DS面试题库 DS面经