Python Pandas 중복값 제거

중복 되는 행 제거하고, 고유한 값만 남길 때 사용

import pandas as pd

# 중복제거
df.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

subset : 특정 열

df.drop_duplicates(subset=['brand'])

keep

1) 첫 번째만 남기기

: 인덱스 기준으로 가장 앞에 있는 행만 남음

2) 마지막만 남기기

: 인덱스 기준으로 가장 마지막에 있는 행만 남음

3) 모두 제거

: 중복되는 데이터가 있는 모든 행 제거

Untitled