중복 되는 행 제거하고, 고유한 값만 남길 때 사용

import pandas as pd

# 중복제거
df.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

subset : 특정 열

df.drop_duplicates(subset=['brand'])

keep

1) 첫 번째만 남기기

: 인덱스 기준으로 가장 앞에 있는 행만 남음

https://blog.kakaocdn.net/dn/cmvwz8/btqNthADXke/ldlRK56gsBQNDvoLJSEOlk/img.png

2) 마지막만 남기기

: 인덱스 기준으로 가장 마지막에 있는 행만 남음

https://blog.kakaocdn.net/dn/wskBc/btqNpGIp4eO/jnn7tKXl4adPZIEUnnkI9K/img.png

3) 모두 제거

: 중복되는 데이터가 있는 모든 행 제거

https://blog.kakaocdn.net/dn/bqc8Sk/btqNuP4ZSMo/6LLBXs2oGPfzmykwCRd2UK/img.png

  1. 인덱스 재설정 : ignore_index

Untitled