랭귀지/pandas
index.duplicated() 메서드 사용
유키공
2025. 3. 31. 07:52
index.duplicated() 메서드 사용
# 중복된 인덱스 위치 확인
duplicated = df.index.duplicated(keep='first') # 첫 번째 발생은 False, 이후 중복은 True
print(duplicated)
# 출력: [False False True False]
# 중복된 인덱스 값 확인
duplicated_values = df.index[df.index.duplicated()]
print(duplicated_values)
# 출력: Index(['b'], dtype='object')
value_counts()로 중복 횟수 확인
# 각 인덱스 값의 발생 횟수 확인
index_counts = df.index.value_counts()
print(index_counts)
# 출력:
# b 2
# a 1
# c 1
# 1번 이상 나타나는 인덱스 (중복된 인덱스) 필터링
duplicates = index_counts[index_counts > 1]
print(duplicates)
# 출력:
# b 2