랭귀지/SWIFT
pandas a컬럼 기준으로 중복을 제거하고 b컬럼의 max 값 구하기
유키공
2024. 6. 21. 12:49
import pandas as pd
# 데이터프레임 생성
df = pd.DataFrame({'a': [1, 2, 2, 3, 3], 'b': [10, 20, 30, 40, 50]})
# 'a' 컬럼을 기준으로 중복을 제거하면서 'b' 컬럼의 최대값을 남기기
result = df.groupby('a')['b'].max().reset_index()
print(result)
import pandas as pd
# 샘플 데이터프레임 생성
df = pd.DataFrame({
'a': [1, 2, 3, 1, 2, 3],
'b': [10, 20, 30, 15, 25, 35]
})
# a 열 기준으로 중복 제거, b 열 최대값 유지
result = (
df.sort_values(by='b', ascending=False)
.drop_duplicates(subset='a', keep='first')
)
print(result)