랭귀지/SWIFT

pandas a컬럼 기준으로 중복을 제거하고 b컬럼의 max 값 구하기

유키공 2024. 6. 21. 12:49
import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({'a': [1, 2, 2, 3, 3], 'b': [10, 20, 30, 40, 50]})

# 'a' 컬럼을 기준으로 중복을 제거하면서 'b' 컬럼의 최대값을 남기기
result = df.groupby('a')['b'].max().reset_index()

print(result)
import pandas as pd

# 샘플 데이터프레임 생성
df = pd.DataFrame({
    'a': [1, 2, 3, 1, 2, 3],
    'b': [10, 20, 30, 15, 25, 35]
})

# a 열 기준으로 중복 제거, b 열 최대값 유지
result = (
    df.sort_values(by='b', ascending=False)
    .drop_duplicates(subset='a', keep='first')
)

print(result)