Pandas에서 DataFrame의 특정 컬럼 특정값

랭귀지/pandas

Pandas에서 DataFrame의 특정 컬럼 특정값

유키공 2024. 7. 31. 09:02

import pandas as pd
import numpy as np

# 예시 데이터 생성
data = {
    'a': ['x', 'x', 'y', 'y', 'z'],
    'b': ['p', 'p', 'q', 'q', 'r'],
    'c': ['apple', 'banana', 'cherry', 'date', 'fig']
}

df = pd.DataFrame(data)

# (a, b)로 그룹화하여 c 컬럼의 최소값을 계산
min_c = df.groupby(['a', 'b'])['c'].agg('min').reset_index()
min_c.rename(columns={'c': 'min_c'}, inplace=True)

# 원래 DataFrame과 병합
df = df.merge(min_c, on=['a', 'b'], how='left')

# 최소값에 1을 할당하고 나머지에는 NaN 할당
df['value'] = np.where(df['c'] == df['min_c'], 1, np.nan)

# 필요 없는 min_c 컬럼 제거
df.drop(columns=['min_c'], inplace=True)

print(df)

import pandas as pd
import numpy as np

# 예시 데이터 생성
data = {
    'a': ['x', 'x', 'y', 'y', 'z'],
    'b': ['p', 'p', 'q', 'q', 'r'],
    'c': ['apple', 'banana', 'cherry', 'date', 'fig']
}

df = pd.DataFrame(data)

# (a, b)로 그룹화하고 c 컬럼의 알파벳 순으로 정렬한 후, 최소값을 찾기
# 각 그룹의 최소값을 가져오기 위해 groupby 후 transform 사용
df['min_c'] = df.groupby(['a', 'b'])['c'].transform(lambda x: x.min())

# 최소값에 1을 할당하고 나머지에는 NaN 할당
df['value'] = np.where(df['c'] == df['min_c'], 1, np.nan)

# 필요 없는 min_c 컬럼 제거
df.drop(columns=['min_c'], inplace=True)

print(df)

저작자표시 (새창열림)