랭귀지/pandas

category로 변환

유키공 2025. 3. 27. 09:38
# Object 타입 열별 고유값 개수 확인
for col in df.select_dtypes(include=['object']).columns:
    unique_count = df[col].nunique()
    print(f"{col}: {unique_count}개 고유값")
    
    # 고유값이 10개 이하인 경우에만 변환 (임계값 조정 가능)
    if unique_count <= 10:
        df[col] = df[col].astype('category')
        print(f"  -> {col}을(를) category로 변환")