랭귀지/pandas
pandas에서 데이타프레임의 타입이 틀린 항목찿기
유키공
2024. 12. 23. 08:54
import pandas as pd
# 예시 데이터프레임 생성
data = {
'A': [1, 2, 'three', 4],
'B': [True, False, 7.2, 'eight'],
'C': [9, 10, 11, 12]
}
df = pd.DataFrame(data)
# 데이터 타입 확인
print("데이터 타입:")
print(df.dtypes)
# 타입이 다른 행 찾기
non_string_A = df[~df['A'].apply(lambda x: isinstance(x, str))]
non_int_C = df[~df['C'].apply(lambda x: isinstance(x, int))]
non_bool_B = df[~df['B'].apply(lambda x: isinstance(x, bool))]
print("\nColumn A에서 문자열이 아닌 행:")
print(non_string_A)
print("\nColumn C에서 정수가 아닌 행:")
print(non_int_C)
print("\nColumn B에서 부울이 아닌 행:")
print(non_bool_B)
타입이 틀린항목찿기
# 모든 열의 데이터 타입 확인
type_check = df.applymap(type)
# 특정 타입이 아닌 항목 찾기
invalid_types = df[~type_check.isin([int, float, bool])]
print("\n잘못된 데이터 타입을 가진 항목:")
print(invalid_types)