아미(아름다운미소)

문자열제거 본문

카테고리 없음

문자열제거

유키공 2025. 6. 27. 13:52
import pandas as pd
from openpyxl import load_workbook
from openpyxl.styles import PatternFill

# 🔹 중간 부분 추출 함수 (C열 전용)
def extract_middle(input_val):
    if pd.isna(input_val):
        return ""
    input_str = str(input_val)
    parts = input_str.split('_')
    return '_'.join(parts[1:-1]) if len(parts) >= 3 else input_str

# 🔹 파일 경로
file_path = '원본.xlsx'

# 1. 데이터 읽기
df = pd.read_excel(file_path)

# 2. A열 (원본 키), B열 (기준값) 정제
left = df[['a', 'b']].dropna(subset=['a']).copy()
left['a_clean'] = left['a'].astype(str).str.strip().str.lower()  # A열 키 (원본)
left['b_clean'] = left['b'].astype(str).str.strip().str.lower()  # B열 값 (비교 기준)

# 3. C열 (비교 키)만 extract_middle() 처리
right = df[['c', 'd']].dropna(subset=['c']).copy()
right['c_processed'] = right['c'].apply(extract_middle).str.strip().str.lower()  # C열만 처리
right['d_clean'] = right['d'].astype(str).str.strip().str.lower()  # D열 값 (원본 유지)

# 4. A열과 C열(처리 후) 매칭 + B-D 값 비교
wb = load_workbook(file_path)
ws = wb.active

fill_yellow = PatternFill(start_color="FFFF00", end_color="FFFF00", fill_type="solid")
fill_none = PatternFill(fill_type=None)

# A열 키 → B값 매핑 사전
a_to_b = {row['a_clean']: row['b_clean'] for _, row in left.iterrows()}

for row in range(2, ws.max_row + 1):
    a_val = ws[f"A{row}"].value
    c_val = ws[f"C{row}"].value
    
    # 조건 1: A열 또는 C열 중 하나라도 없으면 흰색 유지
    if pd.isna(a_val) or pd.isna(c_val):
        ws[f"D{row}"].fill = fill_none
        continue
    
    # 조건 2: A-C 키 매칭 및 B-D 비교
    c_processed = extract_middle(c_val).lower()
    d_val = str(ws[f"D{row}"].value).strip().lower() if ws[f"D{row}"].value else ""
    
    if c_processed in a_to_b:
        b_value = a_to_b[c_processed]
        is_match = (b_value == d_val)
    else:
        is_match = False
    
    ws[f"D{row}"].fill = fill_yellow if not is_match else fill_none

# 5. 저장
wb.save(file_path)
print("✅ 완료: A/C 열 없으면 흰색 유지 + 그 외는 B-D 비교 후 색칠 완료")
Comments