'랭귀지/pandas' 카테고리의 글 목록 (8 Page)

Notice

Recent Posts

Recent Comments

Link

« 2026/08 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Tags more

Archives

관리 메뉴

목록랭귀지/pandas (128)

아미(아름다운미소)

Pandas에서 `concat`을 사용할 때 값이 있는 데이터프레임이 있는데 결과가 0으로출력

Pandas에서 `concat`을 사용할 때 값이 있는 데이터프레임이 있는데 결과가 0으로 나오는 경우는 여러 가지 원인이 있을 수 있습니다. 가장 일반적인 원인은 다음과 같습니다.1. 인덱스 문제: 데이터프레임을 concat할 때 인덱스가 겹치면, 같은 인덱스의 값이 덮어쓰기 때문에 0으로 보일 수 있습니다. 이 경우 `ignore_index=True`를 설정해 보세요. ```python pd.concat([df1, df2], ignore_index=True) ```2. 열 이름 불일치: concat할 데이터프레임의 열 이름이 다르면, NaN 값으로 채워질 수 있습니다. 이 경우 원래 데이터프레임의 열 이름을 확인해 보세요.3. 데이터 타입: 데이터 타입이 다르면 연산 결과가 예상과 다르게 ..

랭귀지/pandas 2024. 8. 28. 20:12

pandas transform

import pandas as pd# 샘플 데이터프레임 생성data = { '팀': ['A', 'A', 'B', 'B', 'C', 'C'], '점수': [10, 20, 30, 40, 50, 60]}df = pd.DataFrame(data)# 각 팀의 점수 평균을 계산하고 원래 데이터프레임에 추가df['점수_평균'] = df.groupby('팀')['점수'].transform('mean')print(df)

랭귀지/pandas 2024. 8. 28. 08:28

특정열이 1보다큰경우 fillcount

import pandas as pdimport numpy as np# 샘플 데이터 생성data = { 'a': ['A'] * 6 + ['B'] * 6 + ['C'] * 6, 'b': [10, 15, 10, -20, 5, 10, 25, -30, 5, 20, 15, 10, 10, 15, 20, 25, 30, 35], 'c': [3, 3, 3, 3, 3, 3, -3, -3, -3, -3, -3, -3, 2, 2, 2, 2, 2, 2]}# DataFrame 생성df = pd.DataFrame(data)# d 컬럼과 e 컬럼 초기화df['d'] = np.nandf['e'] = np.random.randint(-5, 10, size=l..

랭귀지/pandas 2024. 8. 27. 08:45

df 의 a컬럼값과 df2의 a,b,c,d groupby sum e의 값이 같은지 검증하는방법

import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['A', 'A', 'B', 'B'], 'b': ['X', 'X', 'Y', 'Y'], 'c': [1, 1, 2, 2], 'd': [10, 20, 10, 20], 'e': [100, 200, 300, 400], 'f': [150, 250, 350, 450] # f 컬럼 추가}df1 = pd.DataFrame(data)df2 = df1.copy() # df2는 df1과 동일# df1을 그룹화하고 e 컬럼의 합을 계산grouped_df1 = df1.groupby(['a', 'b', 'c', 'd'])['e'].sum().reset_index()# df2는 그대로 사용# df2의 f 컬럼을 ..

랭귀지/pandas 2024. 8. 26. 10:54

pandas a,b 값의 나눈값과 나머지를 구하고 나눈값이 음수이면 나머지를 음수로 양수면 나머지를 양수

import pandas as pd# 샘플 데이터프레임 생성data = { 'a': [-140, 15, -20, 25], 'b': [26, 4, 5, 6]}df = pd.DataFrame(data)# 나누기 결과와 몫 계산df['division'] = (df['a'] / df['b']).astype(int) # 나누기 결과를 정수형으로 변환df['quotient'] = (df['a'] // df['b']).astype(int) # 몫을 정수형으로 변환df['remainder'] = df['a'] % df['b'] # 나머지 계산# 나누기 결과에 따라 나머지의 부호 조정df['adjusted_remainder'] = df.apply( lambda row: row['remainder']..

랭귀지/pandas 2024. 8. 23. 15:16

pandas sum,count,몫,나머지 구하기

import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['x', 'x', 'y', 'y', 'x', 'y', 'x', 'y', 'x', 'y'], 'b': [1, 1, 2, 2, 1, 1, 2, 2, 1, 1], 'c': ['foo', 'foo', 'bar', 'bar', 'foo', 'foo', 'bar', 'bar', 'foo', 'foo'], 'd': [10, 10, 20, 20, 10, 10, 20, 20, 10, 10], 'e': [4, 6, 10, 15, 25, 5, 3, 8, 12, 7], 'f': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J']}df = pd.DataFrame(data)..

랭귀지/pandas 2024. 8. 22. 20:12

Pandas를 사용하여 `groupby`로 `a`, `b`, `c`, `d` 컬럼을 기준으로 그룹화한 후, `d` 컬럼이 모두 null이면 1/해당row수를 소수점5자리에서 반올림하기

import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['x', 'x', 'y', 'y', 'x'], 'b': [1, 1, 2, 2, 1], 'c': ['foo', 'foo', 'bar', 'bar', 'foo'], 'd': [10, 10, 20, 20, 10], 'e': [5, 15, 10, 20, 25]}df = pd.DataFrame(data)# 그룹화 후 e 컬럼의 합계와 행 수 계산result = df.groupby(['a', 'b', 'c', 'd']).agg( e_sum=('e', 'sum'), row_count=('e', 'count')).reset_index()print(result)import pandas as pd# ..

랭귀지/pandas 2024. 8. 22. 14:17

문자열 `'TRUE'`인 경우 `b` 값을 `c` 컬럼에 복사

import pandas as pd# 예시 DataFrame 생성data = { 'a': ['TRUE', 'FALSE', 'TRUE', 'FALSE'], 'b': [10, 20, 30, 40],}df = pd.DataFrame(data)# a가 'TRUE'인 경우 b 값을 c에 복사df['c'] = df['b'].where(df['a'] == 'TRUE')print(df)

랭귀지/pandas 2024. 8. 20. 10:54

Pandas df 에서 a컬럼을 distinct 했을때 b컬럼이 true인 c값을 copy해서 b칼럼에 넣어주는예제

import pandas as pd# 예제 데이터프레임 생성data = { 'a': ['apple', 'banana', 'apple', 'orange', 'banana'], 'b': [True, False, True, True, False], 'c': [1, 2, 3, 4, 5]}df = pd.DataFrame(data)# a 컬럼의 고유 값에 대해 b가 True인 c 값을 가져와서 b에 복사for unique_a in df['a'].unique(): # 해당 a값을 가진 행 중 b가 True인 c 값 찾기 true_c_values = df.loc[(df['a'] == unique_a) & (df['b'] == True), 'c'] if not true_c_valu..

랭귀지/pandas 2024. 8. 16. 15:25

df a,b컬럼에을 groupby했을때 c가 모두 false일때 해당그룹의 d 알파벳이 가장빠른행에 c값을 true로 바꿔준다

import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['A', 'A', 'B', 'B', 'C'], 'b': [1, 1, 2, 2, 1], 'c': [False, False, False, False, True], 'd': ['z', 'y', 'x', 'w', 'v']}df = pd.DataFrame(data)# c가 모두 False인 그룹 찾기grouped = df.groupby(['a', 'b'])# c의 값이 모두 False인 그룹에 대한 마스크 생성mask = grouped['c'].transform('all') == False# 해당 그룹에서 d 컬럼 기준으로 정렬 후 인덱스 찾기first_alpha_index = df[mask].sort_va..

랭귀지/pandas 2024. 8. 16. 08:14

Prev 1 ··· 5 6 7 8 9 10 11 ··· 13 Next

목록랭귀지/pandas (128)

아미(아름다운미소)

티스토리툴바