Notice
														
												
											
												
												
													Recent Posts
													
											
												
												
													Recent Comments
													
											
												
												
													Link
													
											
									| 일 | 월 | 화 | 수 | 목 | 금 | 토 | 
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 | 
| 12 | 13 | 14 | 15 | 16 | 17 | 18 | 
| 19 | 20 | 21 | 22 | 23 | 24 | 25 | 
| 26 | 27 | 28 | 29 | 30 | 31 | 
													Tags
													
											
												
												- MySQL
- 다이어트
- PyQt
- Linux
- sqlite
- PER
- Excel
- node.js
- Unity
- 리눅스
- 맛집
- ubuntu
- javascript
- MS-SQL
- 함수
- 날짜
- 유니티
- GIT
- PyQt5
- urllib
- swift
- port
- pandas
- flutter
- python
- ASP
- mssql
- tensorflow
- IOS
- 라즈베리파이
													Archives
													
											
											
											
											아미(아름다운미소)
pandas groupby sum 본문
예제
import pandas as pd
data = {'A': ['a', 'b', 'c', 'a', 'b'], 
        'B': ['a', 'b', 'c', 'a', 'b'],
        'C1': ['10', '20', '30', 'nan', '50'],
        'C2': ['1', '2', '3', '4', '5']}
df = pd.DataFrame(data)
#결측값확인
print(df.isnull().any())
# Output:
# A     True
# B     True
# C     True
# dtype: bool
# NaN 값 제거
df['C1'] = df['C1'].fillna('0')
df['C2'] = df['C2'].fillna('0')
# 데이터 타입 변경
df['C1'] = df['C1'].astype(int)
df['C2'] = df['C2'].astype(int)
# 합계 계산
grouped = df.groupby(['A', 'B'])
result = grouped[['C1', 'C2']].sum().reset_index()
print(result)예제1
import pandas as pd
# 샘플 데이터 생성
data = {'A': ['a', 'b', 'c', 'a', 'b'], 'B': ['a', 'b', 'c', 'a', 'b'], 'C1': [10, 20, 30, 40, 50], 'C2': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
#데이타타입확인
df.info()
# groupby() 후 sum()
grouped = df.groupby(['A', 'B'])
result1 = grouped[['C1', 'C2']].sum().reset_index()
print("groupby() 후 sum():")
print(result1)예제2
import pandas as pd
# 데이터 생성
data = pd.DataFrame({
    'A': ['A1', 'A1', 'A2', 'A2', 'A3', 'A3'],
    'B': ['B1', 'B2', 'B1', 'B2', 'B1', 'B2'],
    'C': [10, 20, 30, 40, 50, 60]
})
# Groupby 수행
grouped_data = data.groupby(['A', 'B'])
# sum 수행
sum_df = grouped_data['C'].sum().reset_index()
print(sum_df)예제3
import pandas as pd
# 데이터 생성
data = pd.DataFrame({
    'A': ['A1', 'A1', 'A2', 'A2', 'A3', 'A3'],
    'B': ['B1', 'B2', 'B1', 'B2', 'B1', 'B2'],
    'C': [10, 20, 30, 40, 50, 60],
    'D': [5, 10, 15, 20, 25, 30]
})
# Groupby 수행
grouped_data = data.groupby(['A', 'B'])
# C 컬럼의 sum 수행
sum_c_df = grouped_data['C'].sum().reset_index()
# D 컬럼의 sum 수행
sum_d_df = grouped_data['D'].sum().reset_index()
# C와 D 컬럼의 sum 결과 합치기
merged_df = pd.merge(sum_c_df, sum_d_df, on=['A', 'B'])
print(merged_df)'랭귀지 > pandas' 카테고리의 다른 글
| pandas groupby sum fillna astype (0) | 2024.07.13 | 
|---|---|
| pandas skipna (0) | 2024.07.13 | 
| pandas index 확인 (0) | 2024.07.11 | 
| pandas 차주 월요일데이타 (0) | 2024.07.11 | 
| pandas 주차구하기 (0) | 2024.07.09 | 
			  Comments