일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Linux
- node.js
- tensorflow
- IOS
- 함수
- sqlite
- PER
- 맛집
- javascript
- 라즈베리파이
- mssql
- MySQL
- 다이어트
- port
- swift
- Excel
- 날짜
- 리눅스
- MS-SQL
- PyQt
- urllib
- PyQt5
- ubuntu
- pandas
- python
- ASP
- 유니티
- GIT
- Unity
- flutter
목록랭귀지/pandas (111)
아미(아름다운미소)
import pandas as pd# 예시 DataFrame 생성data = { 'a': ['A', 'A', 'B', 'B', 'C'], 'b': [1, 1, 2, 2, 3], 'c': [5, 5, 6, 6, 7], 'd': [10, 20, 10, 30, 40], 'e': [5, 15, 5, 25, 35]}df = pd.DataFrame(data)# 그룹화하여 e 컬럼의 합계 계산grouped = df.groupby(['a', 'b', 'c'])['e'].sum().reset_index()# e와 d 비교 후 (e - d) 계산grouped['d'] = df.groupby(['a', 'b', 'c'])['d'].first().values # d 값을 가져옴grouped['di..
import pandas as pdimport numpy as np# 예제 데이터 생성data = { 'a': ['A', 'A', 'B', 'B', 'C', 'C'], 'b': [1, 1, 2, 2, 3, 3], 'c': [5, 5, 6, 6, 7, 7], 'd': [10, 20, 30, 40, 50, 60], 'e': [np.nan, np.nan, 3.5, np.nan, np.nan, np.nan] # A와 C 그룹은 모두 null, B 그룹은 일부 값이 있음}df = pd.DataFrame(data)# 각 그룹의 행 수를 계산group_sizes = df.groupby(['a', 'b', 'c', 'd'])['e'].transform('size')null_groups = ..
import pandas as pd# 예시 데이터프레임 생성df1 = pd.DataFrame({'a': [1, 2, 3]})df2 = pd.DataFrame({'a': [2, 3, 4, 5], 'b': ['x', 'y', 'z', 'w']})# df1의 a 컬럼을 기준으로 df2의 a 컬럼을 검색하여 df2 전체 반환result = df2[df2['a'].isin(df1['a'])]print(result)
# A와 B의 결합 후 C와 결합df['coalesce'] = df['A'].combine_first(df['B']).combine_first(df['C'])print(df)
import pandas as pdimport numpy as np# 예시 데이터프레임 생성data = { 'a': ['foo', 'foo', 'bar', 'bar', 'foo', 'bar'], 'b': ['one', 'one', 'two', 'two', 'one', 'two'], 'c': ['small', 'small', 'large', 'large', 'small', 'large'], 'd': [1, 1, 2, 2, 1, 2], 'e': ['one', 'two', 'two', 'one', 'one', 'three'], 'f': [10, 20, 30, 40, 50, 60]}df = pd.DataFrame(data)# 그룹화 및 f 컬럼 값 추출def get_f_value..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['foo', 'foo', 'bar', 'bar', 'foo', 'bar'], 'b': ['one', 'one', 'two', 'two', 'one', 'two'], 'c': ['small', 'small', 'large', 'large', 'small', 'large'], 'd': [1, 1, 2, 2, 1, 2], 'e': [10, 10, 20, 20, 10, 30]}df = pd.DataFrame(data)# 그룹화 후 e 컬럼의 최빈값 계산mode_df = df.groupby(['a', 'b', 'c', 'd'])['e'].agg(lambda x: x.mode()[0]).reset_ind..
import pandas as pd# 예제 DataFrame 생성data = { 'b': ['x', 'y', 'x', 'z', 'y', 'z'], 'c': [True, False, True, True, False, True], 'd': [10, 20, 30, 40, 50, 60]}a_df = pd.DataFrame(data)# c가 True인 경우에 대해 distinct b 값을 기준으로 d 값을 복사result = a_df[a_df['c']].drop_duplicates(subset='b')[['b', 'd']]# a_df에 결과를 merge하여 추가a_df = a_df.merge(result, on='b', how='left', suffixes=('', '_copy'))print(a_..
def mode_min(series): counts = series.value_counts() mode_val = counts.idxmax() max_count = counts.max() if (counts[counts == max_count].count() > 1): return series.min() return mode_valresult = df.groupby(['b', 'c', 'd'])['e'].agg(mode_min).reset_index()import pandas as pd# 예시 데이터프레임 생성data = { 'a': [1, 2, 3, 4, 5], 'b': ['x', 'x', 'y', 'y', 'x'], 'c': ['p', 'p', ..
import pandas as pdimport numpy as np# 예시 데이터 생성data = { 'a': ['x', 'x', 'y', 'y', 'z'], 'b': ['p', 'p', 'q', 'q', 'r'], 'c': ['apple', 'banana', 'cherry', 'date', 'fig']}df = pd.DataFrame(data)# (a, b)로 그룹화하여 c 컬럼의 최소값을 계산min_c = df.groupby(['a', 'b'])['c'].agg('min').reset_index()min_c.rename(columns={'c': 'min_c'}, inplace=True)# 원래 DataFrame과 병합df = df.merge(min_c, on=['a', 'b'], ho..
import pandas as pd# 예시 DataFrame 생성data1 = { 'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9]}data2 = { 'b': [1, 2, 3], 'c': [4, 5, 6], 'd': [7, 8, 9]}df1 = pd.DataFrame(data1)df2 = pd.DataFrame(data2)# 두 DataFrame의 컬럼 이름을 합치고 중복 제거combined_columns = set(df1.columns).union(set(df2.columns))# 결과를 리스트로 변환unique_column_names = list(combined_columns)# 결과 출력print(unique_column_names)..