일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- flutter
- GIT
- javascript
- Linux
- 라즈베리파이
- ASP
- Unity
- IOS
- swift
- 맛집
- 다이어트
- pandas
- PER
- urllib
- 함수
- 날짜
- tensorflow
- Excel
- PyQt5
- PyQt
- sqlite
- MS-SQL
- node.js
- mssql
- 리눅스
- 유니티
- MySQL
- python
- port
- ubuntu
목록랭귀지/pandas (73)
아미(아름다운미소)
df = df.loc[~(df['column'].isnull())]
import pandas as pd# 예시 DataFrame 생성data = { 'a': [1, 1, 2, 2, 3], 'b': ['x', 'x', 'y', 'y', 'z'], 'c': ['p', 'q', 'p', 'q', 'p'], 'd': ['banana', 'apple', 'orange', 'grape', 'kiwi']}df = pd.DataFrame(data)# a 컬럼 드롭df = df.drop(columns=['a'])# b, c로 distinct한 후 d 컬럼의 알파벳 오름차순 첫 번째 값만 남기기result = df.sort_values('d').groupby(['b', 'c'], as_index=False).first()print(result)
import pandas as pd# 예시 DataFrame 생성data = { 'a': [1, 2, 3, 4], 'b': ['group1', 'group1', 'group2', 'group2'], 'c': [10, 20, 30, 40], 'd': ['T', 'F', 'T', 'F']}df = pd.DataFrame(data)# f 컬럼 초기화df['f'] = None# 그룹화하여 f 컬럼 채우기for name, group in df.groupby('b'): value = group.loc[group['d'] == 'T', 'c'] if not value.empty: df.loc[group.index, 'f'] = value.values[0]print(df)i..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['A', 'A', 'B', 'B'], 'b': [1, 1, 2, 2], 'c': ['False', 'False', 'False', 'False'], # 문자열로 초기화 'd': ['apple', 'banana', 'cherry', 'date']}df = pd.DataFrame(data)# 그룹화groups = df.groupby(['a', 'b'])# c 컬럼이 모두 'False'인 그룹의 d 컬럼의 알파벳이 가장 빠른 행 찾기for name, group in groups: if (group['c'] == 'False').all(): # c 컬럼이 모두 'False'인 경우 #..
import pandas as pd# DataFrame 예시data = { 'a': ['RT123', 'AB456', 'RT789', 'CD012'], 'b': [1, 2, 3, 4]}df = pd.DataFrame(data)# 'RT'로 시작하는 값 필터링filtered_df = df[df['a'].str.startswith('RT')]print(filtered_df)
import pandas as pd# 예시 DataFramedata = { 'a': [True, False, True, False], 'b': [1, 2, 3, 4]}df = pd.DataFrame(data)# a가 True이면 b를 c에, 아니면 b를 d에 넣기df['c'] = df['b'].where(df['a'] == True)df['d'] = df['b'].where(df['a'] == False)# 결과 출력print(df)
import pandas as pd# 데이터프레임 생성left_df = pd.DataFrame({ '키': [1, 2, 3], '이름': ['홍길동', '이순신', '강감찬']})right_df = pd.DataFrame({ '키': [2, 3, 4], '직업': ['장군', '명장', '왕']})# 왼쪽 외부 조인 수행result = pd.merge(left_df, right_df, on='키', how='left')print(result) 키 이름 직업0 1 홍길동 NaN1 2 이순신 장군2 3 강감찬 명장
import pandas as pd# 예시 데이터프레임 생성df1 = pd.DataFrame({'a': [1, 2, 3, 4, 5]})df2 = pd.DataFrame({'b': [3, 4, 5, 6, 7]})# df1의 a 컬럼에 있지만 df2의 b 컬럼에는 없는 값 찾기missing_values = df1[~df1['a'].isin(df2['b'])]print(missing_values)
df['a'] = df['a'].str.split('-to-SCP-', expand=True)[1].fillna(df['a'].str.split('--', expand=True)[0])import pandas as pd# 예시 DataFrame 생성data = { 'a': [None, 'x', None, 'y', None], 'b': ['group1', 'group1', 'group2', 'group2', 'group1'], 'c': ['banana', 'apple', 'orange', 'kiwi', 'avocado']}df = pd.DataFrame(data)# a 컬럼이 null인 경우에 대해 처리df['a'] = df.apply( lambda row: df[df['b'] == ..