일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 날짜
- ubuntu
- ASP
- PER
- 함수
- PyQt5
- IOS
- Linux
- python
- 다이어트
- urllib
- GIT
- swift
- sqlite
- PyQt
- javascript
- 리눅스
- node.js
- MySQL
- 맛집
- pandas
- flutter
- tensorflow
- port
- Excel
- Unity
- mssql
- 라즈베리파이
- 유니티
- MS-SQL
목록랭귀지/pandas (79)
아미(아름다운미소)
import pandas as pd# 예시 데이터프레임 생성df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})df3 = pd.DataFrame({'A': [9, 10], 'C': [11, 12]}) # 컬럼명이 다름df4 = pd.DataFrame({'A': [13, 14], 'B': [15, 16]})df5 = pd.DataFrame({'A': [17, 18], 'B': [19, 20]})df6 = pd.DataFrame({'A': [21, 22], 'B': [23.0, 24.0]}) # 타입이 다름df7 = pd.DataFrame({'A': [25, 26], 'B': [27, 28]}..
Pandas에서 `concat`을 사용할 때 값이 있는 데이터프레임이 있는데 결과가 0으로 나오는 경우는 여러 가지 원인이 있을 수 있습니다. 가장 일반적인 원인은 다음과 같습니다.1. 인덱스 문제: 데이터프레임을 concat할 때 인덱스가 겹치면, 같은 인덱스의 값이 덮어쓰기 때문에 0으로 보일 수 있습니다. 이 경우 `ignore_index=True`를 설정해 보세요. ```python pd.concat([df1, df2], ignore_index=True) ```2. 열 이름 불일치: concat할 데이터프레임의 열 이름이 다르면, NaN 값으로 채워질 수 있습니다. 이 경우 원래 데이터프레임의 열 이름을 확인해 보세요.3. 데이터 타입: 데이터 타입이 다르면 연산 결과가 예상과 다르게 ..
import pandas as pd# 샘플 데이터프레임 생성data = { '팀': ['A', 'A', 'B', 'B', 'C', 'C'], '점수': [10, 20, 30, 40, 50, 60]}df = pd.DataFrame(data)# 각 팀의 점수 평균을 계산하고 원래 데이터프레임에 추가df['점수_평균'] = df.groupby('팀')['점수'].transform('mean')print(df)
import pandas as pdimport numpy as np# 샘플 데이터 생성data = { 'a': ['A'] * 6 + ['B'] * 6 + ['C'] * 6, 'b': [10, 15, 10, -20, 5, 10, 25, -30, 5, 20, 15, 10, 10, 15, 20, 25, 30, 35], 'c': [3, 3, 3, 3, 3, 3, -3, -3, -3, -3, -3, -3, 2, 2, 2, 2, 2, 2]}# DataFrame 생성df = pd.DataFrame(data)# d 컬럼과 e 컬럼 초기화df['d'] = np.nandf['e'] = np.random.randint(-5, 10, size=l..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['A', 'A', 'B', 'B'], 'b': ['X', 'X', 'Y', 'Y'], 'c': [1, 1, 2, 2], 'd': [10, 20, 10, 20], 'e': [100, 200, 300, 400], 'f': [150, 250, 350, 450] # f 컬럼 추가}df1 = pd.DataFrame(data)df2 = df1.copy() # df2는 df1과 동일# df1을 그룹화하고 e 컬럼의 합을 계산grouped_df1 = df1.groupby(['a', 'b', 'c', 'd'])['e'].sum().reset_index()# df2는 그대로 사용# df2의 f 컬럼을 ..
import pandas as pd# 샘플 데이터프레임 생성data = { 'a': [-140, 15, -20, 25], 'b': [26, 4, 5, 6]}df = pd.DataFrame(data)# 나누기 결과와 몫 계산df['division'] = (df['a'] / df['b']).astype(int) # 나누기 결과를 정수형으로 변환df['quotient'] = (df['a'] // df['b']).astype(int) # 몫을 정수형으로 변환df['remainder'] = df['a'] % df['b'] # 나머지 계산# 나누기 결과에 따라 나머지의 부호 조정df['adjusted_remainder'] = df.apply( lambda row: row['remainder']..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['x', 'x', 'y', 'y', 'x', 'y', 'x', 'y', 'x', 'y'], 'b': [1, 1, 2, 2, 1, 1, 2, 2, 1, 1], 'c': ['foo', 'foo', 'bar', 'bar', 'foo', 'foo', 'bar', 'bar', 'foo', 'foo'], 'd': [10, 10, 20, 20, 10, 10, 20, 20, 10, 10], 'e': [4, 6, 10, 15, 25, 5, 3, 8, 12, 7], 'f': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J']}df = pd.DataFrame(data)..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['x', 'x', 'y', 'y', 'x'], 'b': [1, 1, 2, 2, 1], 'c': ['foo', 'foo', 'bar', 'bar', 'foo'], 'd': [10, 10, 20, 20, 10], 'e': [5, 15, 10, 20, 25]}df = pd.DataFrame(data)# 그룹화 후 e 컬럼의 합계와 행 수 계산result = df.groupby(['a', 'b', 'c', 'd']).agg( e_sum=('e', 'sum'), row_count=('e', 'count')).reset_index()print(result)import pandas as pd# ..
import pandas as pd# 예시 DataFrame 생성data = { 'a': ['TRUE', 'FALSE', 'TRUE', 'FALSE'], 'b': [10, 20, 30, 40],}df = pd.DataFrame(data)# a가 'TRUE'인 경우 b 값을 c에 복사df['c'] = df['b'].where(df['a'] == 'TRUE')print(df)
import pandas as pd# 예제 데이터프레임 생성data = { 'a': ['apple', 'banana', 'apple', 'orange', 'banana'], 'b': [True, False, True, True, False], 'c': [1, 2, 3, 4, 5]}df = pd.DataFrame(data)# a 컬럼의 고유 값에 대해 b가 True인 c 값을 가져와서 b에 복사for unique_a in df['a'].unique(): # 해당 a값을 가진 행 중 b가 True인 c 값 찾기 true_c_values = df.loc[(df['a'] == unique_a) & (df['b'] == True), 'c'] if not true_c_valu..