판다스(Pandas)로 데이터 다루기
·
Python/pandas
판다스로 데이터 다루기 판다스는 Python의 데이터 분석 라이브러리로, 데이터를 효과적으로 처리하고 분석하는데 필요한 다양한 기능을 제공합니다. 몇 가지 유용한 기능들을 살펴보겠습니다. 1. 문자열 처리하기 df['name_upper'] = df['name'].str.upper() print(df[['name', 'name_upper']]) Output: name name_upper 0 John JOHN 1 Anna ANNA 2 Peter PETER 3 Linda LINDA 4 Justin JUSTIN 2. 날짜 형식 다루기 df['birthdate'] = ['2022-06-15', '2023-04-28', '2024-12-01', '2025-01-14'] df['birthdate'] = pd.to_d..
판다스(pandas) 데이터 분석 라이브러리
·
Python/pandas
판다스(pandas) 데이터 분석 라이브러리 판다스는 데이터 처리와 분석을 위한 파이썬 라이브러리로, 특히 테이블 형식의 데이터나 시계열 데이터를 다루기에 매우 유용합니다. 주요 기능 DataFrame: 2차원 라벨링된 데이터 구조. 엑셀의 스프레드시트나 SQL의 테이블 같은 형태. Series: 1차원 라벨링된 배열. 데이터 입출력: 다양한 파일 형식(CSV, Excel, SQL 등)의 데이터를 불러오고 저장하는 기능. 데이터 정제: 결측치 처리, 중복 처리, 데이터 변환 등의 기능. 데이터 필터링 및 정렬: 조건에 따른 데이터 필터링, 정렬 기능. 통계 및 집계: 평균, 중앙값, 최대값, 최소값 등의 통계값 계산 및 데이터 집계 기능. 데이터 병합 및 조인: 여러 데이터셋의 병합 및 조인 기능. 시계..