| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- BDA
- matplotlib
- koNLPy
- countplot
- 결측치
- value_counts
- Seaborn
- sklearn
- 누락값
- join
- IterativeImputer
- KoNLP
- 데이터프레임
- Boxplot
- 보간법
- 대치법
- interpolate
- 불용어
- stopwords
- 전처리
- 파이썬
- 이상치
- Python
- MSE
- SimpleImputer
- Outlier
- DataFrame
- subplots
- 선형보간
- 결측치대체
- Today
- Total
목록groupby (2)
ACAIT
Series와 DataFrame 전처리와 관련된 함수들을 정리해 보겠습니다. 1. groupby() 2. merge() 데이터끼리 합치는 경우. 실무 DA에서는 sql이면 충분, DS 데이터셋 정리 시 활용. 테이블 병합하고 정리해서 우리가 원하는 테스트셋 만드는 경우. pandas 많이 사용. 데이터간 병합으로 원하는 새로운 테이블 만드는 개념. class에 따라 인원, 벌점평균 함께 볼 수 있는 테이블 만들기(조인) 실무에선 컬럼명 다르고 실제 값만 같은 경우도 있음. = 공통 키인 class를 가지고 병합하기. how: 조인의 방법. left, right, outer on: 공통 컬럼 3. concat() 덩어리 + 덩어리 공통 키 없이 테이블과 테이블을 그대로 붙이는 개념. 4. loc(), il..
- BDA 7기 활동을 하며 배운 내용을 블로그에 정리하고자 합니다. - 1주차는 간단한 OT를 진행했고, 2주차부터 본격적인 수업을 진행했습니다. - 키워드: 행 추출: query() 열 추출: []. [[]] 정렬: sort_values() 파생변수: assign(), lambda 그룹화: groupby().agg() 이어 배울 내용: merge(), concat(), loc, iloc, str() 0. 데이터 불러오기 1. 행 추출: query() 2. 열 추출: [], [[]] 2-1. 열 제거 시 drop(columns='열 이름') 2-2. 메서드체이닝 query()와 [], [[]]을 이용해서 열, 행 조건 동시 만족하는 데이터만 추출 가능. 메서드체이닝으로 문법이 이어진다. 3. 정렬: s..