일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- 선형보간
- IterativeImputer
- join
- 파이썬
- 전처리
- 대치법
- DataFrame
- BDA
- MSE
- 이상치
- SimpleImputer
- 데이터프레임
- stopwords
- sklearn
- interpolate
- Python
- value_counts
- 보간법
- Seaborn
- countplot
- subplots
- 불용어
- Boxplot
- KoNLP
- 결측치
- 누락값
- matplotlib
- 결측치대체
- koNLPy
- Outlier
- Today
- Total
목록DataFrame (2)
ACAIT

데이터 병합에 대해 배운 내용을 정리해 보겠습니다. SQL의 join과 같은 역할. 원하는 테이블 쿼리로 추출. 파이썬도 동일하게 작업 가능. SQL은 빠르게 확인할 때, 파이썬은 환경이나 제약조건이 있어서 무겁게 데이터 다뤄야 함. 하지만 충분히 데이터 병합에 대한 스킬 향상 필요. merge(), concat() 잘 이해하기. R, Python, SQL 병합 맥락 모두 같음. 하나 능숙해지면 나머지도 쉬움. 1. concat() 덩어리 + 덩어리. 데이터프레임끼리 서로 합치는 경우. join 조건 없는 상황에 쓰임. axis: 축 설정. '0 = 0행, 1열 기준.' ignore_index: 병합 후 인덱스 재설정. 1-1. concat 사용 case 시계열 인덱스 기준, 날짜 기준으로 데이터 붙이는..

Series와 DataFrame 전처리와 관련된 함수들을 정리해 보겠습니다. 1. groupby() 2. merge() 데이터끼리 합치는 경우. 실무 DA에서는 sql이면 충분, DS 데이터셋 정리 시 활용. 테이블 병합하고 정리해서 우리가 원하는 테스트셋 만드는 경우. pandas 많이 사용. 데이터간 병합으로 원하는 새로운 테이블 만드는 개념. class에 따라 인원, 벌점평균 함께 볼 수 있는 테이블 만들기(조인) 실무에선 컬럼명 다르고 실제 값만 같은 경우도 있음. = 공통 키인 class를 가지고 병합하기. how: 조인의 방법. left, right, outer on: 공통 컬럼 3. concat() 덩어리 + 덩어리 공통 키 없이 테이블과 테이블을 그대로 붙이는 개념. 4. loc(), il..