Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- subplots
- MSE
- matplotlib
- 결측치대체
- join
- 전처리
- stopwords
- value_counts
- 결측치
- Outlier
- 선형보간
- IterativeImputer
- 불용어
- 파이썬
- Python
- Seaborn
- Boxplot
- interpolate
- 데이터프레임
- KoNLP
- countplot
- BDA
- 이상치
- sklearn
- 누락값
- SimpleImputer
- 대치법
- koNLPy
- 보간법
- DataFrame
Archives
- Today
- Total
목록Series (2)
ACAIT
1. reindex(): 인덱스 생성 2. unique(): 중복 제거 후 모든 값 반환. 3. value_counts(): 값이 몇 번 중복되는지 반환. 4. rank(): 순위를 매기기 위한 메서드. default: 오름차순. 값이 작은 데이터를 1순위로 지정.
카테고리 없음
2024. 1. 31. 21:05
Series와 DataFrame 전처리와 관련된 함수들을 정리해 보겠습니다. 1. groupby() 2. merge() 데이터끼리 합치는 경우. 실무 DA에서는 sql이면 충분, DS 데이터셋 정리 시 활용. 테이블 병합하고 정리해서 우리가 원하는 테스트셋 만드는 경우. pandas 많이 사용. 데이터간 병합으로 원하는 새로운 테이블 만드는 개념. class에 따라 인원, 벌점평균 함께 볼 수 있는 테이블 만들기(조인) 실무에선 컬럼명 다르고 실제 값만 같은 경우도 있음. = 공통 키인 class를 가지고 병합하기. how: 조인의 방법. left, right, outer on: 공통 컬럼 3. concat() 덩어리 + 덩어리 공통 키 없이 테이블과 테이블을 그대로 붙이는 개념. 4. loc(), il..
학회 활동/BDA 7기(데이터 분석 기초반)
2024. 1. 31. 21:01