Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- Boxplot
- subplots
- 결측치대체
- 이상치
- KoNLP
- 선형보간
- DataFrame
- 대치법
- value_counts
- 불용어
- sklearn
- 보간법
- SimpleImputer
- IterativeImputer
- Outlier
- join
- stopwords
- MSE
- interpolate
- 전처리
- matplotlib
- countplot
- 결측치
- Seaborn
- BDA
- koNLPy
- 파이썬
- 누락값
- 데이터프레임
- Python
Archives
- Today
- Total
목록IterativeImputer (2)
ACAIT
시계열 데이터로 결측치 생성 및 대체, 시각화를 진행해 보도록 하겠습니다. seattle-weather.csv (출처: kaggle) date, precipitaion, temp_max, temp_min, wind, weather 여섯 개의 컬럼으로 이루어짐. y값을 precipitation으로 설정. 이외 사용할 컬럼은 temp_max, temp_min, wind. 시계열 데이터이므로 train_test_split 사용하면 안 됨. 따라서 인덱스 기준으로 데이터 분리해서 진행. (전체 데이터 중 7:3 비중) 결측값은 모든 컬럼에 최소 50개 이상 생성. 1. IterativeImputer(회귀대치)의 주요 파라미터 estimator(추정량): estimator object, default = Baye..
학회 활동/BDA 7기(데이터 분석 기초반)
2024. 1. 31. 16:01