Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- 파이썬
- 대치법
- KoNLP
- 보간법
- Python
- SimpleImputer
- 데이터프레임
- BDA
- join
- 이상치
- subplots
- sklearn
- Outlier
- 전처리
- 누락값
- koNLPy
- Seaborn
- 선형보간
- countplot
- MSE
- matplotlib
- 불용어
- IterativeImputer
- stopwords
- value_counts
- 결측치대체
- DataFrame
- interpolate
- 결측치
- Boxplot
Archives
- Today
- Total
목록RMSE (1)
ACAIT
0. 예시 데이터로 이상치 확인 1. 이상치 관련 작업 1-1. 베이스라인 모델 회귀분석 # train_test_split(arrays, test_size, train_size, random_state, shuffle, stratify) arrays: 분할시킬 데이터 입력 test_size: 테스트 데이터셋의 비율, 갯수(default = 0.25) train_size: 학습 데이터셋의 비율, 갯수(default = test_size의 나머지) random_state: 데이터 분할 시 셔플을 위한 시드값(int나 RandomState로 입력) shuffle: 셔플 여부(default = True) stratify: 지정한 Data 비율 유지. ex) Label Set인 Y가 25%의 0과 75%의 1인 ..
학회 활동/BDA 7기(데이터 분석 기초반)
2024. 1. 31. 16:45