Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- 전처리
- 이상치
- interpolate
- 대치법
- koNLPy
- KoNLP
- MSE
- 보간법
- Python
- subplots
- 누락값
- 데이터프레임
- value_counts
- 불용어
- SimpleImputer
- countplot
- IterativeImputer
- stopwords
- 결측치대체
- sklearn
- matplotlib
- 파이썬
- DataFrame
- 선형보간
- Outlier
- join
- 결측치
- Boxplot
- BDA
- Seaborn
Archives
- Today
- Total
목록Interquartile range (1)
ACAIT
이상치와 관련된 내용을 복습하도록 하겠습니다. 결측치와 이상치는 다른 개념. 이상치(Outlier)는 값이 튀는 것. Outlier detection: 예상 범위를 벗어나는 것을 잡아야 함. Outlier로 회귀에 문제가 있는 이유: 하나의 직선을 그릴 때 해당 값 때문에 기울기가 많이 바뀜. 이상치 하나 때문에 다른 데이터도 설명하기 어려워지고, 회귀식에 영향을 미친다. 1. 이상치 찾는 방법 정규분포: 정규분포를 이룰 때 데이터 스케일링 작업 진행. IQR: Interquartile range의 약자로써 Q3 - Q1를 의미. "어디까지가 이상치 데이터다" 라고 판단하는 기준 중 하나. Isolation Forest: 데이터 트리 기반으로 나누고, 한쪽은 분류를 못하게 되면 이상치라고 생각하고 분류되..
학회 활동/BDA 7기(데이터 분석 기초반)
2024. 1. 31. 16:31