일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 불용어
- 대치법
- DataFrame
- Seaborn
- Outlier
- sklearn
- stopwords
- 데이터프레임
- value_counts
- SimpleImputer
- 전처리
- 결측치대체
- 이상치
- 결측치
- Boxplot
- 누락값
- koNLPy
- 선형보간
- BDA
- IterativeImputer
- Python
- 보간법
- 파이썬
- countplot
- join
- KoNLP
- subplots
- interpolate
- matplotlib
- MSE
- Today
- Total
목록matplotlib (3)
ACAIT

0. 마트 월매출 데이터 전처리 과정 주별 집계 데이터. 테이블 생성 필요. datetime으로 데이터 유형 변경. 시계열 데이터는 dt.year, dt.month 등으로 데이터 일부 추출 가능. # apply(): 데이터 변환시키는 함수. df.apply(함수, axis = 0 or 1) (default = 0) ACF, PACF 함수 그래프 그리기 1 다음에 값이 바로 급격히 떨어지는 것을 보아 주기로 봤을 때 1주차 전에 영향이 있는 것으로 보인다. 그래프에 나온 것처럼 연말에 영향력이 있다는 것을 확인할 수 있다. 1. 회귀분석을 통한 예측 다항회귀 개념의 예측. 변수를 여럿 사용할 수 있다. Nan값을 다 0으로 대체해서 가중치가 잘못 잡혀 좋지 않은 결과가 나옴. 다중회귀 진행인데 스케일링 진..

titanic 데이터 반복문으로 시각화

데이터 시각화에 대한 내용을 정리해 보겠습니다. 시각화 모듈의 문법과 로직 matplotlib, seaborn: 가장 많이 사용하는 툴 matplotlib의 불편한 부분을 보완하기 위해 seaborn 많이 사용. 왜 시각화 진행? 시각화: 데이터 분석 나의 주장이나, 가설을 설득하기 위한 하나의 과정. 나의 주장과 가설 잘 뒷받침할 수 있는 시각화를 통해 상대방 설득. 의미가 변수간의 관계 확인용 외에도 데이터 분석에서 본인의 주장, 가설이 베이스로 진행이 되는 것. 시각화는 상대방을 쉽게 설득시킬 수 있어야 한다. 맥킨지에서도 말하지만, 데이터 시각화로 잘못되게 표현하면 안 된다. 다양한 시각화 그래프가 많지만, 가장 단순하고 확실히 이해할 수 있는 시각화 등이 중요하다. 화려하다고 좋은 게 아니다. ..