일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- KoNLP
- matplotlib
- SimpleImputer
- Outlier
- 선형보간
- 불용어
- join
- subplots
- 결측치대체
- 전처리
- Python
- interpolate
- BDA
- 보간법
- stopwords
- countplot
- sklearn
- 데이터프레임
- 이상치
- 파이썬
- 결측치
- Seaborn
- value_counts
- DataFrame
- Boxplot
- MSE
- 누락값
- koNLPy
- 대치법
- IterativeImputer
- Today
- Total
목록Seaborn (4)
ACAIT

0. 마트 월매출 데이터 전처리 과정 주별 집계 데이터. 테이블 생성 필요. datetime으로 데이터 유형 변경. 시계열 데이터는 dt.year, dt.month 등으로 데이터 일부 추출 가능. # apply(): 데이터 변환시키는 함수. df.apply(함수, axis = 0 or 1) (default = 0) ACF, PACF 함수 그래프 그리기 1 다음에 값이 바로 급격히 떨어지는 것을 보아 주기로 봤을 때 1주차 전에 영향이 있는 것으로 보인다. 그래프에 나온 것처럼 연말에 영향력이 있다는 것을 확인할 수 있다. 1. 회귀분석을 통한 예측 다항회귀 개념의 예측. 변수를 여럿 사용할 수 있다. Nan값을 다 0으로 대체해서 가중치가 잘못 잡혀 좋지 않은 결과가 나옴. 다중회귀 진행인데 스케일링 진..

titanic 데이터 반복문으로 시각화

저번 게시물에 이어 데이터 시각화 내용을 추가하고, 시계열 데이터 분석에 대해 정리해 보겠습니다. 1. 반복문 이용해서 시각화 2. Seaborn 2-1. sns.histplot() 2-2. sns.countplot() 2-3. sns.barplot() hue 인자 넣으면 범례 추가. 2-4. sns.boxplot() 2-5. sns.violinplot() 바이올린차트. 연속확률분포 차트 곡선과 boxplot 함께 시각화. 곡선 대칭, 가운데 몸통 수염. 반복문으로 가능. countplot: y축 고정. boxplot: 자유롭게 y축과 estimator 조절. 특징에 따라 원하는 시각화. 3. 시계열 데이터 시간의 흐름을 보여주는 인덱스. datatime을 이용해 시계열 데이터 확인할 예정. 기존 분석과..

데이터 시각화에 대한 내용을 정리해 보겠습니다. 시각화 모듈의 문법과 로직 matplotlib, seaborn: 가장 많이 사용하는 툴 matplotlib의 불편한 부분을 보완하기 위해 seaborn 많이 사용. 왜 시각화 진행? 시각화: 데이터 분석 나의 주장이나, 가설을 설득하기 위한 하나의 과정. 나의 주장과 가설 잘 뒷받침할 수 있는 시각화를 통해 상대방 설득. 의미가 변수간의 관계 확인용 외에도 데이터 분석에서 본인의 주장, 가설이 베이스로 진행이 되는 것. 시각화는 상대방을 쉽게 설득시킬 수 있어야 한다. 맥킨지에서도 말하지만, 데이터 시각화로 잘못되게 표현하면 안 된다. 다양한 시각화 그래프가 많지만, 가장 단순하고 확실히 이해할 수 있는 시각화 등이 중요하다. 화려하다고 좋은 게 아니다. ..