일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- KoNLP
- Outlier
- DataFrame
- 이상치
- 선형보간
- MSE
- join
- interpolate
- sklearn
- koNLPy
- Python
- SimpleImputer
- 파이썬
- 데이터프레임
- 전처리
- 결측치
- 대치법
- 불용어
- matplotlib
- Seaborn
- countplot
- BDA
- stopwords
- 보간법
- IterativeImputer
- value_counts
- Boxplot
- subplots
- 누락값
- 결측치대체
- Today
- Total
목록Boxplot (2)
ACAIT

저번 게시물에 이어 데이터 시각화 내용을 추가하고, 시계열 데이터 분석에 대해 정리해 보겠습니다. 1. 반복문 이용해서 시각화 2. Seaborn 2-1. sns.histplot() 2-2. sns.countplot() 2-3. sns.barplot() hue 인자 넣으면 범례 추가. 2-4. sns.boxplot() 2-5. sns.violinplot() 바이올린차트. 연속확률분포 차트 곡선과 boxplot 함께 시각화. 곡선 대칭, 가운데 몸통 수염. 반복문으로 가능. countplot: y축 고정. boxplot: 자유롭게 y축과 estimator 조절. 특징에 따라 원하는 시각화. 3. 시계열 데이터 시간의 흐름을 보여주는 인덱스. datatime을 이용해 시계열 데이터 확인할 예정. 기존 분석과..

데이터 시각화에 대한 내용을 정리해 보겠습니다. 시각화 모듈의 문법과 로직 matplotlib, seaborn: 가장 많이 사용하는 툴 matplotlib의 불편한 부분을 보완하기 위해 seaborn 많이 사용. 왜 시각화 진행? 시각화: 데이터 분석 나의 주장이나, 가설을 설득하기 위한 하나의 과정. 나의 주장과 가설 잘 뒷받침할 수 있는 시각화를 통해 상대방 설득. 의미가 변수간의 관계 확인용 외에도 데이터 분석에서 본인의 주장, 가설이 베이스로 진행이 되는 것. 시각화는 상대방을 쉽게 설득시킬 수 있어야 한다. 맥킨지에서도 말하지만, 데이터 시각화로 잘못되게 표현하면 안 된다. 다양한 시각화 그래프가 많지만, 가장 단순하고 확실히 이해할 수 있는 시각화 등이 중요하다. 화려하다고 좋은 게 아니다. ..