Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 전처리
- interpolate
- join
- sklearn
- Boxplot
- 데이터프레임
- DataFrame
- 결측치대체
- subplots
- stopwords
- IterativeImputer
- Outlier
- BDA
- 파이썬
- value_counts
- koNLPy
- 불용어
- 선형보간
- matplotlib
- Seaborn
- 누락값
- 보간법
- 대치법
- MSE
- KoNLP
- 이상치
- SimpleImputer
- 결측치
- countplot
- Python
Archives
- Today
- Total
ACAIT
[BDA 데분기] 9주차 필수 과제 2 - 시계열 데이터 분석 및 시각화 본문
crime 데이터로 시계열, 시각화 분석
0. 데이터 타입 수정 및 인덱스 추가
1. 범죄 분석
1-1. 연도별 범죄 발생 추세
- 2012년부터 계속하여 범죄 비율이 상승한 것으로 확인된다.
- 2017년은 건수는 적으나 9월까지 반영된 자료이므로 기간에 비해 비율이 높은 것으로 해석된다.
1-2. 월별 교통사고 발생 추세
- 7, 8월의 가장 범죄 비율이 높은 것으로 나타난다.
- 건수로 시각화를 진행하더라도 7, 8월이 여전히 높은 비중을 차지하고 있다.
1-3. 연월별 범죄 발생 추세
- 6, 7, 8월은 범죄 비율 상위권에 꾸준히 위치하고, 1, 3, 4월은 2014년부터 상위권을 유지하는 것으로 확인된다.
1-4. 타입별 범죄 추세
- 상위 5개의 타입은 차량 물건 도난, 기타 교통, 차량 도난, 기타 도난, 자동차 범죄 사건이다.
- 그 중 가장 건수가 많은 것은 차량 도난 사건이고, 해당 범죄의 카테고리는 범죄명과 동일하다.
1-5. 카테고리별 범죄 추세
- 총 범죄 건수가 많은 사건은 기타 범죄이다.
- 그 중에서도 가장 건수가 많은 2016년도를 분석하여 추세와 세부 타입을 확인한다.
- 2016년도 all-other-crimes 카테고리의 경우 상반기에 범죄가 많이 발생하는 것으로 확인된다.
- 기타 교통 사건은 상반기에 발생 건수가 더 많은 것으로 확인된다.
- 무단 침입은 1, 5, 9, 12월에 많은 건수를 나타내며, 대체로 4개월에 한 번씩 높은 건수를 나타낸다.
- 기타 공공 질서 범죄는 하반기에 발생 건수가 더 많은 것으로 확인된다.
2. 교통사고 분석
2-1. 연도별 교통사고 발생 추세
- 2012년부터 전체 건수는 상승하였으나 교통사고 비율은 계속하여 하락한 것으로 확인된다.
- 2012년은 건수는 적으나 6월부터 반영된 자료이므로 건수에 비해 비율이 높은 것으로 해석된다.
2-2. 월별 범죄 발생 추세
- 봄, 여름보다 가을, 겨울철에 범죄 비율이 높은 것으로 나타난다.
- 건수로 시각화를 진행한 결과 5~9월이 높은 건수를 타나태고 있다.
- 이는 2012년 데이터가 6월부터 반영되어 있다.
- 2017년 데이터가 9월까지 반영되었으므로 위와 같은 결과가 나온 것.
- 건수보다 비율로 분석하는 것이 더 적합하다고 판단된다.
2-3. 연월별 범죄 발생 추세
- 1, 2월은 범죄 비율 상위권에 위치하고, 9~12월은 2016년까지 상위권을 유지하는 것으로 확인된다.
2-4. 타입별 범죄 추세
- 교통사고 세부 타입은 교통사고, 뺑소니, 음주 운전, 차량으로 인한 폭행, 차량으로 인한 살인이다.
- 그 중 가장 건수가 많은 것은 교통사고이고, 해당 범죄의 카테고리는 범죄명과 동일하다.
2-5. 카테고리별 범죄 추세
- 총 범죄 건수가 많은 traffic-accident 중에서도 가장 건수가 많은 2016년도를 분석하여 추세와 세부 타입을 확인한다.
- 2016년도 traffic-accident 카테고리의 경우 하반기인 8, 9, 10월에 범죄가 가장 많이 발생하는 것으로 확인된다.
- 교통사고는 하반기에 발생 건수가 더 많은 것으로 확인된다.
- 뺑소니는 1, 3, 5, 7, 10, 12월에 많은 건수를 나타내며, 대체로 2개월에 한 번씩 높은 건수를 나타낸다.
- 음주운전은 1, 6, 12에 많은 건수를 나타내며, 대체로 6개월에 한 번씩 높은 건수를 나타낸다.
3. 분석 최종 결론
- 연도별 추세 분석 결과 범죄 비율을 확인할 수 있었다.
- 건수로 비교했을 때는 일부만 반영된 2012년도와 2017년도가 적게 나타났으나, 비율로 분석할 경우 꾸준히 증가하는 추세를 보인다.
- 월별 추세 분석 결과 범죄 비율을 확인할 수 있었다.
- 연월을 종합하여 파악했을 때 범죄 비율 상위권을 확인할 수 있었다.
- 범죄 건수 상위 타입과 카테고리를 확인하고, 어떤 월에 사고가 많이 발생했는지 파악할 수 있었다.
'학회 활동 > BDA 7기(데이터 분석 기초반)' 카테고리의 다른 글
[BDA 데분기] 11주차 - 데이터 전처리 (1) | 2024.01.31 |
---|---|
[BDA 데분기] 10주차 - kaggle master 코드 분석 (1) | 2024.01.31 |
[BDA 데분기] 9주차 필수 과제 1 - 반복문으로 데이터 시각화 (0) | 2024.01.31 |
[BDA 데분기] 9주차 - 데이터 시각화, 시계열 데이터 분석 (0) | 2024.01.31 |
[BDA 데분기] 8주차 - 데이터 시각화, matplotlib, seaborn (1) | 2024.01.31 |