ACAIT

[BDA 데분기] 9주차 필수 과제 2 - 시계열 데이터 분석 및 시각화 본문

학회 활동/BDA 7기(데이터 분석 기초반)

[BDA 데분기] 9주차 필수 과제 2 - 시계열 데이터 분석 및 시각화

831x99 2024. 1. 31. 22:52

crime 데이터로 시계열, 시각화 분석

0. 데이터 타입 수정 및 인덱스 추가


 

1. 범죄 분석


1-1. 연도별 범죄 발생 추세

  • 2012년부터 계속하여 범죄 비율이 상승한 것으로 확인된다.
  • 2017년은 건수는 적으나 9월까지 반영된 자료이므로 기간에 비해 비율이 높은 것으로 해석된다.

1-2. 월별 교통사고 발생 추세

  • 7, 8월의 가장 범죄 비율이 높은 것으로 나타난다.

  • 건수로 시각화를 진행하더라도 7, 8월이 여전히 높은 비중을 차지하고 있다.

1-3. 연월별 범죄 발생 추세

  • 6, 7, 8월은 범죄 비율 상위권에 꾸준히 위치하고, 1, 3, 4월은 2014년부터 상위권을 유지하는 것으로 확인된다.

1-4. 타입별 범죄 추세

  • 상위 5개의 타입은 차량 물건 도난, 기타 교통, 차량 도난, 기타 도난, 자동차 범죄 사건이다.
  • 그 중 가장 건수가 많은 것은 차량 도난 사건이고, 해당 범죄의 카테고리는 범죄명과 동일하다.

1-5. 카테고리별 범죄 추세

  • 총 범죄 건수가 많은 사건은 기타 범죄이다.
  • 그 중에서도 가장 건수가 많은 2016년도를 분석하여 추세와 세부 타입을 확인한다.

  • 2016년도 all-other-crimes 카테고리의 경우 상반기에 범죄가 많이 발생하는 것으로 확인된다.

  • 기타 교통 사건은 상반기에 발생 건수가 더 많은 것으로 확인된다.
  • 무단 침입은 1, 5, 9, 12월에 많은 건수를 나타내며, 대체로 4개월에 한 번씩 높은 건수를 나타낸다.
  • 기타 공공 질서 범죄는 하반기에 발생 건수가 더 많은 것으로 확인된다.

 

2. 교통사고 분석


2-1. 연도별 교통사고 발생 추세

  • 2012년부터 전체 건수는 상승하였으나 교통사고 비율은 계속하여 하락한 것으로 확인된다.
  • 2012년은 건수는 적으나 6월부터 반영된 자료이므로 건수에 비해 비율이 높은 것으로 해석된다.

2-2. 월별 범죄 발생 추세

  • 봄, 여름보다 가을, 겨울철에 범죄 비율이 높은 것으로 나타난다.

  • 건수로 시각화를 진행한 결과 5~9월이 높은 건수를 타나태고 있다.
  • 이는 2012년 데이터가 6월부터 반영되어 있다.
  • 2017년 데이터가 9월까지 반영되었으므로 위와 같은 결과가 나온 것.
  • 건수보다 비율로 분석하는 것이 더 적합하다고 판단된다.

2-3. 연월별 범죄 발생 추세

  • 1, 2월은 범죄 비율 상위권에 위치하고, 9~12월은 2016년까지 상위권을 유지하는 것으로 확인된다.

2-4. 타입별 범죄 추세

  • 교통사고 세부 타입은 교통사고, 뺑소니, 음주 운전, 차량으로 인한 폭행, 차량으로 인한 살인이다.
  • 그 중 가장 건수가 많은 것은 교통사고이고, 해당 범죄의 카테고리는 범죄명과 동일하다.

2-5. 카테고리별 범죄 추세

 

  • 총 범죄 건수가 많은 traffic-accident 중에서도 가장 건수가 많은 2016년도를 분석하여 추세와 세부 타입을 확인한다.

  • 2016년도 traffic-accident 카테고리의 경우 하반기인 8, 9, 10월에 범죄가 가장 많이 발생하는 것으로 확인된다.

  • 교통사고는 하반기에 발생 건수가 더 많은 것으로 확인된다.
  • 뺑소니는 1, 3, 5, 7, 10, 12월에 많은 건수를 나타내며, 대체로 2개월에 한 번씩 높은 건수를 나타낸다.
  • 음주운전은 1, 6, 12에 많은 건수를 나타내며, 대체로 6개월에 한 번씩 높은 건수를 나타낸다.

 

3. 분석 최종 결론

  1. 연도별 추세 분석 결과 범죄 비율을 확인할 수 있었다.
    • 건수로 비교했을 때는 일부만 반영된 2012년도와 2017년도가 적게 나타났으나, 비율로 분석할 경우 꾸준히 증가하는 추세를 보인다.
  2. 월별 추세 분석 결과 범죄 비율을 확인할 수 있었다.
  3. 연월을 종합하여 파악했을 때 범죄 비율 상위권을 확인할 수 있었다.
  4. 범죄 건수 상위 타입과 카테고리를 확인하고, 어떤 월에 사고가 많이 발생했는지 파악할 수 있었다.