2023. 12. 23. 09:11ㆍPower BI
법무부_도착지별 내국인 출국자 현황(월별) 데이터를 활용하여 대시보드를 만들어 보도록 하겠습니다.
코로나가 종식된 지도 한참이 지나고 해외로 나가는 인원이 다시 증가하고 있는 추세입니다.
최근 업데이트 된 데이터를 검색하다 보니 예전에 tableau로 작업을 했던 데이터였는데
최신화된 데이터가 있어 이번에는 Power BI를 활용해서 데이터 시각화를 한번 진행해 보았습니다.
데이터는 위의 사이트를 방문하시면 받으실 수 있습니다
데이터 탐색
데이터를 간단하게 살펴보도록 하겠습니다. 가로형으로 국가별 출국자 현황이 기록되어 있습니다.
국가별로 비교 및 시계열로 분석이 가능할 것으로 생각됩니다.
데이터 전처리
Power BI로 데이터를 불러와 보도록 하겠습니다. cvs로 데이터를 가져온 후 Power Query 창을 띄워 주었습니다.
열피벗해제를 통해서 가로형 데이터를 세로로 만들어 줍니다. 자동으로 특성, 값 컬럼으로 변경되는 것을 볼 수 있습니다.
( Python에서는 melt 함수를 활용하면 variable, value로 구분되는 것과 비슷한 것 같습니다. )
특성은 시계열 분석을 위해서 날짜 형식으로 변경을 해 주도록 하겠습니다.
"값 바꾸기"를 활용하여 "년 "을 "-"으로 "월"을 ""으로 변경해 주었습니다.
그리고 마지막으로 연도의 데이터 형식을 날짜로 변경해 주었습니다.
데이터 모델링
날짜 계층 형식을 이용해서 데이터 분석을 진행해도 되겠으나 있어 보이기 위해서 데이터 모델링을 진행해 보도록 하겠습니다.
Date Table을 만들고 calendar 함수를 이용하여 Date 컬럼을 만들어 주고 year, month, yearmonth 컬럼을 추가해 주었습니다.
그리고 date[Date] 1 - * 법무부_도착지별 내국인 출국자현황[년도] 데이터 모델링을 진행해 줍니다.
행선국도 아시아주, 미주, 구주 구분을 위한 테이블을 추가할 수 있겠지만 일단 그냥 진행해 보도록 하겠습니다.
데이터 모델링은 스타스키마를 이루면 더욱 있어 보이기도 하고 효율적 데이터 관리가 가능하기 때문에 모델링은 습관적으로
만들어 주는 것이 좋은 것 같습니다.
Measure 테이블 만들기
측정값 관리를 위해서 Measure 테이블을 만들어 측정값을 다양하게 만들어 보도록 하겠습니다.
우선 그냥 값을 써도 되겠지만 방문자 측정값을 하나 만들어 보도록 하겠습니다.
calculate 함수를 활용해서 값의 합계를 만들 수 있는 방문자 측정값을 만들어 주었습니다.
데이터 시각화
이제 데이터 시각화를 진행해 보도록 하겠습니다.
데이터를 살펴보고 어떤 항목이 들어가면 좋을지 생각해 보겠습니다.
우선 국가별 방문 현황을 만들어 보면 좋을 것 같습니다. Power BI의 Geometry의 장점은
국가, 시도의 대략적 위치를 Bing 기반으로 제공해 주기 때문에 행선국을 지도에 매핑하면
자동으로 국가의 중심점을 인식하여 지도에 표기해 줍니다.
① 지도 시각화
데이터에 행선국, 방문자를 넣으면 다음과 같이 자동으로 지도 시각화를 해 주는 것을 볼 수 있습니다.
② 시계열 라인 그래프
X축에 ym컬럼을 값에 방문자를 넣어 주었더니 Trend를 확인할 수 있습니다.
3 ~ 4월에 잠시 감소하였다가 지속적으로 증가하는 것을 확인할 수 있습니다.
Power BI는 동적으로 작용하기 때문에 왼쪽 국가의 원을 클릭하면 우측의 그 국가의 트렌드를 바로바로 확인이 가능합니다.
③ 하기휴가 시 방문지 Best
트렌드를 보면 지속적으로 증가하지만 하기휴가 7 ~ 8월에 많이 방문하는 국가가 궁금해집니다
Trend를 각 국가별 방문 가중치가 반영되어 있지 않기 때문에 드릴다운하여 분석해 보는 방법이 필요해 보입니다.
calculate & filter를 활용해서 7 ~ 8월 방문객만 측정값을 만들어 줍니다
( SQL 기반 측정값이므로 select where절을 사용했다고 생각하셔도 될 것 같습니다 )
다음과 같이 해 주었더니 여름 가장 많이 방문하는 지역은 일본, 베트남, 필리핀, 타이, 중국, 미국 순으로 많은 것을 볼 수 있습니다.
④ 지속적 방문 증가 국가 현황
하나 궁금한 사항이 발생합니다. 몽골은 잠깐 올라가는데 중국은 지속적으로 방문이 늘고 있어서 국가별 Trend가 한 번에 알고 싶어 집니다
이번에는 11월에서 1월 방문자를 빼서 증감을 알아보고 지속 방문 증가하는 국가를 알아보겠습니다.
중국, 일본, 베트남은 지속 증가하는 반면, 싱가포르, 미국, 타이는 감소하는 것 볼 수 있습니다.
라인트렌드로 보면 가중치가 반영되지 않아 증감이 커 보이는 경우가 있는데 이 경우는 가중치도 같이 고려해 주는 상황이 가능하여
한눈에 비교가 가능한 것 같습니다.
이제 마지막으로 대시보드를 만들고 디자인을 해 보도록 하겠습니다.
figma를 활용하지는 않고 Power BI 기본을 활용하여 만들어 보았습니다.
더 많은 사람들이 다양한 아이디어를 더하면 다른 데이터와의 연결을 통해서 다양한 분석이 가능하지 않을까 생각합니다.
'Power BI' 카테고리의 다른 글
[ 파워 BI ] 대한민국 인구증감 ( 출생 - 사망 ) (0) | 2024.01.14 |
---|---|
[ 파워 BI ] 대한민국 인구 현황 ( 2010 ~ 2023 ) (0) | 2024.01.07 |
[ 파워 BI ] 강원랜드 ( 카지노 ) 외국인 방문객 및 게임 종류별 이용 현황 (0) | 2023.12.30 |
[ 파워 BI ] 파워 쿼리를 이용한 데이터 합치기 ( 파일 합치기 ) (0) | 2023.03.24 |
[ 파워 BI ] 외국인 관광객 현황 ( feat. Power BI ) (0) | 2023.01.26 |