[ 파워 BI ] 대한민국 인구증감 ( 출생 - 사망 )

2024. 1. 14. 08:17Power BI

728x90
반응형

대한민국 출생 - 사망 현황을 행정안전부에서 제공하는 자료가 있어 만들어 보았습니다.

대한민국의 인구 구조는 저출산, 고령화 및 최근에는 인구가 감소하는 추세를 보이고 있다고 하는데 

이러한 추세는 평균 및 전체를 반영한 상황일 뿐 지역별로 봤을 때는 높고 낮음이 있을 것 같은 느낌이 있었는데

이번 데이터를 활용하면서 그래도 증가하는 지역이 있을 수 있구나 하는 느낌을 받았습니다.


 

 

공공데이터 포털

국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase

www.data.go.kr

활용 데이터 

ㅇ 지역별 / 성별 출생등록자수

ㅇ 지역별 / 성별 / 연령별 사망말소자수


① 출생등록자수

출생자 등록자수가 있는 폴더를 선택 후 파워쿼리로 데이터를 불러옵니다.

1. Content를 제외다고 다른 열 제거

2. Cvs.Document를 활용하여 CVS 파일 변환

3. 첫 행을 머리글로 활용

모두 Nested Table에서 M function 사용하여 전처리 진행

전처리를 완료 후  Table.Combine 함수를 활용하여 데이터 통합

 

 

 

다음과 같이 테이블을 만든 후 통계년월을 날짜 형식으로 변경해 줍니다.

값 바꾸기를 활용하여 "년 " → "-", "월" → ""로 변경하여 우측과 같이 변경해 줍니다.

계 컬럼에서 값이 "0"을 필터링하여 데이터를 줄여줍니다.

파워쿼리는 지속적으로 데이터를 줄이는 작업을 해주는 것이 핵심입니다.

해당 컬럼만 남겨주고 모두 지워 줍니다.

지역은 추후에 Dimension 테이블에서 처리하도록 하겠습니다.

 

 

남자, 여자 컬럼을 열 피벗을 해준 후 컬럼명을 변경해 주고 형식을 맞춰 줍니다.

 

 

 


② 사망말소자수

전처리는 위의 작업과 동일합니다. 다른 점은 연령별 인구를 확인하기 위해서 열 피벗 해제를 해 준 후 성별과 연령을 분리해 줍니다.

연령의 "만", "세", "이상"을 제거해 주고 형식을 변경해 주고 전처리를 완료해 줍니다.

아, 사망자수의 "0" 제거를 통해서 불필요한 데이터를 줄여줍니다.


③ 법정동코드 ( Dimension )

법정동 코드를 활용하여 지역명은 해당 테이블에서 관리를 진행해 줍니다.

법정동명을 공백으로 구분 후에 디테일한 분리를 위해서 경기도 고양시 덕은 / 덕양 는 정확하게 분리를 해 주도록 합니다.

if [법정동명.3] = null then null else if Text.EndsWith([법정동명.3], "구") then [법정동명.3] else null

사용자 지정 컬럼을 추가 해 다음과 같이 입력해 줍니다.

컬럼을 정리해 주고 데이터 형식을 지정해 주고 데이터 전처리를 완료해 줍니다.


날짜 테이블을 생성 후

법정동코드를 연결해 주고 

성별도 별도로 연결해 줍니다.

Measure Table도 만들어 주겠습니다. 

 

 

 

 


① 출생 / 사망 트렌드 확인( KPI card )

kpi card를 사용하여 kpi card를 만들어 주고 추세에 년월을 넣어 줍니다. 

다음과 같이 22.01 ~ 23.12월까지의 각 항목의 트렌드가 배경으로 나타내게 됩니다. 

Target을 설정하면 증가 시와 하락 시 색이 변경되는데 일단 트렌드만 한번 보도록 하겠습니다.

 

② 출생 / 사망자 시계열 트렌드 ( Line Chart )

22.2 ~ 4월 사망자 증가 후 일정 트렌드를 유지하고 있는 걸로 보이는데 출생률은 지속 감소하는 걸로 보입니다.

아래와 같이 만든 후 증가 vs 감소의 다르다면 주식의 차트와 같이 만들어 줄 수 있을 것 같은데 

해보고 싶지만 시간이 좀 더 필요할 것 같아서 일단 두 개의 차트를 만들어서 비교해 주도록 하겠습니다.

아쉬운 대로 다음과 같이 만들어서 Gap을 확인해 줍니다. 파이썬이나 Tableau를 쓰고 싶은 순간입니다.

③ 연령별 사망자 현황 ( bar Chart )

 

④ 지역별 인구증감 ( 사망 - 출생 , Map Chart )

아래와 같이 지도 차트를 만들어 줍니다. 하지만 최소값 ( - )에서 최대값으로 증가하다 보니 음수 / 양수 구분이 되지 않아서 

색으로 구분해 주도록 하겠습니다.

아래와 같이 색으로 구분해 주니 사망 > 출생이 큰 지역과 아닌 지역이 분리가 되는 느낌입니다.

그런데 뭔가 원의 크기가 분명하지 않은 것 같습니다. 

아래와 같이 진행되어야 할 것 같은데 프로세스가 좀 안 맞는 거 같아 절대값을 활용해 보도록 하겠습니다.

이제 음수의 크기와 양수의 크기 모두 비교가 가능해 보입니다.


⑤ 대시보드 만들기

왼쪽 지역 필터를 만들고 왼쪽  상단에 New card를 활용하여 인구증감 - 출생자수 - 사망자수를 표기해줍니다.

그 아래 지도를 놓아주고 우측에 사망 / 출생자 시계열 트렌드 및 사망 - 출생의 Gap을 아래 만들어 줍니다.

우측 하단 연령별 성별 사망자를 표기해 줍니다. 그리고 마지막으로 살짝 디자인을 진행해서 다음과 같이 만들어 주었습니다.

음 근데 왼쪽 시도 필터가 조금 심심해 보이는 거 같습니다.  최근에 추가된 기능으로 이미지를 넣어 보도록 하겠습니다.

※ New 필터카드 이미지 활용

해당 이미지는 한국 관광공사에서 사용하는 대한민국 구석구석의 이미지를 활용하였습니다. 

 

여행콕콕, 핫플콕콕 | 대한민국 구석구석

요즘 인기 있는 여행지는 다 모였네! 지역별 여행지와 맛집 정보를 확인해 보세요~

korean.visitkorea.or.kr

Switch 함수를 활용해서 값을 이미지로 변경해 주고 가져가기, 누르기, 선택된 상태를 만져주면

다음과 같이 시각적으로 보기 좋은 디자인이 나오게 되었습니다.

반응형

경기도 지역 현황입니다. 보기 드물지만 출생자가 사망자를 상위하는 년도도 있으며 지역도 다수 포진합니다.

아마 일자리가 많은 지역이나 신도시 지역의 신혼부부가 많이 살고 있다는 생각이 드는 부분입니다.

대전 유성구 출생률이 높게 나타나는 지역입니다. 정말 바람직한 지역이라는 생각이 듭니다.

서울시 송파구 서울에서 그나마 인구가 증가하는 추세를 보이고 있는 지역입니다. 

해당 지역에는 대규모 신도시가 있다고 들었는데 그 부분에 대한 영향이 아닌가 생각됩니다.

728x90
반응형