2024. 11. 7. 07:59ㆍPower BI/파워 쿼리 ( Power Qeury )
파워쿼리의 시작인 데이터 불러오기를 해 보도록 하겠습니다.
아래와 같이 엑셀 데이터를 준비해 준 후 바탕화면에 저장해 주었습니다.
원본은 건드리지 않는 것이 가장 좋기 때문에
새로운 엑셀을 하나 열어주고 해당 파일을 불러와 편집을 해 보도록 하겠습니다.
왜? 원본은 안 건드려야 할까요? 누가 파일을 보냈는데 작업하던 파일을 보내면 어떻습니까?
원본의 신뢰도가 떨어지고 어떤 항목을 수정했는지 몰라 잘 못 된 정보가 나올 수 있습니다.
[ 데이터 ] - [ 파일에서 ] - [ Excel 통합 문서에서]를 눌러 주도록 하겠습니다.
그러면 다음과 같이 파워쿼리 편집창이 나오는 것을 볼 수 있습니다.
Sheet1을 선택하면 우측과 같이 엑셀에서 입력한 데이터가 나오는 것을 확인할 수 있습니다.
[ 데이터 변환 ]을 눌러 주도록 하겠습니다.
자동으로 파워쿼리에서 데이터를 엑셀의 데이터와 동일하게 만들어 주는 것을 볼 수 있습니다.
작동하는 원리를 알기 위해서 적용된 단계를 모두 지우고 원본만 남겨보도록 하겠습니다.
알 수 없는 테이블이 하나 나오는 것을 볼 수 있습니다.
엑셀을 일반 파일과 다르게 파일 안에 Sheet라는 또 다른 데이터를 만들 수 있는 공간을 가지고 있습니다.
그래서 데이터를 작업하기 전 해당 단계가 나오게 됩니다.
구분 | 의미 | 세부사항 |
Name | 시트명 |
|
Data | 데이터가 있는 항목 | |
Item | 파일의 형식 | |
Kind | 파일의 종류 | |
Hidden | 숨겨져 있는지 |
해당 내용에 대한 이해를 위해서 원본은 살짝 변경해 보도록 하겠습니다.
왜 원본은 건드리지 말아야 하는지에 대한 설명도 될 수 있습니다.
나비효과처럼 작은 움직임이 거대한 태풍을 만들어 내는 것을 확인할 수 있습니다.
아래와 같이 원본을 한번 건드려 보겠습니다.
|
다시 데이터를 불러오도록 하겠습니다.
아까와는 다르게 다른 항목들이 생겨 있는 것을 볼 수 있습니다.
빠르게 데이터를 확장해서 숫자를 확인해 보도록 하겠습니다.
결과가 30,894가 나오는 것을 볼 수 있습니다.
원본의 합은 10,298인데 3배의 결과가 나오는 경우가 발생합니다.
우리가 엑셀에서 작업하는 것은 흔적이 남고 숨겼다고 생각한 파일을 모두 가져오게 되어 있습니다.
지금처럼 작은 데이터는 금방 추적이 가능하지만 데이터가 커지면 어떻게 될까요?
처음에 설계를 잘하는 것이 나중에 에러를 줄이는 좋은 습관이 될 것입니다.
해당 에러가 발생하지 않게 하기 위한 방법
#1. 원하는 데이터만 필터링해서 사용하는 방법
Name 컬럼에서 데이터만 선택해 준 후 데이터를 작업을 진행해 줍니다.
하지만 이런 경우 필요한 데이터를 추가해도 불러오지 않게 되는 경우가 발생하여 좋은 방법은 아닙니다.
#2. Hidden 컬럼을 필터링 하는 방법 ( 추천 - 데이터 확장성이 용이 )
Hidden 컬럼을 보면 필요한 데이터를 False라고 되어 있습니다.
숨기지 않은 파일 즉 작업하기 원하는 파일이라는 의미이며 해당 항목을 False만 선택하면 동일한 결과를 얻을 수 있습니다.
#1번과는 다르게 해당 방법은 데이터를 추가하면 불러와 동시에 작업이 가능합니다.
Data 컬럼 우클릭 후 다른 열 제거를 눌러 줍니다.
Data 컬럼의 우측상단 확장 버튼을 눌러 그냥 확인을 눌러보도록 하겠습니다.
[변환] - [ 첫 행을 머리글로 사용]을 눌러주거나 테이블 왼쪽 상단의 버튼을 눌러서 컬럼명을 위로 올려 줍니다.
[ 닫기 및 로드 ] - [ 닫기 및 다음으로 로드]를 눌러줍니다.
다양한 옵션이 있지만 이번에는 표로 가져와 보도록 하겠습니다.
다음과 같이 데이터가 불러와지는 것을 알 수 있습니다.
그런데 왜 그냥 해도 되는데 파워쿼리를 쓰는 거죠?
혹시 파일을 받았는데 프로세스를 진행한다고 하면서 열리기 전까지 커피 마셔 본 적 있으십니까?
해당 파일을 피벗테이블이나 수식을 사용하지 않고 sumif를 해 보도록 하겠습니다.
아래와 같이 한 단계만 추가하면 sumif를 할 수 있습니다.
닫기 및 로드를 눌러주면 아래와 같은 결과를 얻을 수 있습니다.
수식이 없기 때문에 로딩하는 일도 없을 것입니다.
'Power BI > 파워 쿼리 ( Power Qeury )' 카테고리의 다른 글
[ 파워쿼리 ] 엑셀 테이블의 짝수( 홀수 )행만 구하기 (0) | 2024.11.11 |
---|---|
[ 파워쿼리 ] 엑셀 열 번호 ( Row number ) 추가 (1) | 2024.11.10 |
[ 파워쿼리 ] 엑셀 시트 데이터 합치기 (1) | 2024.11.09 |
[ 파워쿼리 ] 데이터 불러오기 ( with. CSV ) (1) | 2024.11.08 |
[ 엑셀 Tip ] 이중 헤더( Double Header ) 전처리 ( Feat. 파워쿼리 ) (4) | 2024.10.16 |