2024/11 18

태블로의 주요 기능 : 계산된 필드

계산된 필드 (Calculated Field)태블로에서 수행하는 데이터분석의 확장성에 핵심적인 기여를 하는 기능계산된 필드 : 데이터에 있는 필드를 활용해 새로운 필드를 만드는 작업Sales + Profit 이라는 새로운 필드를 생성했다.생성한 필드는 자유롭게 사용 가능하다.필드 앞 아이콘의 =# 은 기존에 있는 필드를 활용해서 만들어진 계산된 필드라는 의미. 기존에 있는 Profit Ratio필드 또한 =# 아이콘이 붙어있는 것을 확인할 수 있다.이 필드도 SUM()으로 연산하는 과정이 들어가 있다. 중요! 태블로는 계산된 필드를 만들 때 왜 SUM을 붙여준 것일까요? [Profit] / [Sales] 도 유효한 계산이다. 필드에도 문제는 없다.그러나 여기에 태블로가 계산을 수행하는 방식이 숨어있다. ..

[Tableau] 2024.11.28

지도 그리기

지도 (Map)지도는 데이터에 공간적 맥락을 부여함으로써 BI 리포트를 풍성하게 만든다. 시도 및 시군구 화면 만들기필드 앞의 문자열을 의미하는 ABC 기호 클릭 -> 제일 아래쪽 지리적 역할 -> 시/도 또는 시군구. 필드에 맞게 선택시군구도 똑같이 바꿔준다.태블로는 우리나라 광역지자체 및 기초지자체 경계 정보를 가지고 있다. 합계(Profit) 을 마크 카드의 색상으로 드랍기본적인 지도 그리기가 완성되었다. 새 시트에서Address SGG를 시트에 표시시키면 7개의 알수없는 항목이라는 창이 뜨는데, 클릭 -> 위치 편집위치가 불확실한 7군데의 지역에 대한 정보가 나온다.이 지역들은 전국에 두 곳 이상 존재하는 지자체이다.이 문제들을 해결하기 위해선 시군구 필드를 바로 화면에 올리기보다는 항상 시/도 ..

[Tableau] 2024.11.26

태블로의 주요 기능 : 분석 패널 (3)

클러스터링17가지의 Sub-Category가 크게 4개의 그룹으로 구분된다.적용 알고리즘 : K-Means Clustering마크 카드 색상 -> 클러스터에서 우클릭 -> 클러스터 편집고려된 변수를 확인할 수 있고 클러스터 수도 지정할 수 있다.필드를 드래그 & 드랍하여 변수를 추가할 수 있다. 하지만 K-Means Cluster를 사용할 때 최적의 클러스터 개수를 찾는 Elbow Point 등의 기법들은 주어지지 않기 때문에 태블로에서만으로 이 기능을 활용하기는 조금 어려울 것 같다.   참조선참조선으로 활용할 측정값이 반드시 화면 안에 들어와있어야 한다.서브 카테고리 별 합계(Profit) 값을 참조선으로 사용하고 싶다면Profit을 세부정보에 올린 후, 참조선을 셀로 추가한다.세부옵션들을 설정해준다..

[Tableau] 2024.11.26

태블로의 주요 기능 : 분석 패널 (2)

추세선IF 할인율이 높아지면 수익성은 떨어진다는 추측을 검증할인이 이루어지지 않은 제품들은 화면에서 제외하고다양한 추세선들 중 일단 선형으로 그어보자. Discount와 Profit Ratio간의 상관관계가 수식으로 표현된다.(선형 추세) 할인율이 커질수록 수익성을 떨어진다는 것을 확인 이번엔 다항식 추세선을 그어보자. (다항식 추세) 기존 정보 + 새로운 정보 : 35% 할인율을 기점으로 할인율이 증가함에 따라 수익성은 급격히 악화된다.지금 데이터가 분포하고 있는 현황이나 경향성등을 한눈에 잘 파악할 수 있도록 도와준다.   예측예측 추가 태블로의 예측 기법 : 지수평활법(Exponential Smoothing)예측 라인 위에서 우클릭 -> 예측 -> 예측 옵션예측에 대한 다양한 옵션을 선택할 수 있다..

[Tableau] 2024.11.26

태블로의 주요 기능 : 분석 패널 (1)

분석창 (Analytics Pane)화면을 만든 후에 +a 를 첨가할 수 있는 기능 모음 상수&평균 라인분석창에서 상수 라인을 시트 위로 드랍상수 라인 : 사용자가 설정한 특정한 값을 화면에 표시ex) 각각의 카테고리에서 설정했던 목표치(60만) 보다 어느정도 잘 하고 있는지 눈에 손쉽게 파악 가능 평균라인은 참조선을 추가할 항목이 세 개 존재한다.셀 : 카테고리 각 항목 하나하나 / 테이블 : 화면 전체 / 패널 : 셀과 테이블 중간의 개념평균라인 : 현재 VLOD에 올라가 있는 값들에 대한 평균평균 라인 우클릭 -> 편집 -> 레이블 -> 사용자 지정 -> = 한 화면에서 평균 라인은 1개. 상수 라인은 2개 이상 포함 가능Category를 한 번 더 분기하면상수 라인은 VLOD에 관계없이 일정, ..

[Tableau] 2024.11.26

태블로의 주요 기능 : 이중축 (강조 포인트 제공 / 디자인 효과 또는 컨텍스트 부여)

두번째 : 강조 포인트 제공특정 한 기간을 강조하고 싶을 때(2024년 11월)2024년 11월에 해당하는 별도의 Sales 금액 필요(두번째 측정값)계산된 필드를 하나 만들어 주자.(2024년 11월달의 Sales 금액을 가져온다.)새로만든 필드를 행 선반에 올린다.계산된 필드에 대해 이중축을 생성한다.양 쪽 축을 동기화 시킨다. 2024년 11월의 Sales 금액을 강조하기 위해 마크 카드를 원으로 바꿔주고, 크기를 키운다.ctrl 드래그로 계산된 필드를 텍스트 레이블로 넣어주게 되면 전체 라인 차트 중에서 강조하고 싶은 특정 시기에만 레이블이 표시되고, 별도의 마크로써 강조가 가능하다.정리 : 강조하고 싶은 별도의 측정값을 만들어주고, 이중축을 생성하고, 마크와 레이블을 사용하면 특정 부분이 강조된..

[Tableau] 2024.11.24

태블로의 주요 기능 : 이중축 (기본 사용법)

이중축 (Dual Axis) 이중축의 세 가지 용도 첫번째 : 이중축의 의미에 충실한 기본 사용법 이중축 만드는 방법 (1) : 두번째 측정값을 화면 오른쪽으로 점선이 보일 때까지 끌기양 쪽에 축이 생긴 것을 확인할 수 있다.이중축 만드는 방법 (2) : 두번째 측정값 우클릭 -> 이중축 선택이중축의 특징 : 두 개의 측정값에 대해 각각의 마크 카드 생성마크 전체를 막대 모양으로 바꿔준다.측정값 하나의 막대 크기를 줄여주면 뒤에 가려진 측정값도 확인 가능하다.또한 막대의 불투명도도 조절할 수 있다.여기서 문제가 발생한다. Chairs의 Sales 값은 335,768인데 반해 Copiers의 Profit은 56,094이다. 값은 다르지만 막대의 높이는 비슷하게 나온다.그것은 왼쪽과 오른쪽 축의 스케일이 다..

[Tableau] 2024.11.24

태블로의 주요 기능 : 필터 (2)

측정값 필터Sales를 필터에 드랍집계된 측정값으로 필터링 할 것인가 / Raw 레벨에서 필터링 할 것인가 선택 가능합계 선택집계된 측정값 합계(Sales)의 범위 내에서 값 범위를 지정해줄 수 있다. 그러면 최소값과 최대값을 어떻게 정해주느냐에 따라 현재 Region 열 중에서 어떤 막대바가 시트인, 시트아웃되는지 정해진다. 이번엔 모든 값을 선택(데이터셋의 Raw 레벨에서 필터링)값 범위가 달라진 것을 확인할 수 있다.이것은 Sales 열의 하나하나의 값들 중에서의 최소값과 최대값이다.값 범위를 지정해주면 Sales값이 이 범위 안에 있는 행들에 대해서만 집계된 결과를 바 차트로 보여주는 것이다.(행 선반에 합계(Sales)를 올려놨으므로.)   숨기기테이블 계산 결과를 화면에 나타내고 싶지 않을 때..

[Tableau] 2024.11.22

태블로의 주요 기능 : 필터 (1)

추출 필터데이터 원본 소스에서 데이터의 일부분만 추출하고 싶을 때데이터 연결 화면에서 연결의 추출을 선택 -> 편집 -> 필터 -> 필터 추가 -> Order Date필터 필드 -> 년가장 최신 연도인 2024 선택하고 확인 -> 저장시트1로 이동하게 되면다음과 같이 방금 추출한 2024년도 데이터를 어디에 저장할지 물어본다.앞으로 이루어질 모든 Visualization 작업은 지금 추출하고 있는 이 Local 데이터와 커뮤니케이션을 하면서 시각화를 만들겠다고 알려주는 것이다.  Tableau Filters라는 폴더에 저장을 해 주었다.레코드 수를 확인해보면 2024년 데이터만 불러왔기 때문에 작아진 것을 확인할 수 있다.   데이터 원본 필터작업을 위한 데이터 중 일부만을 워크 스페이스로 불러올 때 데..

[Tableau] 2024.11.22

하이라이트 테이블 그리기

하이라이트 테이블 만드는 방법(1)Sales를 한 번 더 마크 색상에 드랍하고, 마크 모양을 사각형으로 바꿔준다.  (2)Sales와 Product Category, Order Timestamp를 동시 선택하고표현 방식에서 하이라이트 테이블을 선택하면 같은 결과물이 나온다.    복수의 측정값 활용Product Sub-Category를 행에, Sales를 마크 텍스트에, Profit을 합계(Sales) 열 옆에다 드랍한다.같은 방식으로 나머지 측정값들을 드랍(주의! Discount는 집계를 평균으로 바꿔준다)평균(Discount)의 서식을 선택패널에서 기본값 숫자를 백분율로 변경해준다.색깔을 칠해줄 차례다.연속형 측정값 필드를 마크 색상에 드랍해 주거나,마크 텍스트에 들어있는 측정값을 ctrl + 클릭 ..

[Tableau] 2024.11.22