Tableau 9.0 미리 보기: 자동 데이터 준비를 통해 분석 흐름 유지

데이터가 정돈되어 있지 않더라도 분석을 수행할 수 있습니다. 현재 베타 단계에 있는 Tableau 9.0은 복잡한 데이터(예: Excel 스프레드시트) 정리 작업을 자동화합니다. Tableau 9.0에는 Excel 파일의 구조를 자동으로 파악하는 Tableau 데이터 해석기, 데이터를 피벗하고 분할하는 새로운 도구 및 메타데이터를 빠르게 처리하는 새 레이아웃이 포함됩니다. 8.2에서 출시된 자동 데이터 모델링 기능과 함께 이러한 새로운 기능을 사용하면 분석에 사용할 데이터를 빠르게 준비할 수 있습니다.

Tableau를 사용하기 위한 첫 단계는 데이터를 연결하는 것입니다. 신속하게 질문에 대한 답을 얻고, 모든 분석 기능을 사용하고, 웹 사용자나 모바일 사용자와 정보를 공유하려면 제일 먼저 데이터에 연결해야 합니다.

이미 알고 계시는 것처럼 데이터가 정돈되어 있지 않더라도 분석을 수행할 수 있습니다. 많은 사용자가 Tableau에서 사용할 데이터를 준비하기 위해 정기적으로 특수 도구와 스크립트를 사용합니다. 또는 데이터 문제를 해결하기 위해 복잡한 계산을 작성하면서 많은 시간을 허비하기도 합니다.

Tableau 9.0에서는 단조롭고 고된 데이터(예: Excel 스프레드시트) 정리 작업을 자동화합니다. 9.0의 개선 사항에는 Excel 파일의 구조를 자동으로 파악하는 Tableau 데이터 해석기, 데이터를 피벗하고 분할하는 새로운 도구 및 메타데이터를 빠르게 처리하는 새 레이아웃이 포함됩니다. 8.2에서 출시된 자동 데이터 모델링 기능과 함께 이러한 새로운 기능을 사용하면 분석에 사용할 데이터를 빠르게 준비할 수 있습니다.

데이터 준비에 대한 Tableau의 방침은 모든 사용자가 언제든지 데이터 연결에 기본적인 변경사항을 적용할 수 있도록 지원하는 것입니다. 이에 따라 Tableau의 기능에는 다음 4가지 핵심 특성이 갖춰져야 합니다.

  • 스마트 – 기능이 자동 적용되고 데이터를 깊이 있게 파악할 수 있어야 합니다.
  • 빠른 속도 – 빅 데이터를 사용하는 경우에도 실시간에 가깝게 작동되어야 합니다.
  • 반복 – 새로운 값, 행, 열 등 기본 데이터에 대한 변경사항을 허용해야 합니다.
  • 유연성 – 작업 내용을 유지하면서 언제든지 변경사항을 적용할 수 있어야 합니다.

Tableau 9.0에서는 이러한 특성을 실현하기 위해 여러 가지 새로운 기능이 출시될 예정입니다. 새 기능을 소개해 드리겠습니다.

Tableau 데이터 해석기
다음과 같은 Excel 파일이 있습니까?

Tableau는 데이터의 위치(데이터 값이 셀 B8부터 시작)와 구조(예: 시트에 복합형 머리글이 있음)를 자동 감지하여 이를 분석에 사용할 수 있는 데이터로 전환합니다.

피벗
많은 텍스트와 Excel 파일에는 실제로 유용한 데이터 값으로 활용할 수 있는 열 이름이 있습니다. 예를 들어 이 데이터에는 필드명으로 연도와 월이 있습니다.

최적의 분석 결과를 얻으려면 이 데이터에는 수많은 날짜 열 대신 '날짜'라는 이름이 지정된 열과 데이터 값이 있는 열이 하나씩 있어야 합니다. 즉, 데이터 집합의 일부를 피벗해야 합니다. 원하는 열을 선택하고 '피벗'을 선택하면 다음과 같이 표시됩니다.

분할
사용자의 데이터에는 전화번호(지역 번호), 전자 메일 주소, URL, 고유한 여러 구성체 등 복합적인 정보가 포함된 열이 많을 수 있습니다. '분할' 기능을 사용하면 Tableau가 자동으로 데이터를 샘플링하고 여러 구분 기호를 감지하여 새 열을 생성합니다. 우편번호와 위치가 조합된 열이 있습니다. 데이터 값은 다음과 같습니다. 90001 (33.973271508000494, -118.24896959899968). 3개의 부분을 분석하려면 복잡한 문자열 계산을 작성해야 합니다.

정규식(정규 표현식을 사용할 수 있는 기능)도 개선 사항 중 하나입니다. Tableau에서도 이제 정규식을 사용할 수 있습니다. 하지만 정규식 작성은 여전히 많은 사용자에게 쉽지 않은 작업입니다. 대신 마우스 오른쪽 버튼을 클릭하고 '분할'을 선택하면 다음과 같이 표시됩니다.

메시지나 별도의 선택사항 없이 3개의 열이 깔끔하게 정리되었습니다. 자동 분할 기능으로 필드의 구조를 찾을 수 없는 경우 구분 기호(일반적으로 쉼표, 공백 또는 기타 문자)를 제공하라는 메시지가 표시되며 간단한 SPLIT() 함수를 사용하여 언제든지 계산 결과를 편집할 수 있습니다. 이와 같이 3가지 새로운 방법으로 열을 필요한 부분으로 간편하게 분할할 수 있습니다.

메타데이터 그리드
분석을 위해 데이터를 준비할 때 경우에 따라서는 필드 목록이 데이터 미리 보기보다 유용하므로 연결에 대한 '메타데이터' 뷰가 추가되었습니다.

이 뷰를 사용하면 필드에 대해 더 많은 정보를 한 눈에 확인하고 필드 이름을 신속하게 바꾸고 여러 필드를 선택하여 일괄 작업을 수행할 수 있습니다. 여러 필드를 숨기고 싶으신가요? 간단합니다. 선택한 다음 '숨기기'를 선택하면 됩니다.

이 모든 기능의 가장 좋은 점은 특정한 순서로 적용할 필요가 없다는 것입니다. 실제로, 분석 중 언제든지 새 '데이터' 탭을 클릭하고 연결을 변경할 수 있습니다. 테이블 추가, 조인 변경, 필드명 편집, 새로운 기능 적용 등 모든 작업을 수행한 다음 분석으로 돌아가 보면 변경사항이 곧바로 반영되었음을 확인할 수 있습니다. 분석의 흐름을 유지할 수 있는 이러한 기능은 지금까지 없던 새로운 기능입니다.

물론, 이 모든 데이터를 준비하는 과정은 유용하고 멋진 시각적 분석을 만들 수 있는 진정 흥미로운 작업 기반이 됩니다. 데이터를 정리하는 과정은 사용자 자신만 알고 있지만, 최종 비주얼라이제이션과 상호 작용하는 모든 사람들이 결과에 매우 만족할 것입니다.