엔터프라이즈를 위한 Tableau: IT 개요
요약
차세대 비즈니스 인텔리전스 및 시각 분석 소프트웨어는 데이터가 필요한 사람들에게 이를 마음껏 활용할 수 있는 방법을 제공합니다. 속도가 느리고 유연성이 떨어지는 시스템은 비즈니스 사용자 및 이들을 지원하는 IT 팀에게 더 이상 아무런 쓸모가 없습니다. 경쟁으로 인한 압박이 심해지고 데이터의 출처가 새롭게 변함에 따라 새로운 요구 사항이 생겨나고 있기 때문입니다. 오늘날 사용자는 신속하고 간편하게 원하는 답을 얻을 수 있는 역량을 필요로 하고 있습니다. 그리고 긍극적인 측면에서 볼 때 이는 매우 긍정적인 방향이라 할 수 있습니다.
Tableau Software는 데이터 분석과 이에 따른 보고 과정이 별개로 진행되는 것이 아니라, 사용자가 데이터의 패턴을 신속하게 파악하고 생각의 흐름에 따라 뷰를 전환할 수 있도록 단일화된 시각 분석 프로세스로 통합되어야 한다는 생각을 바탕으로 설립되었습니다. Tableau는 데이터 탐색과 데이터 비주얼리제이션을 사용이 간편하고 누구나 쉽게 배울 수 있는 응용 프로그램으로 통합합니다. Excel을 사용해본 사람이라면 누구나 내용이 풍부하고 상호작용이 가능한 분석 자료와 강력한 대시보드를 만들 수 있으며 전사에 걸쳐 이를 안전하게 공유할 수 있습니다. 또 IT 팀은 데이터 및 메타데이터를 중앙집중식으로 관리하고 사용 권한을 제어하며 배포 작업을 전사적인 규모로 확장할 수 있습니다.
이 개요는 IT 담당자 및 관리자가 일반적으로 궁금해 하는 사항에 답변하고 시각 분석 소프트웨어 배포를 규모에 관계 없이 진행할 수 있도록 지원하고자 작성되었습니다. 이 문서에서 다루는 주제는 다음과 같습니다.
- Tableau 아키텍처
- 배포 모델
- 보안
- 확장성
- 시스템 관리
- 데이터 전략
- 메타데이터 관리
- 모바일 배포
아키텍처
Tableau는 확장성이 뛰어나고 다층 구조로 구성할 수 있는 클라이언트-서버 아키텍처를 통해 모바일 클라이언트, 웹 클라이언트 및 데스크톱 설치 소프트웨어를 지원합니다. Tableau Desktop은 권한 부여 및 게시 도구로 Tableau Server에서 공유 뷰를 만들 때 사용됩니다.
Tableau Server는 수십만 명에 달하는 사용자를 지원하도록 확장할 수 있는 엔터프라이즈급 비즈니스 분석 플랫폼으로 강력한 모바일 및 브라우저 기반 분석 기능을 제공하며 기업의 기존 데이터 전략 및 보안 프로토콜과 연동이 가능합니다. Tableau Server:
- 뛰어난 확장 규모: 다중 스레드로 구성
- 뛰어난 확장 범위: 다중 프로세스 지원
- 통합 클러스터링 제공
- High Availability 지원
- 안전
- 실제 및 가상 컴퓨터에서 모두 작동
데이터 계층
Tableau의 가장 기본적인 특징 중 하나는 바로 사용자가 선택한 데이터 아키텍처를 지원한다는 점입니다. Tableau를 사용하면 데이터를 Tableau 소유의 단일 시스템 또는 기타 단일 시스템에 저장할 필요가 없습니다. 대다수 조직의 데이터 환경은 데이터 웨어하우스와 데이터베이스가 뒤섞여 있고 큐브 및 Excel과 같은 플랫 파일이 아직도 상용되는 등 이기종으로 구성되어 있습니다. Tableau는 이기종 데이터 환경의 모든 구성 요소와 연동되므로 사용자가 원하지 않는 이상 데이터를 메모리 내로 이동할 필요가 없습니다. 기존 데이터 플랫폼의 속도가 빠르고 확장성이 뛰어난 경우 플랫폼을 교체하지 않아도 데이터베이스를 활용하여 원하는 질문에 대한 답을 얻을 수 있으며, 그렇지 않은 경우 Tableau에서 제공하는 간단한 업그레이드 옵션을 통해 데이터가 신속한 Tableau 인메모리 데이터 엔진에서 빠르게 작동하고 응답하도록 업그레이드할 수 있습니다.
데이터 커넥터
Tableau에는 Microsoft Excel, SQL Server, Oracle, Teradata, Vertica, Cloudera Hadoop 등 각종 데이터베이스에 최적화된 다양한 데이터 커넥터가 포함되어 있습니다. 또한 커넥터가 없는 시스템을 위한 일반 ODBC 커넥터도 포함되어 있습니다. Tableau는 라이브 연결과 인메모리, 이렇게 두 가지의 데이터 상호작용 모드를 제공합니다. 라이브 연결과 인메모리 연결 모드는 원하는 대로 선택하여 전환할 수 있습니다.
라이브 연결: Tableau 데이터 커넥터가 모든 데이터를 가져오는 대신 원본 데이터베이스에 직접 동적 SQL 또는 MDX 문을 전송하여 기존 데이터 인프라를 활용합니다. Vertica와 같이 빠르고 분석에 최적화된 데이터베이스를 구입한 경우 데이터에 실시간으로 연결하면 별도의 비용을 투자할 필요 없이 기존 데이터 인프라의 장점을 활용할 수 있습니다. 라이브 연결의 경우 정보 데이터가 원본 시스템에 남아있으며 쿼리의 집계 결과가 Tableau로 전송됩니다. 이는 다시 말해 Tableau에서 무제한의 데이터를 효율적으로 활용할 수 있다는 것을 의미합니다. Tableau는 세계 최대 규모를 자랑하는 여러 데이터베이스의 프런트엔드 분석 클라이언트이며 Tableau의 모든 커넥터는 각 데이터 원본의 고유한 특성을 십분 활용할 수 있도록 최적화되어 있습니다.
인메모리: Tableau는 분석에 최적화되었으며 속도가 빠른 인메모리 데이터 엔진을 제공합니다. 데이터를 연결한 다음 한 번만 클릭하면 데이터를 추출하여 Tableau의 메모리 내로 가져올 수 있습니다. Tableau 데이터 엔진은 보급형 하드웨어에서도 수천만 줄에 달하는 데이터에 대한 쿼리에 신속하게 응답할 수 있도록 사용자의 전체 시스템을 십분 활용하며 디스크 저장소 뿐만 아니라 RAM이나 캐시 메모리에도 액세스할 수 있으므로 시스템의 메모리 양이 적어도 걱정할 필요가 없습니다. 또 Tableau 데이터 엔진은 전체 데이터 집합을 메모리에 로드하지 않아도 최고의 성능을 발휘합니다.
Tableau Server 구성 요소
Tableau Server 작업은 다음 네 가지 서버 프로세스를 통해 처리됩니다.
응용 프로그램 서버: 응용 프로그램 서버 프로세스(wgserver.exe)는 Tableau Server 웹 및 모바일 인터페이스의 검색 및 사용 권한 작업을 처리합니다. Tableau Server 세션은 사용자가 클라이언트 장치에서 뷰를 열면 시작됩니다. 이는 다시 말해 응용 프로그램 서버 스레드가 시작 후 사용자 및 뷰의 사용 권한을 확인한다는 것을 의미합니다.
VizQL Server: 뷰가 열리면 클라이언트가 VizQL 프로세스(vizqlserver.exe)에 요청을 보냅니다. 이어서 VizQL 프로세스가 데이터 원본에 직접 쿼리를 보내면 결과 집합이 이미지로 렌더링되어 사용자에게 표시됩니다. 각 VizQL Server는 고유의 캐시를 보유하고 있으며 이 캐시는 다양한 사용자가 공유할 수 있습니다.
Data Server: Tableau Data Server를 사용하면 Tableau 데이터 원본을 중앙집중식으로 관리하고 보관할 수 있습니다. Tableau Data Server에는 계산, 정의, 그룹과 같은 Tableau Desktop의 메타데이터 또한 포함되어 있습니다. 게시된 데이터 원본은 다음을 기반으로 제공됩니다.
- Tableau 데이터 엔진에서 추출
- 관계형 데이터베이스에 라이브 연결(큐브는 지원되지 않음)
Data Server에 대한 자세한 내용은 아래 데이터 전략 섹션을 참조하십시오.
백그라운더: 백그라운더는 예정된 추출 작업을 새로 고치고 다른 백그라운드 작업을 관리합니다.
게이트웨이/부하 분산 장치
게이트웨이는 요청이 다른 구성 요소로 이동하도록 경로를 지정하는 기본 Tableau Server입니다. 클라이언트가 전송한 요청은 먼저 게이트웨이 서버를 경유한 다음 적절한 프로세스로 이동하도록 경로가 지정됩니다. 특정 구성 요소에 여러 개의 프로세스가 구성될 경우 게이트웨이는 부하 분산 장치의 역할을 담당하며 요청을 프로세스에 분산합니다. 단일 서버 구성의 경우에는 모든 프로세스가 게이트웨이 또는 주 서버에서 대기합니다. 분산 환경의 경우 실제 컴퓨터 1대는 주 서버로 지정되며 다른 컴퓨터는 프로세스를 개수에 관계 없이 실행할 수 있는 작업 서버로 지정됩니다. 참고로 Tableau Server는 항상 1대의 컴퓨터만 주 서버로 사용합니다.
자세한 내용을 읽어보시겠습니까? 백서의 나머지 부분을 다운로드하십시오!