지속적인 혁신

Tableau는 2003년 스탠포드 대학에서 독립한 전문 회사로서 간단한 드래그 앤 드롭 기능으로 세련된 비주얼리제이션 자료를 만들 수 있는 VizQL™이라는 기술로 기존의 데이터 작업을 완전히 바꿨습니다. 기본 혁신은 특허를 받은 쿼리 언어에서 비롯되었으며 이 쿼리 언어는 사용자의 작업을 데이터베이스 쿼리로 변환하여 그 응답을 그래픽 형식으로 표현합니다. 그 다음 혁신은 Tableau의 데이터 엔진을 통해 수 백만 행의 데이터를 몇 초 내에 애드혹(ad-hoc) 분석할 수 있는 기능이었습니다. 데이터 엔진은 PC에서 실행되는 성능이 뛰어난 분석 데이터베이스라 할 수 있습니다. 데이터가 메모리 크기에 맞아야 하는 제한 없이 기존 인메모리 솔루션의 장점이었던 빠른 속도를 유지할 수 있습니다. 또한 모든 사용자에게 강력한 도구를 제공하고자 하는 Tableau의 전통에 따라 데이터 엔진을 사용하기 위해 맞춤 스크립트를 작성할 필요가 없습니다.

VizQL™

기본적으로 시각적이라 더욱 빠릅니다.

Tableau의 심장부에는 대화형 데이터 비주얼리제이션을 데이터 이해 과정의 필수 요소로 만들어 주는 특허 기술이 있습니다. 기존 분석 도구에서는 데이터를 행과 열로 분석하고, 표시할 데이터의 하위 집합을 선택하고, 해당 데이터를 테이블로 변환한 후 해당 테이블에서 도표를 만들어야 했습니다. VizQL에서는 이러한 단계를 거치지 않고 데이터에 대한 시각적 자료를 즉시 만들어 분석 시 시각적 피드백을 제공합니다. 따라서 데이터를 더욱 자세히 이해할 수 있으며 기존 방법보다 최대 100배 더 빠르게 작업할 수 있습니다.
VizQL로 다양한 범위의 비주얼리제이션 가능

데이터를 위한 새로운 언어로 더 많은 정보를 전달해 보세요.

근본적으로 새로운 이 아키텍처는 SQL이 텍스트 형식으로 데이터 상호 작용을 지원하는 것과 유사하게 시각적인 형식으로 데이터의 상호 작용을 지원합니다. VizQL 설명문은 세련된 다차원 비주얼리제이션 자료로 무제한 클래스를 설명합니다. VizQL을 사용하면 하나의 분석 인터페이스 및 데이터베이스 비주얼리제이션 도구로 그래픽을 이용한 광범위한 요약 자료를 만들 수 있습니다. Tableau에서는 막대 및 선형 그래프에서부터 지도 및 세련된 링크 뷰에 이르기까지 놀라울 정도로 광범위한 비주얼리제이션 자료를 만들 수 있습니다. 이러한 유연성을 활용해 완전히 새로운 방법으로 데이터를 이해할 수 있습니다. Tableau를 사용하면 데이터를 엄격한 도표 서식에 끼워 맞추는 경우에 놓칠 수 있는 통계 정보를 확인할 수 있습니다.

자연스러운 사고의 흐름 지원

사고 과정은 점진적으로 진행하며 새로운 정보를 고려하는 질문과 답변이 자연스럽게 이어지는 패턴입니다.진 분석을 시작하는 시점에 정확하게 어떤 결과를 향해 가고 있는지 예상하기는 어렵습니다. 그럼에도 불구하고 기존 BI 도구에서는 이러한 예상이 필요합니다. 하지만 이제 다른 방법을 사용할 수 있습니다. VizQL을 사용하면 데이터를 시각적으로 탐색하고 가장 효율적으로 표현할 수 있는 방법을 찾을 수 있습니다. 작업을 진행함에 따라 학습하고 필요 시 데이터를 추가하며 궁극적으로 더욱 깊이 있는 통계 정보를 발굴할 수 있습니다. 저희는 이 과정을 시각적 분석 주기이라고 부릅니다. 이 주기를 끝까지 수행하면 데이터를 더욱 효율적인 스토리로 전달할 수 있습니다.

세계 어느 곳에도 없습니다.

VizQL로 인해 빠른 분석 및 비주얼리제이션가 현실적으로 가능해졌습니다. 교육을 받지 않거나 조금만 받은 사람들도 이전과 확연하게 다른 방법으로 데이터를 더욱 빠르게 확인하고 이해할 수 있습니다. 이것이 가장 큰 차이점입니다.

데이터 엔진

한계를 극복하기 위한 설계

데이터 엔진은 기존 데이터베이스 및 데이터 저장소의 한계를 극복하고 시각적 분석 과정을 지원하도록 설계된 혁신적인 분석 데이터베이스입니다. 최신 하드웨어의 기능 및 디스크에서 L1 캐시까지의 완전한 메모리 계층을 반영하도록 설계되었습니다. Tableau의 데이터 엔진은 빅 데이터 및 빠른 분석 간의 관계에 변화를 가져옵니다.
데이터 엔진: 대규모 데이터의 분석

대규모 데이터의 진화

데이터베이스는 최근 몇 년 동안 상당한 진화를 겪었습니다. 기존 데이터베이스는 디스크 기반 데이터 및 전치 계산 중심이었습니다. 이전보다 계산력은 우수했지만 속도가 느린 것이 단점이었으며 데이터베이스를 구축하기 전에 사용자는 답변을 원하는 질문(쿼리 작업부하)이 무엇인지 알고 있어야 했습니다. 보다 최근의 데이터베이스는 메모리 계층의 상위 레벨만 사용하고 모든 데이터가 메모리에 상주하도록 함으로써 성능이 향상되었습니다. 이러한 '인메모리' 솔루션으로 계산 속도는 향상되었지만 데이터 크기가 사용 가능한 메모리의 크기로 제한됩니다.

Tableau 데이터 엔진의 목표

데이터 엔진의 디자인 목표는 다음과 같습니다.
  1. 현 세대 하드웨어를 완전하게 활용하여 기업 노트북과 같은 일반 하드웨어에서 수백 수백만 개의 데이터 행에 대해 즉각적인 쿼리 반응을 달성합니다.
  2. 모든 쿼리에 대해 예측 가능하고 지속적인 쿼리 성능을 제공하고 알려진 쿼리 작업부하에 대한 별도의 요구 사항 또는 수집이나 요약에 대한 사전 계산이 필요 없는 진정한 애드혹(ad-hoc) 쿼리를 지원합니다.
  3. 기존 기업 데이터 웨어하우스 및 인프라와 원활하게 통합됩니다.
  4. 목표 성능을 달성하기 위해 전체 데이터 집합을 메모리 저장소에 로드해야 하는 요구 사항의 제한을 받지 않습니다.
  5. 데이터 원본을 매우 신속하게 로드하고 연결합니다.

아키텍처를 고려한 디자인

데이터 엔진 구조의 핵심은 압축을 이용한 열 기반 표현에 있으며, 이는 압축해제 없이 쿼리를 실행하도록 지원합니다. 컴퓨터 그래픽의 새로운 접근 방식을 통해 최신 프로세서를 완전하게 활용할 수 있도록 알고리즘이 신중하게 설계되었습니다. L1 및 L2 캐시의 최적 사용, 최소한의 중간 결과 및 디스크의 데이터 스트리밍 관리에 대한 혁신적인 기술을 통해 처리량 손실을 방지하여, 시스템 내에서 분석을 수행하기 전에 데이터 집합을 메모리에 완전히 로드해야 하는 일반적인 제약을 피할 수 있습니다.

데이터 엔진에서 라이이브 연결 그리고 다시 데이터 엔진으로

데이터 엔진은 Tableau의 기존 “라이브 연결” 기술과 직접 통합되도록 설계되어 이를 통해 사용자가 한 번의 클릭으로 고도로 튜닝된 플랫폼별 SQL 쿼리를 수행하는 기업 데이터에 대한 직접 연결과 해당 데이터의 일부를 데이터 엔진에 로드하여 쿼리를 수행하는 작업 간을 이동할 수 있으며, 이때 계산 및 데이터 정렬 의미체계가 일치합니다. 이 통합으로 인해 회사는 데이터 샘플(GB 규모)을 분석한 다음 Teradata와 같은 대규모의 병렬 웨어하우스로 리디렉션하여 페타바이트 규모의 데이터에 대한 최종 분석(또는 보고서)을 실행할 수 있습니다.

진정한 애드혹(ad-hoc) 쿼리

데이터 엔진은 임의 비즈니스 분석에 일반적인 쿼리를 지원하도록 설계된 쿼리 언어 및 쿼리 최적화 프로그램으로 구성되었습니다. 사고의 속도에 따라 데이터 작업을 수행할 때는 대규모 다차원 필터 또는 복잡한 동시 발생 쿼리와 같은 복잡한 쿼리를 실행해야 하는 경우가 일반적입니다. 기존 데이터베이스는 일반적으로 이러한 유형의 쿼리에 대한 성능이 떨어지는 반면 데이터 엔진은 이를 즉시 처리할 수 있습니다.

유연한 데이터 모델

다른 인메모리 솔루션에 비해 데이터 엔진이 갖는 중요 차이점 중 하나는 디스크의 데이터베이스에 데이터가 표시될 때 데이터를 바로 처리할 수 있다는 점입니다. 이에 따라 데이터 엔진을 사용하기 위해 데이터 모델링이나 스크립트를 만들지 않아도 됩니다. 데이터 엔진의 장점 중 하나는 다른 관계형 데이터베이스와 마찬가지로 신규 계산 열을 정의할 수 있다는 점이며 이는 언제든지 애드혹(ad hoc) 데이터 모델링을 수행하는 것과 유사하다고 볼 수 있습니다.

인스턴스 로드 및 연결 시간

데이터 엔진은 데이터가 로드된 후 시작 시간이 빠르다는 점에서 차별화됩니다. 데이터 중 쿼리가 실제로 접하는 부분만 판독하면 됩니다. 특정 분석과 관련이 없는 다수의 데이터가 데이터베이스에 있는 경우 데이터 엔진이 해당 데이터를 모두 판독할 때까지 기다릴 필요가 없습니다.