빅 데이터에 대한 Tableau의 비전


개요 | 다음 내용을 설명합니다: 

Tableau의 사명은 사람들이 데이터를 보고 이해하는 일을 돕는 데 있습니다. 이러한 임무를 완수하기 위해 Tableau는 기본적으로 데이터의 민주화가 이루어져 '데이터에 대해 알고 있는 사용자가 데이터 관련 질문에 대한 답변을 스스로 찾을 수 있어야 한다'고 생각합니다. 지식 근로자들은 매일 데이터의 위치와 상관없이 쉽게 데이터에 액세스할 수 있어야 합니다. 또한 이러한 지식 근로자들은 데이터 과학자나 IT 개발자와 같은 일부 엘리트층의 도움 없이도 데이터를 분석하고 데이터로부터 유용한 정보를 발견할 수 있어야 합니다.

데이터를 시각화하는 것은 데이터의 크기에 상관없이 정보를 쉽게 통찰력과 행동으로 전환할 수 있기 때문에 중요합니다. 특히 빅 데이터를 시각화하는 접근 방식은 데이터 저장, 준비 및 쿼리에 비용이 훨씬 많이 들기 때문에 더욱 중요합니다. 따라서 조직은 설계가 우수한 데이터 원본을 활용하고 모범 사례를 적극적으로 적용하여 지식 근로자가 빅 데이터를 직접 쿼리할 수 있도록 지원해야 합니다. 빅 데이터는 최근 몇 년 동안 많은 혁신이 일어난 분야이며 각기 장점이 다른 여러 옵션이 있습니다. Tableau의 비전은 사용자에게 관련성이 높은 빅 데이터 플랫폼을 모두 지원하고 데이터를 실시간으로 활용할 수 있도록 도움을 드리는 데 있습니다.

백서의 첫 페이지 몇 장을 읽으실 수 있도록 발췌했습니다. 나머지 내용을 읽으려면 오른쪽에서 PDF를 다운로드하십시오.


Tableau의 (빅) 데이터 전략

Tableau의 사명은 사람들이 데이터를 보고 이해하는 일을 돕는 데 있습니다. 이러한 임무를 완수하기 위해 Tableau는 기본적으로 데이터의 민주화가 이루어져 '데이터에 대해 알고 있는 사용자가 데이터 관련 질문에 대한 답변을 스스로 찾을 수 있어야 한다'고 생각합니다. 지식 근로자들은 매일 데이터의 위치와 상관없이 쉽게 데이터에 액세스할 수 있어야 합니다. 또한 이러한 지식 근로자들은 데이터 과학자나 IT 개발자와 같은 일부 엘리트층의 도움 없이도 데이터를 분석하고 데이터로부터 유용한 정보를 발견할 수 있어야 합니다.

데이터를 시각화하는 것은 데이터의 크기에 상관없이 정보를 쉽게 통찰력과 행동으로 전환할 수 있기 때문에 중요합니다. 특히 빅 데이터를 시각화하는 접근 방식은 데이터 저장, 준비 및 쿼리에 비용이 훨씬 많이 들기 때문에 더욱 중요합니다. 따라서 조직은 설계가 우수한 데이터 원본을 활용하고 모범 사례를 적극적으로 적용하여 지식 근로자가 빅 데이터를 직접 쿼리할 수 있도록 해야 합니다. 빅 데이터는 최근 몇 년 동안 많은 혁신이 일어난 분야이며 각기 장점이 다른 여러 옵션이 있습니다. Tableau의 비전은 사용자에게 관련성이 높은 빅 데이터 플랫폼을 모두 지원하고 데이터를 실시간으로 활용할 수 있도록 도움을 드리는 데 있습니다.

빅 데이터에 대한 이러한 비전을 실현하기 위해 Tableau는 다음 6가지 요소에 집중하고 있습니다.

  1. 빅 데이터 플랫폼에 대한 광범위한 액세스 - Tableau 비전의 일부는 위치에 상관 없이 빅 데이터를 분석할 수 있도록 지원하는 것입니다. Tableau는 현재 40개 이상의 서로 다른 데이터 원본 및 확장 옵션을 통해 기타의 수 많은 데이터 원본을 지원하고 있습니다. 사용자에게 유용한 새로운 데이터 원본이 출시됨에 따라 Tableau는 지속적으로 이러한 데이터 원본을 제품에 통합하여 데이터 액세스에 대한 장벽을 없애기 위해 노력을 기울일 것입니다. 빅 데이터 에코시스템을 위해 Tableau에서 제공하는 잘 알려진 커넥터는 다음과 같습니다.
    • Hadoop: Cloudera Impala 및 Hive, Hortonworks Hive, MapR Hive, Amazon EMR에서 Impala 및
    • Hive, Pivotal HAWQ, IBM BigInsights
    • NoSQL: MarkLogic, Datastax
    • Spark: Apache Spark SQL
    • 클라우드: Amazon Redshift, Google BigQuery
    • 운영 데이터: Splunk
    • 빠른 분석 데이터베이스: Actian Vectorwise 및 ParAccel, Teradata Aster, HP Vertica, SAP Hana, SAP Sybase, Pivotal Greenplum, EXASOL EXASolution
  2. 비즈니스 사용자를 위한 셀프 서비스 빅 데이터 비주얼라이제이션 - 비즈니스 사용자는 복잡한 SQL, Java 코드 또는 MapReduce 작업을 작성할 필요 없이 드래그 앤 드롭 기능을 사용하여 데이터를 시각화할 수 있습니다. Tableau를 통한 데이터 분석 작업의 간소화 - 사용자는 이전보다 빠르게 데이터에 대한 시각적 통찰력을 발견할 수 있습니다.
  3. 쿼리 성능 최적화를 위한 하이브리브 데이터 아키텍처 - Tableau를 사용하면 데이터 원본에 실시간으로 연결하거나 데이터 원본을 인 메모리로 가져올 수 있습니다. 라이브 연결은 빠른 상호 작용 쿼리 엔진 및 대규모의 데이터 집합에 연결할 때 유용합니다. 또한 데이터를 추출하여 인 메모리 데이터 엔진으로 가져와 속도가 느린 데이터 원본의 규모를 키우고 속도를 개선할 수 있습니다.
  4. 여러 데이터 원본에서 분석을 수행하기 위한 데이터 통합 - 분산 데이터는 일반적으로 빅 데이터보다 다루기 어렵습니다. 분석가의 데이터가 한 곳에 정리되어 있는 경우는 흔하지 않으며 일반적으로 기술 및 플랫폼이 이질적인 여러 위치에 데이터가 분산되어 있습니다. Tableau를 사용하면 사용자가 빅 데이터를 여러 다른 데이터 원본(예: Salesforce, MySQL, Excel 파일)과 통합하여 함께 사용할 수 있으므로 조직은 데이터 자산을 저장된 위치에 그대로 유지할 수 있습니다.
  5. 플랫폼 쿼리의 전반적인 성능 - 데이터량이 증가함에 따라 Tableau는 데이터의 실시간 활용을 지원하도록 중요 쿼리 성능을 지속적으로 개선합니다. 최근에는 이러한 개선 사항에 병렬 쿼리, 쿼리 융합, 외부 쿼리 캐싱 등의 기능이 포함되었습니다. 또한 Tableau는 이제 지원되는 프로세서에서 벡터화를 활용합니다.
  6. 데이터에 대한 강력하고 일관적인 시각적 인터페이스 - Tableau는 간단한 작업을 통해 데이터 필터링, 예측 실행, 트렌드 라인 분석 등을 수행할 수 있는 분석 도구를 제공합니다. 또한 사용자의 작업을 해석하여 시각적 모범 사례를 기반으로 데이터를 나타낼 수 있는 가장 효율적인 방법을 선택합니다. Tableau는 데이터가 연결되면 모든 데이터 원본에서 데이터에 대해 일관적인 단일 시각적 인터페이스도 제공합니다.

Tableau의 비전은 전반적인 데이터 환경이 진화하고 있는 방향과 일치합니다. 많은 고객들은 일반적으로 다양한 빅 데이터 기술을 다루고 있습니다. Hadoop, Spark 등의 기술이 데이터 저장 및 처리 기능으로 인해 데이터 웨어하우스와 함께 데이터 아키텍처의 일부가 되었습니다. 이와 동시에 고객은 Hadoop 배포를 기반으로 데이터 웨어하우스의 규모를 적절하게 조정하고 있습니다. NoSQL 데이터베이스는 유연한 데이터 모델, 짧은 대기 시간, 응용 프로그램에 특화된 디자인 등으로 인해 관계형 데이터베이스보다 응용 프로그램의 백엔드로 선택되는 경우가 많습니다. 마지막으로 장소의 구애를 받지 않는 클라우드 데이터 원본 덕택에 클라우드 CRM 및 ERP 시스템이 비즈니스 프로세스 관리를 위해 선호하는 방식이 되었으며 '종량제' 소비 모델이 클라우드 스토리지 및 데이터 처리에 있어 인기를 얻게 되었습니다. 백엔드가 아주 다양하고 유연하므로 사용자는 여러 빅 데이터 플랫폼, 클라우드 데이터 원본 및 관계형 데이터베이스를 유연하게 연결할 수 있을 뿐만 아니라 데이터를 분석하는 데 필요한 기능을 제공하는 Tableau와 같은 프런트 엔드 도구가 필요합니다.

자세한 내용을 읽어보시겠습니까? 백서의 나머지 부분을 다운로드하십시오!

계속 읽기…

다음 내용도 확인해보는 것이 좋습니다.