白皮书

适用于企业的 Tableau: IT 概述

Authors
Marc Rueter, Senior Director of Technology and Strategy - Tableau Software
Ellie Fields, Sr. Director of Product Development, Tableau

简介

新一代商业智能和可视化分析软件使需要的人可以掌握数据。对于商业用户或为其提供支持的 IT 团队,缓慢、死板的系统已不敷使用。竞争压力和新的数据源在不断形成新的要求。用户要求能够快速且方便地回答其问题。这是很棒的事情。

Tableau Software 的创立理念在于,数据分析和后续报告不应是孤立的活动,而是应集成为单一的可视化分析过程 — 该过程使用户可按照其思路快速查看其数据中的模式并动态切换视图。Tableau 将数据探索和数据可视化合并到一个任何人都可以快速学习的、易于使用的应用程序中。任何熟悉 Excel 的人员都可以创建丰富的交互式分析和强大的仪表板,然后在企业中安全地进行共享。IT 团队可以集中管理数据和元数据、控制权限及扩展到企业范围部署。

此概述旨在回答 IT 经理和管理员的共同问题,并帮助他们为任何规模的可视化分析软件部署提供支持。在本文档中,我们将介绍:

  • Tableau 体系结构
  • 部署模型
  • 安全性
  • 可扩展性
  • 系统管理
  • 数据策略
  • 元数据管理
  • 移动部署

体系结构

Tableau 具有高度可扩展的 n 层客户端-服务器体系结构,该体系结构为移动客户端、Web 客户端和桌面安装的软件提供服务。Tableau Desktop 是用于在 Tableau Server 上创建共享视图的创作和发布工具。

Tableau Server 是企业级商业分析平台,可以纵向扩展到成千上万个用户。它提供强大的基于浏览器的移动分析,可与公司的现有数据策略和安全协议配合工作。Tableau Server:

  • 纵向扩展: 多线程
  • 横向扩展: 支持多进程
  • 提供集成的群集
  • 支持高可用性
  • 安全
  • 可在物理计算机和虚拟机上运行

数据层

Tableau 的基本特征之一是支持您选择的数据体系结构。Tableau 不要求您的数据存储在任何单一系统中,无论是专有的还是其他形式。大多数组织都有异构的数据环境:数据仓库与数据库和多维数据集并存,而 Excel 等平面文件仍然得到大量使用。Tableau 可以同时与所有这些数据形式配合工作。您无需将所有数据存入内存,除非您选择这样做。如果现有数据平台快速并且可扩展,则 Tableau 利用数据库的功能回答问题,从而使您可以直接利用您的投资。如果情况并非如此,则 Tableau 会提供方便的选项,用于通过我们的快速内存数据引擎升级您的数据,使这些数据变得快速且响应灵敏。

数据连接器

Tableau 包含一些经过优化的数据连接器,可用于各种数据库,如 Microsoft Excel、SQL Server、Oracle、Teradata、Vertica、Cloudera Hadoop 等等。还有一个可在没有本机连接器时用于任何系统的通用 ODBC 连接器。Tableau 提供两种数据交互模式: 实时连接或内存。用户可以根据其选择,则实时和内存连接之间切换。

实时连接: Tableau 的数据连接器通过将动态 SQL 或 MDX 语句直接发送到源数据库(而不是导入所有数据)来利用现有数据基础架构。这意味着,如果您投资了针对分析而优化的快速数据库(如 Vertica),则可以通过实时连接到数据来受益于这些投资。这样可将详细数据保留在源系统中,而将查询的聚合结果发送给 Tableau。此外,这还意味着,Tableau 可以有效地利用无限量的数据 — 事实上 Tableau 是世界上许多最大型数据库的前端分析客户端。Tableau 优化的各种连接器可利用各种数据源的独有特征。

内存中: Tableau 提供一个针对分析而优化的快速内存数据引擎。您可以连接到您的数据,随后只需一次单击,便可在 Tableau 中提取数据以存入内存。Tableau 的数据引擎可充分利用您的整个系统,以在商用硬件上针对上亿行数据实现快速查询响应。因为该数据引擎可以访问磁盘存储以及 RAM 和缓存内存,所以不受系统内存量的限制。无需将整个数据集加载到内存中即可实现其性能目标。

Tableau Server 组件

Tableau Server 的工作通过以下四个服务器进程进行处理:

Application Server: Application Server 进程 (wgserver.exe) 为 Tableau Server Web 和移动界面处理浏览和权限。一个用户在客户端设备中打开一个视图时,该用户便在 Tableau Server 上启动了一个会话。这意味着一个 Application Server 线程会启动并检查该用户和该视图的权限。

VizQL Server: 打开视图之后,客户端便会向 VizQL 进程 (vizqlserver.exe) 发送请求。VizQL 进程随后将查询直接发送给数据源,从而返回呈现为图像并展示给用户的结果集。每个 VizQL Server 都具有自己的缓存,这些缓存可以在多个用户间共享。

Data Server: 通过 Tableau Data Server 可以集中管理和存储 Tableau 数据源。它还从 Tableau Desktop 维护元数据,如计算、定义和组。发布的数据源可基于:

  • Tableau 数据引擎提取
  • 与关系数据库的实时连接(不支持多维数据集)

请在下面的“数据策略”部分中阅读有关 Data Server 的更多信息。

后台程序: 后台程序刷新计划提取并管理其他后台任务。

网关/负载平衡器

网关是将请求路由到其他组件的主 Tableau Server。来自客户端的请求先到达网关服务器并路由到合适的进程。如果对任何组件配置了多个进程,则网关会充当负载平衡器并将请求分发给各个进程。在单服务器配置中,所有进程都位于网关(或主服务器)上。在分布式环境中运行时,会将一台物理计算机指定为主服务器,而将其他计算机指定为工作服务器,这些服务器可以运行任何数量的其他进程。Tableau Server 始终仅使用一台计算机作为主服务器。

希望阅读更多内容? 下载白皮书其余部分!

 

About the authors

image

Marc Rueter

Senior Director of Technology and Strategy - Tableau Software

Marc Rueter is Tableau Software’s Senior Director of Technology and Strategy. Prior to Tableau, he held positions at MicroStrategy and Siebel Systems. At Siebel, he led a team that developed successful applications for retailers. Marc plays an instrumental role in Tableau’s product development, providing critical input based on his experience helping clients with large projects. He is a Microsoft Certified Systems Engineer for SQLServer. Marc holds a Mechanical Engineering degree from Virginia Tech and an MBA from the University of Washington.

image

Ellie Fields

Sr. Director of Product Development, Tableau

Ellie Fields leads product development teams at Tableau responsible for building analytics that reach more people. Responsible for product strategy and execution for mobile apps, collaboration, alerting, server experience, onboarding and Tableau Public. She's also a regular speaker on Tableau's approach to business intelligence. Prior to Tableau, Ellie worked at Microsoft and in late-stage venture capital. She has an engineering degree from Rice University and an M.B.A. from The Stanford Graduate School of Business.