Tableau 데이터 서버로 데이터의 신뢰 강화

Tableau Server를 어디에서 시작해야 할지 모르시나요? Tableau 전문가 Lorena Vasquez는 Tableau Server를 사용하여 데이터에 대한 신뢰를 강화하는 방법을 설명합니다.

오늘의 블로그 게스트는 Cboe Global Markets의 선임 소프트웨어 엔지니어인 Lorena Vazquez입니다. Lorena는 BI 및 보고 엔지니어링 팀의 일원이며 Tableau Server 관리자로도 활동하고 있습니다.

관리자: "제가 회계 팀의 직원한테서 매출 수치를 이메일로 전달받았는데, 이 수치는 분기별 비즈니스 검토를 위해 분석가님이 제공하신 수치와 일치하지 않습니다 분석가님은 어디에서 이 수치를 산출했나요? 왜 차이가 나는 거죠?"

분석가: "IT 부서의 보고서에서 생성된 스프레드시트에서 해당 수치를 얻었습니다. 회계 팀은 어떤 경로로 그 수치를 획득했는지는 모르겠네요. 하지만, 제 수치가 맞아요."

관리자: “이러한 상황이 일어나는 진짜 원인을 알아내야겠군요.”

우리는 모두 관리자, 분석가 또는 IT 부서의 일원으로서 이러한 스토리를 어떤 식으로든 경험한 바 있습니다. 부서 및 역할 전반에 걸쳐 공유되는 데이터에 대해 확신을 얻으려면 어떻게 해야 할까요? ? 음, 제 경우 그 해답은 Tableau 데이터 서버였습니다.

데이터 서버란 무엇일까요? Tableau Server 사이트 내에서 데이터 원본을 게시, 공유 및 새로 고침할 수 있는 Tableau Server 내 구성 요소입니다. 제 경험에 비추어 볼 때, Tableau 데이터 서버는 이러한 표면적 기능 이상을 제공합니다.

  1. Tableau 데이터 서버는 인증되고 게시된 데이터 원본을 제공하여, 중요 데이터(예: 수익 정보)에 대한 모호성의 위험을 제거합니다.
  2. 데이터 원본은 일정에 따라 새로 고침할 수 있습니다. 데이터를 최신 상태로 유지하기 위해 수동으로 데이터 원본을 업데이트하고 다시 게시하는 것을 더 이상 걱정할 필요가 없습니다. 그리고 데이터 원본에 오류가 발생하면 알림을 받게 되므로 안심할 수 있습니다.
  3. 더 중요한 바는 Tableau 데이터 서버는 향후 분석 및 대시보드를 위해 문서화되고 재사용 가능한 차원, 측정값 및 계산의 정의된 집합이라는 점입니다.
  4. 제 경우 Tableau 데이터 서버는 운영 데이터베이스 시스템의 영향을 줄여준다는 추가적인 이점이 있었습니다. 데이터 추출을 통해 운영 데이터베이스 시스템에 대한 실시간 쿼리를 줄임으로써 IT 부서의 부담을 덜어줄 수 있습니다.

어떻게 시작했을까요?

먼저, 데이터 원본으로 시작했습니다. 새 데이터를 추가하도록 데이터 원본을 새로 고침을 예약할 수 있지만, 데이터 서버는 정적 데이터 원본에서도 작동합니다. 정적 데이터를 사용하는 사례는 수정 불가능하고/하거나 데이터베이스 도메인 외부에 존재하지 않는 내역 데이터 집합을 포함합니다. 정적 데이터 원본은 Tableau 추출을 생성하고 추출을 Tableau Server에 게시하기 때문에 가장 간단합니다.

데이터 원본을 새로 고침하려면 Server에 게시하기 전 원본이 제대로 준비되었는지 확인해야 했습니다. 처음 시작했을 때 부딪혔던 몇 가지 문제점을 아래에서 언급하겠지만, 결과적으로 새로운 데이터 원본을 위한 개발 프로세스를 만들어냈습니다.

어떤 데이터 원본을 사용하든 Tableau Server가 원본에 액세스할 수 있도록 해야 합니다. 데이터베이스 서버인 경우 Tableau Server를 해당 데이터베이스(IP 주소와 포트 모두)에 연결할 수 있는지 확인합니다. 저는 Tableau Server 관리자로서 연결이 유효한지 테스트할 수 있었습니다. 그런 다음 DBA 팀에 연락하여 Tableau에 대한 적절한 인증을 받았는지 확인했습니다. 실제로 데이터 원본과의 연결 문제가 발생했습니다. 데이터 원본을 게시하고 새로 고침을 예약한 후, Server를 연결할 수 없었기 때문에 새로 고침에 실패했습니다. 우리는 DBA 팀에 연락하여 문제를 해결했으며 데이터베이스 서버가 연결을 거부하고 있음을 확인했습니다. Tableau Server에 대한 액세스가 허용되어 워크플로우가 개선되었습니다.

체크리스트의 두 번째 항목은 데이터베이스 드라이버가 Tableau Server에 설치되어 있는지 확인하는 것입니다. 이제 서버에는 하나의 드라이버만 필요하므로, 여러 버전의 데이터베이스 드라이버를 유지하는 것에 대해 더 이상 걱정할 필요가 없습니다. 데이터베이스에 액세스하기 위해 지원 팀이 각 사용자의 컴퓨터에 데이터베이스 드라이버를 설치하던 시절은 이제 옛날 일입니다. Tableau Server에 데이터 원본을 게시하여 알려주면 사용자는 Tableau Server를 통해 연결하기만 하면 됩니다. Tableau Server 관리자로서 저는 사용 중인 데이터 원본과 드라이버를 제어하고 이들이 Tableau Server에서 지원하는 올바른 버전인지 확인합니다. Desktop 사용자 컴퓨터에 올바른 드라이버가 설치되어 있는지 확인하십시오. 우리는 사용 중인 데이터베이스 드라이버 목록을 유지하고 IT 헬프 데스크 팀과 해당 목록을 공유합니다.

데이터베이스 연결, 네트워크 연결 및/또는 파일 공유 연결이 생성되면 데이터 원본을 Tableau Server에 게시할 수 있습니다. 이는 여러 단계를 거치는 것처럼 보일 수 있지만 정리 및 인증된 데이터 원본을 유지하여 얻는 이점이 데이터 원본마다 일회성 설정을 거치는 것에 비해 훨씬 큽니다.

실제 환경에 적용

모든 사람에게 데이터 액세스 권한을 부여하는 것과 관련해 가장 우려되는 점은 바로 섀도우 IT입니다. 모든 사람은 자신만의 데이터 사본을 가지며, 동일한 차원이나 측정값에 대해 다른 용어를 사용하게 되고, 이것이 바로 전체적인 데이터 거버넌스 차원에서는 악몽이 됩니다. Tableau 데이터 서버를 사용하면 이러한 걱정이 사라집니다. 적어도 제 경우는 그렇습니다.

어떻게 Tableau 데이터 서버가 데이터 거버넌스 및 데이터 품질을 보장하는지 알아봅시다.

데이터 거버넌스

이야기의 처음으로 다시 돌아갑시다. 이제 Tableau 데이터 서버에서 정리 및 인증된 데이터 집합을 보유할 수 있다는 사실을 알고난 후, 아까의 대화는 어떻게 달라질까요?

분석가: "우리 팀과 협력하여 Tableau Server에 게시된 해당 데이터를 사용했습니다. 이 데이터는 매일 새로 고침되므로, 오래된 데이터인지 걱정하지 않으셔도 됩니다. 게다가 회계 팀 역시 더 이상 수동 스프레드시트를 사용하지 않고 저희와 동일한 곳에서 정보를 소싱하고 있습니다."

관리자: "그러면 더 이상 수치의 차이가 발생하지 않음을 의미하나요? 대단하군요."

Tableau Server에 데이터 원본을 게시하면 해당 데이터 집합에 액세스하는 모든 사용자가 일관성을 유지할 수 있습니다. 모든 사람이 볼 수 있도록 차원과 측정값을 정리 및 정의하고 설명할 수 있습니다. Tableau Server를 사용하면 그러한 데이터 원본을 인증됨으로 표시할 수도 있습니다. 게시된 데이터 원본과 관련한 함정은 이러한 작업을 수행하지 않을 때 발생합니다. 설명 없이 데이터 원본을 게시하거나, 무작위 또는 무의미한 측정값/차원 이름을 붙이거나, 데이터 워크플로우 프로세스가 제대로 준비되어 있지 않으면, 혼동을 야기하고 데이터 불신을 초래하며 데이터 관리에 악영향을 줄 수 있습니다. 저는 이 악몽을 직접 경험했습니다. 게시된 데이터 원본을 어떠한 설명 없이 지정해 최종 사용자에게 혼란을 준 적이 있었습니다.

어떻게 이를 처리했을까요? Tableau Server에서 데이터 원본을 생성하기 위한 워크플로우 프로세스를 만들었습니다. 이 프로세스는 원하는 만큼 간략하거나 무겁게 만들 수 있습니다. 하지만, 제 경험에 비춰볼 때 적어도 다음을 충족해야 합니다.

  1. 차원 및 측정값은 회사의 비즈니스 언어에 맞게 정의합니다.
  2. 계산에는 적절한 이름을 지정하고 필요한 주석을 포함합니다. (“총계”를 하나의 계산으로, 다른 하나를 “총계 총계”로 지정하고 싶지는 않을 것입니다.)
  3. 이름만으로 충분하지 않은 경우, 차원에 설명을 포함합니다. 웹 사이트 양식이나 주문 양식과 같은 업스트림 응용 프로그램에서 가져온 데이터 원본을 포함할 수 있습니다.
  4. 이 단계를 완료하면 데이터 원본을 인증됨으로 표시합니다. 이는 사용자에게 해당 데이터를 신뢰할 수 있음을 나타냅니다.

팀 및 CoE와 협의하여 이 워크플로우가 그룹에 어떤 의미를 부여하는지 정의합니다. 통합에는 시간이 좀 걸리겠지만, 이러한 과정이 Tableau Server에서 데이터를 전반적으로 이해하는 데 도움이 된다는 사실을 인지하시기 바랍니다.

데이터 품질

데이터 품질은 데이터 거버넌스의 구성 요소입니다. 보유하고 있는 데이터가 올바른지 어떻게 확신할까요? 위 대화에서 분석가는 Tableau Server를 사용함으로써 데이터를 매일 새로 고침한다고 언급했습니다. Tableau 데이터 서버에서는 추출 스케줄을 매시간을 포함해 다양한 빈도로 정의할 수 있습니다.

데이터 원본의 추출 예약과 관련한 함정은 추출이 실행될 때 해당 데이터를 사용할 수 없으면 누락된다는 점입니다. 게시된 데이터 원본과 원래 데이터 원본을 쿼리하여 총 레코드 수를 비교하는 대시보드를 만들어 데이터 품질 유효성 검사를 한 단계 더 수행할 수 있습니다. 데이터 기반 알림을 사용하면 데이터 원본이 동기화되지 않은 경우 알림을 받을 수 있습니다. 이 기능은 중요도가 높은 데이터 원본에 제가 매일 사용하는 것입니다.

또한, Tableau Server REST API 및 Tableau 데이터 추출 명령줄 유틸리티를 사용하면 개발자가 원래 데이터 원본에서 데이터를 사용할 수 있을 때 Tableau Server에서 데이터를 새로 고치는 "푸쉬 작업"을 만들 수 있습니다. Tableau Server가 자체 일정에 따라 원래 데이터베이스에서 데이터를 가져오는 대신, (Tableau Server 일정 외) 푸쉬 작업은 Tableau Server의 데이터 추출 새로 고침 작업을 실행하기 전에 원본 데이터베이스에 데이터가 채워짐에 따라 실행됩니다. 이 방법은 예약 프로그램에 대한 액세스 권한이 있는 경우에만 작동합니다. 데이터베이스에 데이터를 로드할 책임이 있는 개발 팀 또는 데이터 팀과 협력하여 이 작업을 추가하는 방법을 확인하세요.

옹호

이러한 게시된 데이터 원본과 프로세스를 모두 준비해두고 공유하지 않는다면 시간 낭비입니다. 다음 단계는 데이터 서버에서 Tableau Server 및 게시된 데이터 원본의 사용을 옹호하는 것입니다. 월간 뉴스레터에서 새로운 데이터 원본을 공유하고, 새로운 데이터 원본을 검토하기 위한 교육 세션 호스팅 및 귀하의 조직에 적합하다면, 해당 데이터 원본 사용 방법에 관한 비디오 교육 등을 고려해 보세요. 무엇보다도, 피드백을 요청하세요. 사용자가 해당 데이터 원본을 사용하기 위한 차원과 측정값 및 사용 사례를 이해했는지 확인하세요. 사용자들과 더 많이 소통할수록 Tableau Server의 사용량도 급증하게 될 것입니다.

진행

이제 Tableau 데이터 서버에 대해 더 자세히 알았으니 우선 CoE, 내부 Tableau 사용자 그룹 또는 Tableau 홍보 대사에게 연락하여 Tableau 데이터 서버를 활용하는 방법을 알아보세요. 현재 진행 중인 프로세스와 데이터 서버로 프로세스를 향상시킬 수 있는 방법에 대해 생각해보세요. 우리는 모두 관련성 있고 귀중한 데이터를 찾고 있습니다. 이를 위해 오직 신뢰할만한 단일 원본만을 가지고 있는지 확인하십시오.

Tableau 데이터 서버 SlideShare에서 자세히 알아보시기 바랍니다.