빅 데이터를 성공적으로 활용하기 위한 7가지 도움말


개요 | 다음 내용을 설명합니다: 

빅 데이터는 점점 규모가 증가하고 있고 더욱 유용해지고 있습니다. 일부 회사들은 데이터를 처리하는 방법을 파악하기 전에 저장해 두었고 이제 효과를 보고 있습니다.

빅 데이터는 지속적으로 증가하는 것이 현실입니다. 데이터가 스프레드시트, 데이터베이스, 데이터 웨어하우스, Hadoop과 같은 오픈 소스 파일 시스템에 있든 또는 이 모두에 있든 관계없이 데이터에 신속하게 연결하고 데이터를 통합할 수 있는 유연성을 갖춰야 합니다. 실제 크기는 상관이 없이 데이터의 수집 원리와 데이터의 활용 방법이 중요합니다.

이 백서에서 어떻게 시작할 수 있는지 설명합니다. 이 백서에서는 빅 데이터 접근 방법에 대한 7가지 모범 사례 및 데이터를 최대한 활용하는 방법을 설명합니다.

백서의 첫 페이지 몇 장을 읽으실 수 있도록 발췌했습니다. 나머지 내용을 읽으려면 오른쪽에서 PDF를 다운로드하십시오.


빅 데이터가 더 커지지 않으리라고 예상했지만, 여전히 커지고 있습니다. 빅 데이터는 실제 크기에 관계없이 가치를 발휘하고 있습니다. 전 세계의 조직들은 다양한 모양과 크기의 빅 데이터를 소유하고 있습니다. 이러한 조직에서는 빅 데이터의 중요성과 잠재력을 인지하고 있습니다. 빅 데이터의 수명은 빅 데이터를 활용하지 않는 조직보다 오래 지속될 것입니다.

가치를 파악하기 전에 저장해 두었던 다중 구조의 빅 데이터를 이미 활용한 조직들은 운영 효율성을 개선하고 수익을 증대하고 신규 비즈니스 모델을 지원할 수 있게 되었습니다.

그 조직들은 어떻게 성공할 수 있었을까요? 이러한 조직이 성공하는 데 활용한 기술은 다음 7가지로 요약할 수 있습니다.

1. 단기 계획을 통해 먼 미래를 준비하십시오.

최신 빅 데이터 기술을 따라잡지 못해 걱정하고 계신가요? 모든 것이 빠르게 변화하고 있어 올해 또는 내년의 가장 우수한 도구, 플랫폼 및 방법론이 무엇인지 파악하기는 불가능합니다.

걱정하지 마십시오. 이러한 빠른 변화를 수용할 수 있습니다.

공급업체들은 매년 빅 데이터를 더욱 효율적으로 활용할 수 있게 될 것입니다. 관계형 및 온라인 거래 시스템(OLTP)은 온프레미스에서 운영되든 또는 클라우드에서 운영되든 관계없이 더욱 효율적이고 스마트하게 진화될 것입니다. Hadoop 및 데이터 웨어하우스 간의 연결을 간소화할 수 있는 기술이 개발될 것입니다. 또한, 비즈니스의 요구 사항에 더 정확하게 부합하는 제품이 시장에 계속 출시될 것입니다.

따라서 너무 긴장하지 않으셔도 됩니다. 기존 환경에 새 제품을 도입할 만한 가치가 충분하다면 이러한 새 제품에 대한 가능성을 열어두고, 다양한 형식에 직접 연결되는 비즈니스 인텔리전스 플랫폼을 유지하십시오. 이렇게 하면 시장에서 제공되는 모든 제품에 대비할 수 있습니다.

2. 잘못된 선택을 간파하십시오.

조직에 Hadoop이 필요합니까? 아니면 데이터 웨어하우스가 필요합니까? 이 질문은 잘못된 질문입니다. Hadoop과 데이터 웨어하우스는 함께 효율적으로 연동될 수 있으며, 조직은 Hadoop과 데이터 웨어하우스 간의 협력 관계로부터 혜택을 얻을 수 있습니다.

데이터 웨어하우스는 BI 도구 및 대시보드에서 쉽게 찾을 수 있도록 구조화된 중요한 데이터를 저장하기 좋습니다. 하지만 데이터 웨어하우스는 분석 처리 및 일부 전환 유형에 대해 취약하고 속도가 느립니다.

이러한 작업은 Hadoop에서 처리할 수 있습니다. Hadoop은 대화형 쿼리와 데이터 관리 작업에 취약하지만 구조화되지 않은 복잡한 원시 데이터를 처리하는 데는 우수합니다.

Hadoop과 데이터 웨어하우스는 함께 사용할 수 있습니다. 예를 들어 경영진에게 내년도 재고 관련 요구사항을 예측하기 위해 데이터가 필요하다고 가정해 보겠습니다. 데이터 집합의 규모가 방대하고 이를 모델링하거나 다시 구조화하고 다른 방식으로 데이터 웨어하우스에서 사용할 수 있도록 준비하기에는 시간이 너무 부족합니다. 그뿐만 아니라 경영진은 데이터를 단 1주일 정도 사용한 다음 삭제할 것입니다. 이 경우 Hadoop을 사용해 데이터를 저장하고 조정하여 데이터 웨어하우스에 샘플을 전송하면 됩니다.

Third Nature의 CEO인 Mark Madsen은 '빅 데이터의 진정한 목적(What big data is Really About)'이라는 글을 통해 "빅 데이터는 데이터 웨어하우스를 대체하지 않습니다. 또한, 빅 데이터는 별도로 관리할 환경이 아니라 새 IT 환경의 일부입니다."라고 말합니다.

Hadoop과 데이터 웨어하우스 중 하나만 선택하는 우를 범하지 마십시오. 둘 다 사용할 수 있으며 모두 사용하는 것이 좋습니다.

3. 빅 데이터를 쉽게 이해할 수 있도록 만드십시오.

빅 데이터를 시각화하면 데이터를 쉽게 이해할 수 있습니다. Aberdeen Group에서 작성한 2013년 보고서를 보면 "시각적 발견 도구를 사용하는 조직의 경우 BI 사용자의 48%가 IT 인력의 도움 없이 필요한 정보를 찾을 수 있습니다."라는 내용을 확인할 수 있습니다. 시각적인 발견 도구가 없는 경우 이 비율이 23%로 하락합니다.

또한, 연구에 따르면 시각적 데이터 발견 기능을 사용하는 관리자는 시각적 데이터가 없는 동료들에 비해 정보를 제때에 찾을 수 있는 확률이 28% 높습니다.

보고서에서는 비주얼라이제이션은 데이터와의 상호 작용을 유도하며, 이는 빅 데이터에 있어 가장 중요한 사항이라고 기술하고 있습니다. 시각적 데이터를 사용하는 관리자는 해당 데이터와 다양하게 상호 작용할 가능성이 동료들보다 2배 이상 높습니다(33% 대 15%). 이들은 또한 바로 전에 인식한 내용을 기반으로 즉흥적으로 떠오르는 질문을 할 가능성도 더 높습니다.

데이터를 시각적으로 탐색하면 뇌에서 빠르게 이해할 수 있는 방식으로 데이터의 스토리가 생생하게 전개됩니다. "예상치 못한 정보를 얻는 경우도 있습니다. 스프레드시트로는 불가능한 일이죠."라고 Wells Fargo의 전략 기획 부사장인 Dana Zuber는 말합니다.

시각적 분석을 사용하면 다음 두 가지 작업을 언제든지 수행할 수 있습니다.

  • 보고 있는 데이터를 변경 � 질문에 따라 필요한 데이터가 다르므로.
  • 데이터를 보는 방법을 변경 � 뷰에 따라 여러 질문에 대한 답변이 제공되므로.

이러한 단순한 단계, 즉 데이터 발견, 데이터 보기, 질문과 답변, 반복 등으로 구성된 시각적 분석 주기를 이용하면 됩니다. 반복할 때마다 더 구체적인 질문을 하게 되고 더 상세한 정보를 얻게 됩니다. 데이터를 다양한 각도에서 세부적으로 확인할 수 있으며 새 데이터를 가져올 수도 있습니다. 비주얼라이제이션을 통해 사고의 속도와 범위를 확대하여 여러 뷰를 만들 수 있습니다.

뷰가 완성되면 공유할 수 있습니다. 동료들은 자신의 질문에 대해 스스로 답변을 구할 수 있어 팀 전체의 통찰력과 조치 및 비즈니스 성과를 신속하게 이끌 수 있습니다.

자세한 내용을 읽어보시겠습니까? 백서의 나머지 부분을 다운로드하십시오!

계속 읽기…

다음 내용도 확인해보는 것이 좋습니다.