모든 데이터 과학자에게 요구되는 10가지 기술

데이터 과학자 인재에 대한 수요가 증가하면서 더 많은 데이터 과학자가 순위를 차지할 필요성도 대두되고 있습니다. 데이터 과학을 적용하는 것이 하나의 분야로 자리 잡았다고 해서 하나의 업종 혹은 비즈니스 분야로 그 영역이 좁혀지는 것은 아닙니다. 데이터 과학자는 어떤 조직의 어느 곳에서든지 영향력을 발휘할 수 있습니다.

만약 급성장하는 데이터 과학자라면, 혹은 그 길을 가기 시작했다면, 우선 교육이 필요하다는 것을 아실 것입니다. 그러나 기술적인 교육과정 외에도 학문을 초월하는 데이터 과학 기술이 있습니다. 이러한 기술을 실행하고 개발한다면, 분야의 성장에 따른 수많은 구직자 및 과학자 중에서 구별될 수 있을 것입니다.


비기술적 기량

이러한 기술은 기술적 교육이나 공식 인증을 필요로 하지는 않지만, 데이터 과학을 비즈니스 사안에 엄밀히 적용하는 기본이 됩니다. 기술적 기량을 최고로 갖춘 데이터 과학자조차도 오늘날 번창하려면 다음과 같은 소프트 스킬이 필요합니다.

1. 비판적 사고

이 기술로 다음을 수행할 수 있습니다.

  • 질문, 가설 그리고 결과를 객관적으로 분석합니다.
  • 문제를 해결하는 데 어떤 리소스가 중요한지 이해합니다.
  • 다른 관점과 시점에서 문제를 봅니다.

비판적 사고는 어떤 직업으로든 쉽게 확장할 수 있는 가치 있는 기술입니다. 데이터 과학자에게는 더욱더 중요한 기술로서, 인사이트를 찾는 것뿐만 아니라, 질문을 적절하게 구성할 수 있고, 그 결과를 비즈니스에 어떻게 관련시킬지 또는 행동으로 옮기는 다음 단계를 어떻게 주도할지를 알 수 있어야 합니다.

또한 의견을 내기 전에 데이터 해석 처리 시 문제를 객관적으로 분석하는 것도 중요합니다. 데이터 과학 분야에서 비판적 사고란, 문제를 모든 각도에서 보고, 데이터 원본을 고려하며, 지속적으로 호기심을 갖는 태도를 말합니다.

2. 효과적인 의사소통

이 기술로 다음을 수행할 수 있습니다.

  • 비즈니스 맥락에서 데이터 기반 인사이트란 무엇인지 설명합니다.
  • 행동의 가치를 하이라이트하는 방식으로 정보를 전달합니다.
  • 결론을 이끌어 내는 연구 프로세스 및 가정을 전달합니다.

효과적인 의사소통은 모든 곳에서 추구하는 또 하나의 기술입니다. 이제 막 경력을 시작한 직원이든 CEO이든, 다른 사람과 교류하는 것은 빠르고 쉽게 업무를 완수하는 데 도움이 되는 유용한 특성입니다.

비즈니스에서, 데이터 과학자는 데이터를 분석하는 데 능숙해야 하며, 발견 사항을 기술적, 비기술적 대상 모두에게 분명하고 알아듣기 쉽게 설명해야 합니다. 이 중요한 요소는 조직 전체에 걸친 데이터 해독 능력과 데이터 과학자의 영향력을 높여 줍니다. 데이터로 다양한 문제의 솔루션을 찾거나 비즈니스 질문의 답을 찾는다면, 조직은 데이터 과학자를 문제 해결사 및 도움을 주는 커뮤니케이터로 신뢰할 것이며, 다른 사람들은 어떤 조치를 취해야 하는지 알게 될 것입니다.

3. 적극적인 문제 해결

이 기술로 다음을 수행할 수 있습니다.

  • 기회를 파악하고 문제와 솔루션을 설명합니다.
  • 기존의 가정과 리소스를 파악함으로써 문제에 어떻게 접근해야 할지 압니다.
  • 정답을 얻기 위해 사용할 가장 효율적인 방법을 찾기 위해 탐구적인 자세를 취합니다.

문제를 해결하는 기술이나 욕구 없이 데이터 과학자가 될 수 없습니다. 데이터 과학자는 바로 문제를 해결하려 있는 것입니다. 그러나, 효과적인 문제 해결사에게 문제의 원인을 파헤치려는 욕구만큼 중요한 것은 그것을 해결하기 위해 문제에 어떻게 접근해야 하는지 아는 것입니다. 문제 해결사는 종종 숨어 있는 어려운 문제를 쉽게 파악하고, 그것을 어떻게 처리할지 그리고 어떤 방법이 최선의 답을 제공할지를 신속하게 알아냅니다.

4. 지적 호기심

이 기술로 다음을 수행할 수 있습니다.

  • 답에 대한 탐색을 주도합니다.
  • 피상적인 결과나 초기 가정에서 더 나아가 깊이 탐구합니다.
  • 더 알고 싶다는 투지를 가지고 창의적으로 사고합니다.
  • 끊임없이 '왜'라고 묻습니다. 하나의 답은 대개 충분하지 않기 때문입니다.

데이터 과학자는 지적 호기심을 갖고 데이터가 제시하는 질문을 찾아 답하겠다는 투지가 있어야 할 뿐만 아니라, 한 번도 질문하지 않은 질문에 대한 답도 찾아야 합니다. 데이터 과학은 기저에 깔린 진실을 발견하는 것이며, 성공적인 과학자라면 '이 정도면 충분해'라고 안주하지 않고 계속해서 더 많은 답을 모색할 것입니다.

5. 비즈니스 감각

이 기술로 다음을 수행할 수 있습니다.

  • 비즈니스와 해당 특별 요구 사항을 이해합니다.
  • 조직의 어떤 문제가 해결되어야 하는지와 그 이유를 압니다.
  • 데이터를 조직에 활용되는 결과로 전환합니다.

데이터 과학자는 이중 임무를 수행합니다. 맡은 분야와 데이터 탐색 방법을 알아야 할 뿐만 아니라, 자신이 근무하는 비즈니스와 분야에 대해서도 알아야 합니다. 데이터를 다루는 방법을 아는 것도 중요하지만, 데이터 과학자는 현재의 문제를 해결하고 데이터가 미래의 성장과 성공을 지원하는 방법을 고려할 수 있을 만큼 비즈니스를 깊이 이해해야 합니다.

Infosys의 최고 글로벌 데이터 과학자인 N. R. Srinivasa Raghavan 박사는 "데이터 과학은 수치 분석을 넘어, 업종의 특정 문제를 해결하기 위해 다양한 기술을 적용하는 것입니다"라고 설명합니다.


기술적 기량

데이터 과학자의 직무 기술서에 일반적으로 제일 먼저 등장하는 더 필수적인 기술입니다. 이 영역의 많은 부분이 교육 과정 또는 공식적인 비즈니스 교육을 통해 개발되고 다루어집니다. 많은 조직에서 분석 및 데이터 직원이 발전하면서 이 부분을 점점 더 강조하고 있습니다.

6. 효율적인 분석을 위한 데이터 준비 능력

이 기술로 다음을 수행할 수 있습니다.

  • 데이터를 소싱, 수집, 정렬, 처리, 모델링합니다.
  • 대규모의 정형 및 비정형 데이터를 분석합니다.
  • 의사 결정 및 문제 해결을 위해 가장 적합한 양식으로 데이터를 준비하고 표시합니다.

데이터 준비는 분석을 위해 데이터를 준비하는 프로세스로, 데이터 탐색, 변환 및 정리 작업을 포함하며 분석가 및 데이터 과학자의 분석 워크플로우에서 매우 중요한 부분을 차지합니다. 어떤 도구를 쓰든지, 데이터 과학자는 데이터 준비 작업과 그것이 데이터 과학 워크플로우에 어떻게 연관되는지를 이해해야 합니다. Tableau Prep Builder와 같은 데이터 준비 도구는 모든 기술 수준의 사용자에게 적합합니다.

데이터 준비 모범 사례에 대해 자세히 알아보십시오.

7. 셀프 서비스 분석 플랫폼을 활용하는 능력

이 기술로 다음을 수행할 수 있습니다.

  • 데이터 시각화 사용의 이점과 문제점을 이해합니다.
  • 시장에 나와 있는 솔루션에 대한 기본 지식이 있습니다.
  • 분석 시 필요한 모범 사례 및 기술을 알고 적용합니다.
  • 셀프 서비스 대시보드 또는 응용 프로그램을 통해 결과를 공유할 수 있습니다.

이 기술은 비판적 사고 및 의사소통과 관련이 있으므로 비기술적 기량과 일맥상통합니다. 셀프 서비스 분석 플랫폼을 사용하면, 데이터 과학 프로세스의 결과를 드러내고 데이터를 탐색하는 데 도움이 될 뿐만 아니라, 이 결과를 기술 면에서 덜 전문적인 사람들과 공유할 수 있게 됩니다. 셀프 서비스 플랫폼에서 대시보드를 작성하면, 최종 사용자는 매개 변수를 조정하여 스스로 질문을 할 수 있고 대시보드가 업데이트되는 것을 보면서 실시간으로 분석에 미치는 영향을 평가할 수 있습니다.

8. 효율적이고 유지 가능한 코드 작성 능력

이 기술로 다음을 수행할 수 있습니다.

  • 데이터를 분석, 처리 및 시각화하는 프로그램을 직접 다룹니다.
  • 데이터를 구문 분석하는 프로그램 또는 알고리즘을 작성합니다.
  • API를 통해 데이터를 수집하고 준비합니다.

이 기술은 거의 당연한 것입니다. 데이터 과학자라면 데이터를 분석하고 처리하도록 설계된 시스템에 열중하기 마련이며, 시스템의 내부 작업도 이해해야 합니다. 데이터 과학에 사용되는 다양한 언어가 많이 있습니다. 자신의 역할, 업종 및 비즈니스 당면 과제에 가장 적합한 언어를 익혀 적용하십시오.

9. 수학과 통계를 적절하게 적용하는 능력

이 기술로 다음을 수행할 수 있습니다.

  • 탐구적 데이터 분석을 수행하고 중요한 패턴 및 관계를 파악합니다.
  • 수많은 정보에서 의미를 추출해 내는 엄격한 통계적 사고를 적용합니다.
  • 다양한 테스트 모델의 장점과 한계 및 주어진 문제에 맞는 이유를 이해합니다.

코딩과 마찬가지로, 수학과 통계도 데이터 과학에서 중요한 역할을 합니다. 데이터 과학자는 수학적 혹은 통계적 모델을 다루며, 그것을 적용하고 확장할 줄 알아야 합니다. 탄탄한 통계 지식이 있는 데이터 과학자는 다양한 데이터의 가치와 답을 찾을 수 있는 질문 유형인지 아닌지에 대해 비판적으로 사고할 수 있습니다. 때때로 문제는 기발한 해결책 설계를 필요로 하는데, 이는 기존의 분석 기술 및 도구를 병합하거나 수정하는 방식일 수 있습니다. 이러한 응용 프로그램을 사용할 때, 기초가 되는 가정 및 알고리즘을 이해하는 것은 매우 중요합니다.

10. 기계 학습과 인공 지능(AI)을 활용하는 능력

이 기술로 다음을 수행할 수 있습니다.

  • 비즈니스에 기계 학습과 AI가 언제 어떻게 필요한지 이해합니다.
  • 생산적인 AI 솔루션을 구현하는 모델을 교육하고 배포합니다.
  • 비즈니스에 유용하도록 모델 및 예측을 설명합니다.

기계 학습이나 AI가 대부분의 조직에서 데이터 과학자의 역할을 대체하지는 않을 것입니다. 그러나 이 둘을 사용하여 데이터 과학자로서 제공하는 가치를 개선하고 일을 더 빨리, 더 잘해나갈 수 있습니다. 어느 최고 데이터 책임자가 최근에 말했습니다. "AI와 기계 학습의 약속을 실현하려면, 진정 수많은 인간의 기술이 필요할 것입니다." 그가 전하는 바처럼, AI 관련 가장 큰 과제는 가장 유용한 학습된 AI 모델을 결정하기 전에, 올바른 데이터를 보유하고 있는지, 그 '올바른 데이터'가 언제 잘못된 것을 표시하는지를 아는 것, 그리고 AI에 '사용하기에 좋은' 데이터를 찾는 것입니다.

이력서에 데이터 기술을 기재해야 하는 이유

Tableau 블로그의 신세대 데이터 시리즈의 일부인 이 블로그 게시물에서, 저자 Midori Ng는 데이터 기술을 구직 이력서에 포함해야 하는 실제적인 이유와 조언을 들려줍니다. 이 글을 살펴보고, 개인적으로 또한 직업적으로 만족과 성공을 가져다 줄, 비기술적 및 기술적 데이터 과학 기술의 조합을 완성하는 길을 찾아보십시오.

또한, Tableau를 사용한 고급 분석 백서를 읽고, Tableau 플랫폼에서의 고급 분석 기능 및 시나리오에 관해 자세히 알아보십시오.