データサイエンティストとは?欠かせない 10 の技術スキルとソフトスキル

データサイエンティストとは

データサイエンス人材の需要は高まっており、その需要を満たすためにさらに多くのデータサイエンティストが必要になっています。データサイエンスの応用も独立した一分野ですが、1 つの業界や業種のためのものではありません。データサイエンティストは、どの組織のどの部門でもインパクトをもたらすことができます。 新人のデータサイエンティストでも、その道を進目指している場合でも、教育が最初の一歩であることは知っています。しかし、技術面のカリキュラムの外にも、分野の枠を超えるデータサイエンスのスキルがあります。そのようなスキルを磨いて伸ばしていくと、データサイエンス分野が成長するにつれて、他の求職者やデータサイエンティストに差をつけるのに役立つでしょう。

データサイエンティストとは

データサイエンティストとは、数学や統計学、情報処理技術、ビジネス感覚などの知識・スキルを用いてデータを分析し、データから価値を創出する専門家です。データから有益な情報を抽出して示すことにより、重要な意思決定やビジネス課題の解決をサポートする役割を担います。

データサイエンティストが扱うデータは、多岐にわたります。例えば、Web 行動履歴データ、EC サイトの購買履歴データ、POS データ、クレジットカード決済履歴データ、コールセンターへの問い合わせデータ、生産工場内の IoT データ、スマホアプリの利用履歴データ、生活者の SNS などへの書き込みデータなど、経済活動のさまざまな場面において蓄積されていくデータはすべてデータサイエンティストが扱う対象になるといえるのです。その中には非構造化データや、いわゆるビッグデータも含まれます。

近年、データサイエンティストの需要が増しているのは、ビッグデータを収集し処理できる環境が整ってきたことと無縁ではありません。また、機械学習や人工知能(AI)関連技術による新しい分析手法も登場しており、それらのモデルを効果的にデータ分析に活用する試みも進んでいます。膨大な量のデータを正しくスピーディに分析し、読み解いて、ビジネスに活かす役割の人材が求められており、データサイエンティストはそれを実現するための最も近い存在であるといえます。

Tableau を無料で試す

データサイエンティストの仕事内容とは

データサイエンティストの仕事内容

データ分析はデータサイエンティストに課せられた重要な職務のひとつです。しかし、データサイエンティストの仕事内容はそれだけにとどまりません。どんな組織に所属しているかにもよりますが、多くのデータサイエンティストは、データをビジネスに活用するための幅広い仕事に携わっています。

分析環境の構築

まず挙げられるのが分析環境の構築です。データの収集と蓄積、そしてデータを運用するための仕組みを作ります。データを集めるためのプログラムの作成、統一性に欠ける膨大なデータを活用しやすいフォーマットへ変換する仕組みの確立、データを分析し処理するシステムの設計、データを蓄積するデータベースの構築と運用・保守、さらにセキュリティ対策もそこに含まれます。

目標に沿ったデータ収集

データの分析にあたっては、分析結果をどのようなビジネス目標に活用するのかを明確化することから業務が始まります。例えば以下のような目標が考えられます。

<データ分析を活用する目標の例>
  • 経営判断、意思決定
  • 事業戦略の策定
  • 売上・利益向上への寄与
  • コストダウン
  • リスクマネジメント
  • そのほか、さまざまなビジネス課題の解決

これらの目標に沿って、関連性のあるデータを見定めて収集します。収集したデータは、そこに潜むパターンを発見し、課題解決につながる傾向を特定します。ケースごとに最適な分析手法の選定、分析に必要な変数の作成・加工、あるいは分析のためのプログラムやアルゴリズムの作成を行うこともあります。

分析報告書の作成

得られた分析結果をもとに、データからどのようなことがわかるのか、得られたインサイトがどのように目標達成につながるのかを明らかにします。その内容はレポート(分析報告書)にまとめて提出し、共有します。レポーティングの際は、内容をわかりやすく伝えるためのデータのビジュアライゼーションも欠かせません。

分析結果の効果検証

加えて、データ分析に関する評価とそれにもとづく精度を上げるためのチューニング、分析結果がどの程度目標達成に役立ったかの効果検証と改善も行っていきます。また、データ分析を日常的な業務に組み込む必要がある場合は、そのためのフローを構築し、仕組み化していく業務にも関わることになるでしょう。

このように、データサイエンティストが携わる業務の範囲は広く、一言では説明しきれないほどです。経営層やビジネス部門との連携・コラボレーションを進めていく必要もあります。さらに、データドリブンなカルチャーの浸透度によって、企業や組織ごとに役割も変わり、変化もしていきます。

Tableau を無料で試す

データサイエンティストに必要な非技術的スキル

データサイエンティストに必要な非技術的スキル

非技術的なスキルには、同等の技術トレーニングや公式認定資格は必要ありませんが、ビジネス上の問題でデータサイエンスを徹底的に応用する際の基盤になります。一流の技術スキルを持つデータサイエンティストでも、今日成功するためには次のソフトスキルを持つ必要があります。

1.批判的思考

このスキルで行うこと

  • 質問、仮説、結果を客観的に分析する
  • 問題の解決にどのようなリソースが欠かせないかを理解する
  • 異なる見方や視点で問題を見る

批判的思考 (クリティカルシンキング) は、どの職業でも簡単に応用できる重要なスキルです。データサイエンティストの場合、批判的思考はさらに重要です。というのも、データサイエンティストはインサイトを見出すことに加え、質問を適切に組み立てて、その結果が会社にどう関わっているのか、あるいは行動につながる次のステップをどのように促すのかを理解できなければならないためです。 また、意見を練り上げる前にデータの解釈に取り組む際は、問題を客観的に分析することも重要です。データサイエンス分野の批判的思考とは、問題をあらゆる角度から見て、データソースを検討し、関心を常に持ち続けることを意味します。

2.効果的なコミュニケーション

このスキルで行うこと

  • ビジネスに関係する観点から、データドリブンなインサイトの意味を説明する
  • 行動の価値を強調するように情報を伝える
  • 結論につながった調査プロセスと前提を伝える

効果的なコミュニケーションも、ほぼあらゆる場所で需要の高いスキルです。新入社員でも CEO でも、他の人々とつながりを持つと物事をスピーディかつ簡単に成し遂げられるようになります。 ビジネスでは、データサイエンティストはデータ分析に熟練している必要があり、そのうえ専門知識がある人にもない人にもわかりやすくスムーズに分析結果を説明しなければなりません。この不可欠な要素によって、組織全体でデータリテラシーが広まりやすくなり、データサイエンティストがインパクトをもたらす能力も拡大します。データからさまざまな問題の解決方法やビジネス上の質問への答えが得られれば、対応の方法を他の人々が理解できるように、組織は問題解決と助けになる情報の提供をデータサイエンティストに任せることになります。

3.積極的な問題解決

このスキルで行うこと

  • 機会を見出し、問題と解決方法を説明する
  • すでにある前提とリソースを明らかにして、問題へのアプローチ方法を把握する
  • 推理力を働かせて、適切な答えを得るための最も効果的な手段を見出す

問題解決のスキルや情熱がなければ、データサイエンティストにはなれません。問題解決こそがデータサイエンスの存在意義です。しかし問題をうまく解決するには、問題を解決するためのアプローチ方法を把握しようとする情熱と同じ程度に、問題の根本まで掘り下げる情熱が必要です。問題を解決できる人は、隠れていることもある扱いにくい問題を容易に把握した後、すぐに問題の対処方法や最適な答えを得るための手法に目を向けるものです。

4.知的好奇心

このスキルで行うこと

  • 答えの探求を推し進める
  • 表面的な結果や当初の仮定より深く掘り下げる
  • もっと知りたいという意欲を持って独創的に考える
  • 通常 1 つの答えでは不十分なため、常に「なぜ」を問い続ける

データサイエンティストは、知的好奇心と、データが示す疑問を見出して答えを導き出す意欲を持たなければなりませんが、投げかけられたことのない疑問にも答えを出す必要があります。データサイエンスは根底にある事実を見つけ出すためにあるものであり、成功するデータサイエンティストは「必要十分」で決して満足せずに答えを求め続けます。

5.ビジネス感覚

このスキルで行うこと

  • ビジネスとその独特のニーズを理解する
  • 組織で解決しなければならない問題とその理由を把握する
  • データから組織の役に立つ結果を導き出す

データサイエンティストには 2 つの義務があります。専門分野とデータの扱い方を把握すること、そしてそれだけではなく、自分の会社のビジネスと業界も把握することです。データに精通することも大切ですが、データサイエンティストは現在の問題を解決し、データで将来の成長や成功を支援する方法を検討できるほどに、ビジネスを深く理解しなければなりません。 Infosys 社の最高グローバルデータサイエンティストである N. R. Srinivasa Raghavan 博士は、「データサイエンスとは、単に複雑な計算を行うだけでなく、業界の特定の問題を解決するために多様なスキルを適用することです」と述べています。

Tableau を無料で試す

データサイエンティストに必要な技術スキル

データサイエンティストに必要な技術スキル

技術スキルは通常、データサイエンティストの職務記述書で上の方に挙げられているとりわけ必須のスキルです。その分野の多くは、学校の講義や正式な実務教育で取り上げられ学ぶことになるでしょう。また多くの組織は、分析環境やデータの担当者が成長するにつれて、技術スキルをますます重視するようになります。

6.効果的な分析のためにデータ準備を行う能力

このスキルで行うこと

  • データの調達、収集、整理、処理、モデリングを行う
  • 大量の構造化データや非構造化データを分析する
  • 意思決定や問題解決に最適な形式で、データを準備して提示する

データ準備とはデータを分析できる状態にするためのプロセスであり、データディスカバリ、変換、クリーニングなどの作業が含まれます。これは、アナリストとデータサイエンティストの両方にとって分析ワークフローに不可欠な要素です。どのようなツールでも、データサイエンティストはデータ準備作業を理解し、その作業が自身のデータサイエンスのワークフローにどのように関係しているかも理解しておく必要があります。Tableau Prep Builder のようなデータ準備ツールは、スキルレベルにかかわらず使いやすいように作られています。 データ準備のベストプラクティスについて詳しくご覧ください。

7.セルフサービス分析プラットフォームを活用する能力

このスキルで行うこと

  • データビジュアライゼーションを使うメリットとその課題を理解する
  • 市場にあるソリューションの基本的な知識を得る
  • 分析を行う際のベストプラクティスとテクニックを知り応用する
  • セルフサービス型のダッシュボードやアプリケーションで結果を共有する能力を身につける

このスキルは、批判的思考やコミュニケーションと関係があり、非技術的なスキルと軌を一にしています。セルフサービス分析プラットフォームは、データサイエンスのプロセスの結果を目に見える形にしデータを探索するのに役立ちますが、専門知識をあまり持たない人々とその結果を共有できるようにもします。セルフサービス型プラットフォームでダッシュボードを作成すると、エンドユーザーはパラメーターを調整して、自身の質問の答えを引き出すことも、ダッシュボードが更新されるためにリアルタイムで、パラメーターが分析に及ぼす影響を評価することもできます。

8.効率的で維持しやすいコードを書く能力

このスキルで行うこと

  • データの分析、処理、視覚化を行うプログラムを直接扱う
  • データを解析するプログラムやアルゴリズムを作成する
  • API を使ってデータの収集や準備を行う

このスキルは、ほぼ当然のものと言えます。データサイエンティストは、データを分析し処理するように設計されたシステムを利用するのが仕事であるため、システム内部の仕組みも理解している必要があります。また、データサイエンスではさまざまな言語が使われています。業務や業界、ビジネス上の課題に合わせて、最も適切な言語を学び利用しましょう。

9.数学と統計学を適切に応用する能力

このスキルで行うこと

  • データの探索的分析を行い、重要なパターンや関係性を見出す
  • 綿密な統計的思考を生かして、不要な情報の中から必要な情報を抽出する
  • さまざまな検証モデルの長所と短所、問題の検証モデルが適している理由を理解する

データサイエンスでは、コーディングと同じように数学や統計学も重要な役割を果たします。データサイエンティストは数理モデルや統計モデルを扱うものであり、モデルを適用し発展させることができなければなりません。統計学の深い知識を持っていると、データサイエンティストはさまざまなデータの価値や、データで答えを出せる質問と出せない質問の種類について、批判的思考を行えるようになります。場合によっては問題で新しい解決策を考案する必要があり、その際に既成の分析テクニックや分析ツールの組み合わせ、変更を行うこともあります。そうしたアプリケーションを使う場合は、元になっている前提やアルゴリズムを理解しておくことが欠かせません。

10.機械学習と人工知能 (AI) を活用する能力

このスキルで行うこと

  • 機械学習や AI がいつ、どのようにビジネスに適切なのかを理解する
  • 生産性の高い AI ソリューションを導入するために、モデルをトレーニングして導入する
  • ビジネスに対する有用性の観点からモデルと予測を説明する

ほとんどの組織では、機械学習も AI もデータサイエンティストの役割を奪うことはありません。しかし、機械学習や AI を活用すると、データサイエンティストのもたらす価値が高まり、仕事の質の向上と時間の短縮に役立てることができます。先日、ある最高データ責任者 (英語) も、「AI と機械学習の展望を実現するには、人間ならではのさまざまなスキルが必要になるだろう」と語りました。この最高データ責任者が言うように AI における最大の課題は、適切なデータがあるかどうかを判断し、「適切なデータ」が誤った結果を提示しているときに気づいて、トレーニング済みの最も役立つ AI モデルを決定する前に AI にとって「十分」なデータを見出すことです。

Tableau を無料で試す

データスキルが履歴書に必要な理由

Tableau ブログの「データ世代」シリーズのこのブログで、Midori Ng は履歴書にデータスキルを記す実用的な理由とアドバイスを語っています。ぜひご覧ください。そして、公私にわたって満足と成功をもたらす、データサイエンスの非技術的なスキルと技術的なスキルを両方とも身につけましょう。 ホワイトペーパー「Tableau を使った高度な分析」で、Tableau プラットフォームの高度な分析機能とシナリオについてもお読みください。