データサイエンス人材の需要は高まっており、その需要を満たすためにさらに多くのデータサイエンティストが必要になっています。データサイエンスの応用も独立した一分野ですが、1 つの業界や業種のためのものではありません。データサイエンティストは、どの組織のどの部門でもインパクトをもたらすことができます。

新人のデータサイエンティストでも、その道を進目指している場合でも、教育が最初の一歩であることは知っています。しかし、技術面のカリキュラムの外にも、分野の枠を超えるデータサイエンスのスキルがあります。そのようなスキルを磨いて伸ばしていくと、データサイエンス分野が成長するにつれて、他の求職者やデータサイエンティストに差をつけるのに役立つでしょう。


非技術的なスキル

非技術的なスキルには、同等の技術トレーニングや公式認定資格は必要ありませんが、ビジネス上の問題でデータサイエンスを徹底的に応用する際の基盤になります。一流の技術スキルを持つデータサイエンティストでも、今日成功するためには次のソフトスキルを持つ必要があります。

1.批判的思考

このスキルで行うこと

  • 質問、仮説、結果を客観的に分析する
  • 問題の解決にどのようなリソースが欠かせないかを理解する
  • 異なる見方や視点で問題を見る

批判的思考 (クリティカルシンキング) は、どの職業でも簡単に応用できる重要なスキルです。データサイエンティストの場合、批判的思考はさらに重要です。というのも、データサイエンティストはインサイトを見出すことに加え、質問を適切に組み立てて、その結果が会社にどう関わっているのか、あるいは行動につながる次のステップをどのように促すのかを理解できなければならないためです。

また、意見を練り上げる前にデータの解釈に取り組む際は、問題を客観的に分析することも重要です。データサイエンス分野の批判的思考とは、問題をあらゆる角度から見て、データソースを検討し、関心を常に持ち続けることを意味します。

2.効果的なコミュニケーション

このスキルで行うこと

  • ビジネスに関係する観点から、データドリブンなインサイトの意味を説明する
  • 行動の価値を強調するように情報を伝える
  • 結論につながった調査プロセスと前提を伝える

効果的なコミュニケーションも、ほぼあらゆる場所で需要の高いスキルです。新入社員でも CEO でも、他の人々とつながりを持つと物事をスピーディかつ簡単に成し遂げられるようになります。

ビジネスでは、データサイエンティストはデータ分析に熟練している必要があり、そのうえ専門知識がある人にもない人にもわかりやすくスムーズに分析結果を説明しなければなりません。この不可欠な要素によって、組織全体でデータリテラシーが広まりやすくなり、データサイエンティストがインパクトをもたらす能力も拡大します。データからさまざまな問題の解決方法やビジネス上の質問への答えが得られれば、対応の方法を他の人々が理解できるように、組織は問題解決と助けになる情報の提供をデータサイエンティストに任せることになります。

3.積極的な問題解決

このスキルで行うこと

  • 機会を見出し、問題と解決方法を説明する
  • すでにある前提とリソースを明らかにして、問題へのアプローチ方法を把握する
  • 推理力を働かせて、適切な答えを得るための最も効果的な手段を見出す

問題解決のスキルや情熱がなければ、データサイエンティストにはなれません。問題解決こそがデータサイエンスの存在意義です。しかし問題をうまく解決するには、問題を解決するためのアプローチ方法を把握しようとする情熱と同じ程度に、問題の根本まで掘り下げる情熱が必要です。問題を解決できる人は、隠れていることもある扱いにくい問題を容易に把握した後、すぐに問題の対処方法や最適な答えを得るための手法に目を向けるものです。

4.知的好奇心

このスキルで行うこと

  • 答えの探求を推し進める
  • 表面的な結果や当初の仮定より深く掘り下げる
  • もっと知りたいという意欲を持って独創的に考える
  • 通常 1 つの答えでは不十分なため、常に「なぜ」を問い続ける

データサイエンティストは、知的好奇心と、データが示す疑問を見出して答えを導き出す意欲を持たなければなりませんが、投げかけられたことのない疑問にも答えを出す必要があります。データサイエンスは根底にある事実を見つけ出すためにあるものであり、成功するデータサイエンティストは「必要十分」で決して満足せずに答えを求め続けます。

5.ビジネス感覚

このスキルで行うこと

  • ビジネスとその独特のニーズを理解する
  • 組織で解決しなければならない問題とその理由を把握する
  • データから組織の役に立つ結果を導き出す

データサイエンティストには 2 つの義務があります。専門分野とデータの扱い方を把握すること、そしてそれだけではなく、自分の会社のビジネスと業界も把握することです。データに精通することも大切ですが、データサイエンティストは現在の問題を解決し、データで将来の成長や成功を支援する方法を検討できるほどに、ビジネスを深く理解しなければなりません。

Infosys 社の最高グローバルデータサイエンティストである N. R. Srinivasa Raghavan 博士は、「データサイエンスとは、単に複雑な計算を行うだけでなく、業界の特定の問題を解決するために多様なスキルを適用することです」と述べています。


技術スキル

技術スキルは通常、データサイエンティストの職務記述書で上の方に挙げられているとりわけ必須のスキルです。その分野の多くは、学校の講義や正式な実務教育で取り上げられ学ぶことになるでしょう。また多くの組織は、分析環境やデータの担当者が成長するにつれて、技術スキルをますます重視するようになります。

6.効果的な分析のためにデータ準備を行う能力

このスキルで行うこと

  • データの調達、収集、整理、処理、モデリングを行う
  • 大量の構造化データや非構造化データを分析する
  • 意思決定や問題解決に最適な形式で、データを準備して提示する

データ準備とはデータを分析できる状態にするためのプロセスであり、データディスカバリ、変換、クリーニングなどの作業が含まれます。これは、アナリストとデータサイエンティストの両方にとって分析ワークフローに不可欠な要素です。どのようなツールでも、データサイエンティストはデータ準備作業を理解し、その作業が自身のデータサイエンスのワークフローにどのように関係しているかも理解しておく必要があります。Tableau Prep Builder のようなデータ準備ツールは、スキルレベルにかかわらず使いやすいように作られています。

データ準備のベストプラクティスについて詳しくご覧ください。

7.セルフサービス分析プラットフォームを活用する能力

このスキルで行うこと

  • データビジュアライゼーションを使うメリットとその課題を理解する
  • 市場にあるソリューションの基本的な知識を得る
  • 分析を行う際のベストプラクティスとテクニックを知り応用する
  • セルフサービス型のダッシュボードやアプリケーションで結果を共有する能力を身につける

このスキルは、批判的思考やコミュニケーションと関係があり、非技術的なスキルと軌を一にしています。セルフサービス分析プラットフォームは、データサイエンスのプロセスの結果を目に見える形にしデータを探索するのに役立ちますが、専門知識をあまり持たない人々とその結果を共有できるようにもします。セルフサービス型プラットフォームでダッシュボードを作成すると、エンドユーザーはパラメーターを調整して、自身の質問の答えを引き出すことも、ダッシュボードが更新されるためにリアルタイムで、パラメーターが分析に及ぼす影響を評価することもできます。

8.効率的で維持しやすいコードを書く能力

このスキルで行うこと

  • データの分析、処理、視覚化を行うプログラムを直接扱う
  • データを解析するプログラムやアルゴリズムを作成する
  • API を使ってデータの収集や準備を行う

このスキルは、ほぼ当然のものと言えます。データサイエンティストは、データを分析し処理するように設計されたシステムを利用するのが仕事であるため、システム内部の仕組みも理解している必要があります。また、データサイエンスではさまざまな言語が使われています。業務や業界、ビジネス上の課題に合わせて、最も適切な言語を学び利用しましょう。

9.数学と統計学を適切に応用する能力

このスキルで行うこと

  • データの探索的分析を行い、重要なパターンや関係性を見出す
  • 綿密な統計的思考を生かして、不要な情報の中から必要な情報を抽出する
  • さまざまな検証モデルの長所と短所、問題の検証モデルが適している理由を理解する

データサイエンスでは、コーディングと同じように数学や統計学も重要な役割を果たします。データサイエンティストは数理モデルや統計モデルを扱うものであり、モデルを適用し発展させることができなければなりません。統計学の深い知識を持っていると、データサイエンティストはさまざまなデータの価値や、データで答えを出せる質問と出せない質問の種類について、批判的思考を行えるようになります。場合によっては問題で新しい解決策を考案する必要があり、その際に既成の分析テクニックや分析ツールの組み合わせ、変更を行うこともあります。そうしたアプリケーションを使う場合は、元になっている前提やアルゴリズムを理解しておくことが欠かせません。

10.機械学習と人工知能 (AI) を活用する能力

このスキルで行うこと

  • 機械学習や AI がいつ、どのようにビジネスに適切なのかを理解する
  • 生産性の高い AI ソリューションを導入するために、モデルをトレーニングして導入する
  • ビジネスに対する有用性の観点からモデルと予測を説明する

ほとんどの組織では、機械学習も AI もデータサイエンティストの役割を奪うことはありません。しかし、機械学習や AI を活用すると、データサイエンティストのもたらす価値が高まり、仕事の質の向上と時間の短縮に役立てることができます。先日、ある最高データ責任者 (英語) も、「AI と機械学習の展望を実現するには、人間ならではのさまざまなスキルが必要になるだろう」と語りました。この最高データ責任者が言うように AI における最大の課題は、適切なデータがあるかどうかを判断し、「適切なデータ」が誤った結果を提示しているときに気づいて、トレーニング済みの最も役立つ AI モデルを決定する前に AI にとって「十分」なデータを見出すことです。

データスキルが履歴書に必要な理由

Tableau ブログの「データ世代」シリーズのこのブログで、Midori Ng は履歴書にデータスキルを記す実用的な理由とアドバイスを語っています。ぜひご覧ください。そして、公私にわたって満足と成功をもたらす、データサイエンスの非技術的なスキルと技術的なスキルを両方とも身につけましょう。

ホワイトペーパー「Tableau を使った高度な分析」で、Tableau プラットフォームの高度な分析機能とシナリオについてもお読みください。