データサイエンティストやアナリストのための 7 つのデータコンテスト

データコンテストにはさまざまな機能があります。ベストプラクティスを学び、作品に対するフィードバックを取得し、スキルを磨くには最適な方法です。また、問題の解決法をクラウドソーシングすることは、ブレインストーミングの方法ともなります。

その目的が何であっても、データコンテストは限界を突破するチャンスであり、さまざまなデータ関連分野で最も優秀な人々と競い合うことでクリエイティビティを向上させることができます。

データビジュアライゼーションからデータサイエンスまで、挑戦できるさまざまなデータコンテストをご紹介します。

Iron Viz

Web サイト: tableau.com/ja-jp/iron-viz
主催: Tableau

Tableau Public は毎年数回、最高の Viz チャレンジの場として、データビジュアライゼーションのコンテストを開催しています。それが Iron Viz です。バーチャルな「予選」は年間を通して行われており、毎回特定のテーマを通じてデータビジュアライゼーションのスキルに焦点を当てます。各予選の通過者は、Tableau Conference または Tableau Conference Europe で、17,000 人の観客を前にライブで行われる Iron Viz の決勝に出場します。この決勝では、3 名の予選通過者が同じデータセットを使い、データビジュアライゼーションを作成して競い合います。

応募作品の審査基準は、Viz 全体のデザイン、Viz とデータがどれほど適切にストーリーを伝えているか、そしてデータ分析の深さと分析結果です。Iron Viz コンテストは参加するだけでも、分析の世界を体験して、分析分野の他の人々やエキスパートからフィードバックを得られる素晴らしい機会になります。

Kaggle のコンテスト

Web サイト: kaggle.com/competitions (英語)
主催: Kaggle

データコンテストと言えば、Kaggle を挙げないわけにはいきません。Kaggle は、データサイエンスのコンテストを開催している最も有名なプラットフォームの 1 つです。元々は機械学習コンテストから開始したサイトで、それによって今のように有名になりました。Kaggle コンテストには、通常チームと個人の両方から数千件の応募があり、高額な賞金をかけて競います。

コンテストでは複雑な問題が取り上げられ、参加者は問題を解決するための最適なアルゴリズムを作成する必要があります。コンテストで得られるのは、知識を深められた満足感から、記念品や賞金までさまざまです。。賞金のほとんどは数万ドル台になることが多いのですが、過去には 10 万ドルを超えたことも数回ありました。現在までの賞金最高額は 100 万ドルで、不動産会社の Zillow 社による、住宅価値予測 (英語) のベンチマークモデル「Zestimate」より優れた作品を作成した優勝チームに与えられました。Kaggle はさまざまな組織のコンテストを主催しているほか、科学を通じてより良い社会の実現を目指す、Data Science Bowl (英語) コンテストも毎年開催しています。

Kantar Information is Beautiful Awards

Web サイト: informationisbeautifulawards.com (英語)
主催: Information is Beautiful と Kantar

データビジュアライゼーションに関わっている人の間で有名なのが、ビジュアルデザインで情報がどれほど伝わりやすくなるかを紹介する David McCandless 氏のサイト、Information Is Beautiful です。さらに同サイトは、最もクリエイティブな最高のデータビジュアライゼーションに注目する Information is Beautiful Awards も開催しています。

毎年、データをアートに変えることに秀でた作成が選ばれ、データ表示の方法のほか、どのように情報を際立たせてテーマに関するインサイトを引き出しているかが審査されます。そして、コンテストの最後を飾るのが Information is Beautiful Awards 授賞式です。予選通過者はサイトに掲載されますが、最終選考に残った参加者は、年末の授賞式に招待されます。2018 年の授賞式では、最終選考に残った参加者の Viz が記念のクッキーになってパーティーに出されました (英語)。

データコンテストの優勝者は、クッキーを作ってもらう名誉から数千ドルの賞金までさまざまなものを得られます。簡単なものから始めている初心者など、専門知識のレベルにかかわらず、データコンテストはスキルを磨くのにうってつけの方法です。

Driven Data のコンテスト

Web サイト: drivendata.org/competitions (英語)
主催: Driven Data

Driven Data も Kaggle と同じように、難しい予測問題の解決をクラウドソーシングすることを目的にして、データサイエンスのコンテストを開催しています。Driven Data は、予測に役立つ統計モデルを構築して、世界が抱える差し迫った社会的課題を解決しようとしています。コンテストの規模は Kaggle ほど大きくはありませんが、目に見える影響を世界に及ぼしている問題を解決して、人間と自然の両方に利益をもたらすことが Driven Data の狙いです。過去に注目を集めたコンテストの例としては、AARP Foundation が後援した高齢者の身体的な安全に関する予測 (英語) のコンテストや、ビデオ映像を使った魚の計測と計数 (英語) で持続可能な漁業を支援する、The Nature Conservancy と Gulf of Maine Research Institute のコンテストが挙げられます。

応募作品は、基準となる最新データの実際の値と比較し、データをどれほどうまく予測して問題を解決できるかに基づいて審査されます。受賞モデルはその後、目標を改善するために主催組織によって取り入れられます。栄誉のみが得られるものも、賞金が用意されているものもありますが、どのコンテストも間違いなく世界に影響を及ぼします。

CrowdANALYTIX コミュニティ

Web サイト: crowdanalytix.com/community (英語)
主催: CrowdANALYTIX

CrowdANALYTIX も、機械学習、人工知能、ディープラーニング、自然言語処理を対象にしたデータモデリングのコンテストを開催しています。気軽にチャレンジできますが、やりがいが少ないわけではありません。ここでご紹介している他のコンテストの多くと同じように、学習を目的にしたものも賞金が用意されているものもあります。

このプラットフォームには 2 つの「レイヤー」があります。ボットのマシンレイヤーと、ボットやアルゴリズムを作成するデータサイエンティストのヒューマンレイヤーです。CrowdANALYTIX のデータコンテストは他と多少異なり、継続的な反復が行われている開発途中にあると見なされています。 受賞したアルゴリズムは CrowdANALYTIX のデータベースに取り入れられ、モニタリングされて微調整を受けます。そしてアルゴリズムが劣化し始めた場合は、コミュニティに戻されて、調整を受けるか再構築されることになります。

Coda Lab のコンテスト

Web サイト: competitions.codalab.org (英語)
主催: Coda Lab

Coda Lab は計算研究のオープンソースプラットフォームです。共同研究とコードのテストを目的にしてコンテストが開催されています。栄誉ある賞は授与されませんが、協力し合いながらより効率的で再現可能なコードの作成に取り組んでいます。Coda Lab のコンテストでは、プログラミングとデータのコード作成が中心で、共同のプロジェクトやチャレンジを体験するには適しています。

Topcoder Open

Web サイト: tco19.topcoder.com (英語)
主催: Topcoder

Topcoder も Coda Lab と同様に、コードのテストと研究を取りまとめ、協力して取り組むための場です。メインのサイトには、データサイエンスやコーディング、Web デザインなど、さまざまな課題とコンテストが掲載されています。その多くには素晴らしい賞が用意されていますが、挑戦すること自体を目的にしたものもあります。

メインとなるコンテストは、「プログラミングとデザインの究極のトーナメント」と呼ばれる毎年恒例の Topcoder Open (TCO) です。このトーナメントでは、アルゴリズム、開発、UI デザイン、品質保証などの幅広いコンテストが開催されます。コンテストはまずオンラインで数回行われ、受賞者はポイントを獲得できます。そしてそのポイントに応じて、さらに賞が用意されているほか、米国で開催される TCO 決勝にも招待されます。TCO では、さらに多くの人々がコンテストに参加できるように小規模な地域イベントも開催されます。地域イベントは 1 ~ 2 日間と短期間ですが、参加しやすいように多くの国で開催されています。

まずは Tableau Public で無料アカウントを作成し、「リソース」ページに掲載されているデータセットをどれでも使って、データビジュアライゼーションの作成に挑戦してみましょう。

役立つヒント: 練習の場を探している場合は、Makeover Monday (英語) にチャレンジしてみましょう! 毎週日曜日に新しいデータセットが投稿され、世界中の参加者がデータビジュアライゼーションを作成した後、同じ週の水曜日にウェビナーでディスカッションが行われます。

ブログの更新情報を受け取る