7 Datenwettbewerbe für Data Scientists und Analysten

Datenwettbewerbe können vielfältig genutzt werden. Sie sind eine hervorragende Möglichkeit, sich Best Practices anzueignen, sie geben ein Feedback zu Ihrer Arbeit und erweitern Ihre Kenntnisse. Datenwettbewerbe können auch als eine Art Brainstorming durch Crowdsourcing von Lösungen für Probleme genutzt werden.

Unabhängig von ihrer Anwendung sind Datenwettbewerbe eine gute Gelegenheit, den bisherigen Rahmen zu erweitern und die Kreativität der Spitzenkräfte in einer Vielzahl von datenrelevanten Gebieten zu fördern.

Im Folgenden ist eine Reihe von Datenwettbewerben aufgeführt, an denen Sie teilnehmen können. Die Themen reichen von der Datenvisualisierung bis zur Data Science und zu allem, was im weitesten Sinn dazugehört.

Iron Viz

Website: tableau.com/de-de/iron-viz
Gehostet von: Tableau

Jedes Jahr werden auf Tableau Public verschiedene Datenvisualisierungswettbewerbe veranstaltet, die die ultimative Herausforderung in Sachen Visualisierung darstellen. Sie sind bekannt als „Iron Viz“. Übers Jahr verteilt werden virtuelle „Qualifizierungswettbewerbe“ durchgeführt, mit denen sich die Kenntnisse in der Datenvisualisierung im Rahmen eines bestimmten Themas prüfen lassen. Die Sieger dieser Wettbewerbe messen sich dann live in einem Iron Viz-Endkampf vor 17.000 Zuschauern auf der Tableau Conference oder Tableau Conference Europe. Dabei treten die drei Gewinner gegeneinander an und erstellen eine Datenvisualisierung auf der Basis eines bestimmten Datenbestands.

Die Visualisierungsbeiträge werden nach verschiedenen Kriterien bewertet. Dazu gehört das gesamte Design der Visualisierung, wie überzeugend die Visualisierung und die Daten die Story erzählen und wie tiefgehend die Datenanalyse und die Ergebnisse sind. Auch wenn Sie am Ende nicht ganz oben stehen, sind Visualisierungswettbewerbe immer eine gute Möglichkeit, in die Welt der Analytics einzutauchen und wertvolles Feedback von anderen Benutzern und Experten zu bekommen.

Kaggle-Wettbewerbe

Website: kaggle.com/competitions
Gehostet von: Kaggle

Die Aufnahme von Kaggle in die Liste der Datenwettbewerbe war ein Muss. Kaggle ist eine der bekanntesten Plattformen zur Veranstaltung von Wettbewerben im Bereich Data Science. Die Website startete mit Wettbewerben zum Machine Learning, die auch zu ihrer jetzigen Popularität beitragen haben. Bei Kaggle-Wettbewerben werden in der Regel Tausende von Beiträgen eingereicht. Sowohl Einzelpersonen als auch komplette Teams konkurrieren dabei um lukrative Preise.

Die Wettbewerbe stellen komplexe Probleme als Aufgabe, für die die Teilnehmer den besten Lösungsalgorithmus entwickeln müssen. Die Würdigung der Ergebnisse reicht dabei von der Anerkennung des Know-hows über Sachpreise bis zu Geldbeträgen. Die Geldpreise bewegen sich dabei meist im fünfstelligen Bereich, einige haben sogar die Summe von 100.000 USD überschritten. Der bisher höchst dotierte Einzelpreis betrug 1 Million USD für das siegreiche Team, das in der Lage, war, das Benchmark-Modell „Zestimate“ der Immobilienfirma Zillow zur Prognose der Hauspreise zu übertreffen. Außer der Veranstaltung von Wettbewerben für verschiedene Unternehmen und Organisationen führt Kaggle auch jährlich den Wettbewerb Data Science Bowl durch, der sich der Verbesserung der Gesellschaft durch die Wissenschaft verschrieben hat.

„Information is Beautiful Awards“ von Kantar

Website: informationisbeautifulawards.com
Gehostet von: „Information is Beautiful“ und Kantar

Wenn Sie sich generell mit Datenvisualisierung beschäftigen, kennen Sie vielleicht bereits „Information Is Beautiful“, die Website von David McCandless. Hier wird gezeigt, wie visuelles Design die Vermittlung von Informationen erweitern kann. Auf dieser Website werden auch die „Information is Beautiful Awards“ veranstaltet, die die besten und kreativsten Datenvisualisierungen prämieren.

Die Auszeichnungen werden einmal im Jahr an Teilnehmer vergeben, die auf herausragende Weise Daten in eine Art Kunstwerk verwandeln. Dabei wird beurteilt, wie gut die Daten angeordnet sind und wie verständlich die Informationen und Erkenntnisse zum Thema vermittelt werden. Höhepunkt der Veranstaltung ist die Preisverleihung für den „Information is Beautiful“-Wettbewerb. Der gesamte Teilnehmerkreis wird auf der Website aufgeführt, während die Teilnehmer, die in die engere Auswahl gekommen sind, zur Preisverleihung am Ende des Jahres eingeladen werden. Bei der Preisverleihung 2018 wurden die Visualisierungen der engeren Auswahl in Cookies der Veranstaltung verewigt.

Mit Cookie-Namen bis zu Tausenden von Dollar werden die besten und herausragendsten Leistungen in den Datenwettbewerben gewürdigt. Auch mit anfangs kleineren Beiträgen sind Datenwettbewerbe eine gute Möglichkeit, die eigenen Fähigkeiten für jeden Kenntnisstand zu verfeinern.

Wettbewerbe von Driven Data

Website: drivendata.org/competitions
Gehostet von: Driven Data

Wie Kaggle veranstaltet auch Driven Data Wettbewerbe in Data Science für ein Crowdsourcing von Lösungen komplexer Prognoseprobleme. Dabei geht es um die Lösung drängender sozialer Herausforderungen in unserer Welt durch das Erstellen statistischer Modelle für Prognosen. Die Wettbewerbe sind zwar nicht so umfangreich wie bei Kaggle. Driven Data stellt aber die Lösung von Problemen in den Mittelpunkt, die spürbare Auswirkungen auf unsere Welt von heute haben und von deren Lösung Mensch wie Natur profitieren. Verschiedene Wettbewerbe mit Themen hoher gesellschaftlicher Bedeutung haben die AARP Foundation veranlasst, einen Wettbewerb zur Prognose der körperlichen Unversehrtheit von Senioren per Sponsoring zu unterstützen sowie einen Wettbewerb des Nature Conservancy and Gulf of Maine Research Institute zur Förderung einer nachhaltigen Fischereiwirtschaft durch Messung und Zählung der Fischbestände mithilfe von Videoaufnahmen.

Die Bewertung der Beiträge erfolgt nach der Qualität der prognostizierten Daten zur Lösung des Problems im Vergleich zu den tatsächlichen aktuellen Daten. Die siegreichen Modelle werden dann der veranstaltenden Organisation übergeben, die damit versuchen kann, ihre Ziele zu optimieren. Einige Wettbewerbe bieten die Möglichkeit, die Ergebnisse als Referenz zu verwenden, andere vergeben Geldpreise. Bei allen ist aber sichergestellt, dass sie Eingang in die Praxis finden.

CrowdANALYTIX-Community

Website: crowdanalytix.com/community
Gehostet von: CrowdANALYTIX

CrowdANALYTIX veranstaltet ebenfalls Wettbewerbe der Datenmodellierung speziell zu den Themen Machine Learning, künstliche Intelligenz, intensives Lernen und Verarbeitung der natürlichen Sprache. Diese Wettbewerbe sind mehr informeller Natur, aber nichtsdestotrotz lohnenswert. Wie viele andere hier aufgeführte Wettbewerbe dienen einige CrowdANALYTIX-Wettbewerbe ausschließlich Lernzwecken, für andere werden Preise vergeben.

Die Plattform besteht aus zwei „Ebenen“: einer Maschinenebene aus Bots und einer menschlichen Ebene von Data Scientists, die diese Bots und Algorithmen erstellen. Bei CrowdANALYTIX sind die Datenwettbewerbe von etwas anderer Art. Sie gelten mehr als „Work in Progress“ für eine konsistente Weiterentwicklung. Die siegreichen Algorithmen werden in die CrowdANALYTIX-Datenbank übernommen und zur Optimierung weiter geprüft. Wenn die Leistung des Algorithmus abnimmt, wird die Community um Anpassung oder Neuerstellung gebeten.

Wettbewerbe von Coda Lab

Website: competitions.codalab.org
Gehostet von: Coda Lab

Coda Lab ist eine Open-Source-Plattform für computergestützte Forschung. Die Wettbewerbe werden zur Förderung der Forschungszusammenarbeit und für Codetest veranstaltet. Hier kann man keine prestigeträchtigen Preise gewinnen. Im Mittelpunkt steht die Unterstützung der Zusammenarbeit zur Erstellung von effizientem und reproduktionsfähigem Programmcode. Bei Coda Lab geht es vor allem um die Programmierung und das Erstellen von Datencode. Die Wettbewerbe bieten eine gute Möglichkeit, sich mit gemeinsamen Projekten und den damit verbundenen Herausforderungen vertraut zu machen.

Topcoder Open

Website: tco19.topcoder.com
Gehostet von: Topcoder

Topcoder ist mit Coda Lab insofern vergleichbar, als es dabei auch um die gemeinsame Durchführung von Codetests und Forschungstätigkeit geht. Auf der zentralen Website wird eine breite Palette von Aufgabenstellungen und Wettbewerben angeboten. Die Themen reichen von Data Science über Programmierung bis zum Webdesign. Bei vielen dieser Wettbewerbe werden interessante Preise vergeben, bei anderen geht es einfach um die Bewältigung einer herausfordernden Aufgabe.

Hauptveranstaltung ist die jährliche Topcoder Open, der „ultimative Programmier- und Designwettkampf“. Dazu gehört eine Reihe von Wettbewerben zu den Themen Algorithmen, Entwicklung, UI-Design und Qualitätssicherung. Die anfänglichen Wettbewerbe werden online abgewickelt. Die Gewinner erhalten Punkte, die sich bis zum Anrecht auf zusätzliche Preise und einer Teilnahme an der TCO-Endrunde in den USA summieren können. Zur TCO gehören auch kleinere regionale Veranstaltungen, die noch mehr Menschen Gelegenheit bieten, am Wettbewerb teilzunehmen. Diese Veranstaltungen dauern zwar nur ein bis zwei Tage, eröffnen aber mehr internationale Möglichkeiten der Teilnahme.

Starten Sie mit dem Anlegen eines kostenlosen Kontos bei Tableau Public und nutzen Sie die auf der Seite Ressourcen aufgeführten Datenbestände zur Erstellung einer Datenvisualisierung.

Heißer Tipp: Sie interessieren sich für praktische Übungen? Testen Sie Makeover Monday! Jeden Sonntag wird dort ein neuer Datenbestand angeboten. Menschen weltweit erstellen dann Datenvisualisierungen, die im Rahmen eines Webinars am darauffolgenden Mittwoch besprochen werden.

Blog abonnieren