7 competizioni per data scientist e analisti

Misura le tue capacità con le competizioni sulla visualizzazione dei dati, che spaziano dalla scienza dei dati alla creazione di viz, ma non solo.

I concorsi sui dati hanno tante funzioni. Sono molto utili perché puoi imparare le best practice, ottenere un feedback sul tuo lavoro e migliorare le tue competenze. Al tempo stesso ti offrono l'opportunità di fare brainstorming con chi partecipa per trovare le soluzioni ai problemi.

In ogni caso, rappresentano un modo per spingersi oltre e stimolare la creatività delle menti più brillanti in una vasta gamma di settori legati ai dati.

Di seguito troverai una serie di competizioni sui dati in cui puoi cimentarti, dalla visualizzazione dati alla data science, passando per altri temi trasversali.

Iron Viz

Sito web: tableau.com/it-it/iron-viz
Organizzato da: Tableau

Ogni anno, Tableau Public ospita varie competizioni di visualizzazione dati in vista della sfida finale, l'Iron Viz. Durante tutto l'anno si tengono gironi di qualificazione virtuali per mettere in risalto le abilità di visualizzazione dati in base a un tema specifico. I vincitori dei singoli gironi si ritroveranno dal vivo per la resa dei conti all'Iron Viz, di fronte a un pubblico di 17.000 persone in occasione della Tableau Conference o Tableau Conference Europe: qui i primi tre classificati si sfideranno nella creazione di una visualizzazione partendo dallo stesso set di dati.

Le viz proposte vengono giudicate secondo vari criteri: progettazione generale, qualità della narrazione, profondità di analisi e risultati. Non importa se non vinci: già solo partecipando hai l'occasione di addentrarti nel mondo dell'analisi e ottenere un feedback da colleghi ed esperti del settore.

Competizioni di Kaggle

Sito web: kaggle.com/competitions
Organizzate da: Kaggle

Sarebbe stato negligente da parte nostra escludere Kaggle da questo elenco. Kaggle è una delle piattaforme più note per le competizioni in materia di data science. Il sito esordì con concorsi sull'apprendimento automatico, che gli sono valsi la fama di cui gode adesso. Alle competizioni di Kaggle vengono presentate regolarmente migliaia di proposte, da partecipanti singoli o team, che gareggiano per premi redditizi.

L'obiettivo è creare il miglior algoritmo per risolvere problemi complessi. Le ricompense vanno dalla soddisfazione di aver trovato la soluzione a premi in denaro. Questi ultimi si aggirano, per la maggior parte, sull'ordine delle decine di migliaia di dollari, e per alcuni è stata addirittura superata la somma di 100.000 dollari. Il premio più alto finora è stato il primo posto dal valore di 1 milione di dollari per il team che fosse riuscito a battere il modello di benchmarking "Zestimate" di Zillow, azienda del settore immobiliare, nella stima del valore degli immobili. Oltre ai concorsi per diverse organizzazioni, Kaggle tiene anche un torneo annuale, il Data Science Bowl, che mira a migliorare la società attraverso la scienza.

Kantar Information is Beautiful Awards

Sito web: informationisbeautifulawards.com
Organizzati da: Information is Beautiful e Kantar

Se hai a che fare con le visualizzazioni dati, probabilmente conosci Information Is Beautiful, il sito di David McCandless che mostra come il visual design aiuta a trasmettere più informazioni. Il sito promuove inoltre il concorso a premi Information is Beautiful Awards per portare l'attenzione sulle visualizzazioni dati più avvincenti e creative.

Ogni anno vince chi ha dimostrato un'abilità eccellente nel trasformare i dati in arte, giudicando in particolare come sono disposti i dati e come sono messe in evidenza le informazioni per cogliere nuovi spunti sul tema trattato. Il concorso si chiude con la cerimonia di premiazione. Sul sito web è disponibile l'elenco completo dei partecipanti, mentre alla cerimonia di premiazione che si tiene a fine anno accedono solo i favoriti. Alla cerimonia del 2018, le proposte selezionate sono state immortalate nei biscotti della festa.

Che il premio sia la gloria sui biscotti o migliaia di dollari, nelle competizioni sui dati spiccano gli analisti più brillanti. Anche se per ora sei un pesce piccolo, questi concorsi sono ideali per affinare la tua tecnica, a qualunque livello di esperienza.

Competizioni di Driven Data

Sito web: drivendata.org/competitions
Organizzate da: Driven Data

Come Kaggle, anche Driven Data organizza competizioni di data science per risolvere in crowdsourcing problemi predittivi difficili. L'obiettivo è trovare una risposta a sfide sociali urgenti della nostra epoca creando modelli statistici che favoriscano le previsioni. Pur non essendo vaste come quelle di Kaggle, le competizioni di Driven Data sono incentrate sulla ricerca di soluzioni che abbiano un effetto tangibile sul nostro mondo, a vantaggio delle persone e della natura. Vari concorsi di profilo più alto hanno visto il coinvolgimento di enti esterni come l'AARP Foundation, che ha sponsorizzato la competizione per prevedere la sicurezza fisica degli anziani, e come The Nature Conservancy insieme al Gulf of Maine Research Institute, che hanno collaborato per favorire pratiche ittiche sostenibili usando riprese video per misurare e contare i pesci.

Le proposte vengono giudicate in base alla capacità di prevedere dati per risolvere il problema, confrontandoli con i valori effettivi dei dati correnti usati come benchmark. I modelli vincenti vengono quindi adottati dall'ente organizzatore per migliorare ancora di più gli obiettivi. Alcune competizioni prevedono solo un riconoscimento del merito, altre premi in denaro; comunque sia, tutte hanno un impatto sul nostro mondo.

Community CrowdANALYTIX

Sito web: crowdanalytix.com/community
Organizzata da: CrowdANALYTIX

Anche CrowdANALYTIX presenta competizioni di modellazione dei dati, spaziando dall'apprendimento automatico all'intelligenza artificiale, dal deep learning fino all'elaborazione del linguaggio naturale. Si tratta di concorsi più informali, ma non meno gratificanti. Come molte delle competizioni elencate, alcune hanno un fine puramente formativo, altre invece prevedono una serie di premi.

La piattaforma si basa su due livelli: da un lato quello automatico dei bot, dall'altro quello umano dei data scientist che creano bot e algoritmi. Questi concorsi deviano un po' dagli altri, in quanto sono considerati piuttosto come un work in progress per la ripetizione coerente. Gli algoritmi vincenti vengono inseriti nel database di CrowdANALYTIX e monitorati per perfezionarli ulteriormente. Quando l'algoritmo inizia a diventare obsoleto, passa di nuovo in mano alla community per essere corretto o ricompilato.

Competizioni di Coda Lab

Sito web: competitions.codalab.org
Organizzate da: Coda Lab

Coda Lab è una piattaforma open source per la ricerca computazionale. I concorsi vengono organizzati a fini di ricerca e testing del codice in collaborazione. Anche se non offrono premi prestigiosi, il loro obiettivo è lavorare insieme per creare codici più efficienti e riproducibili. Coda Lab promuove in particolare la programmazione e la codifica dei dati e può essere un buon modo per prendere parte a sfide e progetti svolti in collaborazione.

Topcoder Open

Sito web: tco19.topcoder.com
Organizzato da: Topcoder

Come Coda Lab, anche Topcoder è orientato alla ricerca e al testing del codice in collaborazione. Sul sito principale è disponibile un'ampia gamma di competizioni e concorsi, che spaziano dalla data science alla codifica fino al web design. Molti di questi prevedono premi adeguati, mentre alcuni sono solo una sfida fine a sé stessa.

La competizione principale è il Topcoder Open (TCO), che si tiene ogni anno ed è definita "il massimo torneo di programmazione e design". Comprende vari concorsi su algoritmi, sviluppo, UI design e controllo qualità. I gironi iniziali si svolgono online e il punteggio ottenuto dai vincitori è associato a premi aggiuntivi e al viaggio per le finali TCO negli Stati Uniti. Ci sono anche eventi locali più piccoli per consentire a quante più persone di partecipare. Questi eventi durano uno o due giorni e offrono più possibilità di essere coinvolti a livello internazionale.

Per iniziare, crea un account gratuito su Tableau Public e usa uno dei set di dati pubblicati nella pagina Risorse per cimentarti nella creazione di una visualizzazione dati.

Suggerimento: Hai bisogno di esercitarti? Partecipa al Makeover Monday! Ogni domenica viene pubblicato un nuovo set di dati e utenti da tutto il mondo creano visualizzazioni dati che vengono poi discusse nel webinar del mercoledì successivo.