7 competiciones de datos para analistas y científicos de datos

Las competiciones de datos cumplen diversas funciones. Son una excelente manera de aprender prácticas recomendadas, recopilar comentarios sobre el trabajo que realizó y desarrollar sus habilidades. También pueden servir como espacios de reflexión para otorgar soluciones a problemas a través del crowdsourcing.

Cualquiera que sea su función, las competiciones de datos brindan la oportunidad de ampliar las capacidades y promover la creatividad de los usuarios más talentosos y brillantes en una variedad de campos relacionados con los datos.

A continuación, presentamos una serie de competiciones de datos en las que puede participar, que abarcan desde la visualización de datos hasta la ciencia de datos, y más.

Iron Viz

Sitio web: https://www.tableau.com/es-es/iron-viz
Hospedado por: Tableau

Todos los años, Tableau Public realiza varios concursos de visualización de datos que culminan con el reto de visualización definitivo: Iron Viz. Las rondas eliminatorias virtuales, en las que se califica a los participantes, se llevan a cabo durante todo el año y destacan las habilidades de visualización de datos en relación con temas específicos. El ganador de cada concurso participa en una competición de Iron Viz en tiempo real frente a una audiencia de 17 000 personas, en la Conferencia de Tableau o la Conferencia de Tableau Europa. Los tres ganadores compiten entre sí en la creación de una visualización de datos utilizando el mismo conjunto de datos.

Las visualizaciones se juzgan según diversos criterios: su diseño general, si la visualización y los datos transmiten la historia de manera eficaz, y la profundidad del análisis de datos y los resultados. Aunque no gane, los concursos de Iron Viz son una excelente manera de iniciarse en el mundo del análisis y recibir comentarios de colegas y expertos en el campo.

Competiciones de Kaggle

Sitio web: kaggle.com/competitions
Hospedado por: Kaggle

Kaggle no puede faltar en ninguna lista de competiciones de datos. Se trata de una de las plataformas más conocidas para la realización de competiciones en ciencia de datos. Al principio, el sitio organizaba competiciones de aprendizaje automático, con las que obtuvo la relevancia que tiene hoy. Las competiciones de Kaggle atraen constantemente a miles de participantes, tanto en equipos como individuales, que compiten por premios importantes.

En las competiciones se plantean problemas complejos, por lo que los participantes tienen que esforzarse para crear el mejor algoritmo posible que permita resolver el problema en cuestión. Entre las recompensas que puede recibir el ganador se encuentran la satisfacción de contar con el conocimiento necesario, obsequios y una compensación económica. La mayoría de las competiciones con premios económicos ofrecen sumas de decenas de miles de dólares, pero algunas han superado los USD 100 000. El premio más significativo hasta ahora fue de 1 millón de dólares para el equipo que pudiera diseñar un modelo para la predicción de valores de viviendas que superara al modelo “Zestimate” de Zillow, una empresa del sector inmobiliario. Además de organizar competiciones para diversas organizaciones, Kaggle también desarrolla la competición anual conocida como Data Science Bowl, cuyo objetivo es mejorar la sociedad a través de la ciencia.

Information is Beautiful Awards de Kantar

Sitio web: informationisbeautifulawards.com
Hospedado por: Information is Beautiful y Kantar

Si le interesa la visualización de datos, probablemente conozca Information Is Beautiful (La información es hermosa). Se trata del sitio de David McCandless, en el que se muestra cómo el diseño visual mejora la transferencia de información. El fundador del sitio también creó los Information is Beautiful Awards (Premios La información es hermosa), con el objetivo de centrar la atención en las visualizaciones de datos más eficaces y creativas.

Todos los años, se entregan premios a los usuarios que se destacan por convertir datos en arte. Para elegir a los ganadores, se juzga la disposición de los datos, la eficacia con que se resalta la información y la claridad que se aporta al tema representado. El concurso finaliza con la ceremonia de entrega de premios de Information is Beautiful. Todos los participantes se mencionan en el sitio y los preseleccionados asisten a la ceremonia de entrega de premios, que tiene lugar a finales de año. En la ceremonia de 2018, los asistentes tuvieron la grata sorpresa de encontrar sus visualizaciones representadas en unas deliciosas galletas.

Más allá de los premios que ofrezcan, estas competiciones permiten brindar una mayor visibilidad a las representaciones más destacadas. Aunque empiece con pocas aspiraciones, las competiciones de datos son una excelente manera de inspirarse para perfeccionar su arte, cualquiera sea su nivel de conocimientos.

Competiciones de Driven Data

Sitio web: drivendata.org/competitions
Hospedado por: Driven Data

De manera similar a Kaggle, Driven Data organiza competiciones en ciencia de datos con el fin de hallar soluciones a través del crowdsourcing para problemas complejos que pueden predecirse. El objetivo de esta organización es enfrentar desafíos apremiantes de la sociedad mediante la creación de modelos estadísticos que ayuden a mejorar las predicciones. Si bien las competiciones no son tan convocantes como las de Kaggle, Driven Data se centra en resolver problemas que tienen un impacto tangible en el mundo e intenta beneficiar tanto al ser humano como a la naturaleza. Varias de las competiciones de la entidad tuvieron un alto perfil. Una de ellas, que contó con el patrocinio de la AARP Foundation, planteó el desafío de predecir la seguridad física de adultos mayores. Otra de las competiciones contó con el apoyo de The Nature Conservancy y el Gulf of Maine Research Institute para colaborar con la pesca sostenible en la medición y el conteo de pescado a partir de secuencias de video.

Las participaciones se juzgan según su eficacia para predecir datos y resolver el problema en cuestión tomando como referencia valores reales de datos actuales. Al finalizar cada competición, la entidad que organiza el concurso incorpora los modelos ganadores como ayuda para alcanzar sus objetivos. Algunas de las competiciones otorgan prestigio y otras ofrecen premios económicos, pero todas garantizan que tendrán un impacto en el mundo.

Comunidad de CrowdANALYTIX

Sitio web: crowdanalytix.com/community
Hospedado por: CrowdANALYTIX

CrowdANALYTIX también organiza competiciones de modelado de datos que invitan a recorrer en profundidad temas como el aprendizaje automático, la inteligencia artificial, el aprendizaje profundo y el procesamiento del lenguaje natural. Si bien estos desafíos son más informales, también ofrecen suculentas recompensas. Al igual que muchas de las demás competiciones mencionadas en este artículo, algunas se organizan para fines de aprendizaje y otras incluyen un fondo de premios.

La plataforma comprende dos niveles: por un lado, los bots y, por otro, los científicos de datos, quienes crean los bots y algoritmos. En este caso, las competiciones de datos se diferencian en que funcionan más bien como un trabajo en curso en pos de una iteración constante. Los algoritmos ganadores se trasladan a la base de datos de CrowdANALYTIX y, luego, se supervisan y se ajustan. Si un algoritmo comienza a deteriorarse, se envía nuevamente a la comunidad para su ajuste o reconstrucción.

Competiciones de Coda Lab

Sitio web: competitions.codalab.org
Hospedado por: Coda Lab

Coda Lab es una plataforma de código abierto que se utiliza para la investigación informática. Desarrolla competiciones con fines de investigación colaborativa y pruebas de código. Si bien estas no ofrecen premios prestigiosos, proponen un trabajo conjunto para la creación de código más eficaz y reproducible. Coda Lab hace hincapié en la programación y creación de código de datos y proporciona una excelente manera de involucrarse en proyectos y desafíos de colaboración.

Topcoder Open

Sitio web: tco19.topcoder.com
Hospedado por: Topcoder

Topcoder es similar a Coda Lab en que también supone un esfuerzo colaborativo con el fin de compilar investigaciones y pruebas de código. En su sitio principal, la empresa ofrece una amplia variedad de desafíos y competiciones en áreas diversas, como la ciencia de datos, la programación y el diseño web. En muchos casos ofrece premios interesantes, aunque en otros simplemente propone enfrentar un desafío.

El evento principal es el Topcoder Open anual, el “torneo de programación y diseño definitivo”. Este incluye una serie de competiciones relacionadas con la creación de algoritmos, desarrollo, diseño de IU y control de calidad. Las competiciones iniciales se desarrollan en línea y los ganadores obtienen puntos que pueden canjear por premios adicionales y un viaje a la final del TCO en Estados Unidos. El TCO también desarrolla eventos regionales de menor tamaño que permiten que más personas se acerquen a la competición. Son eventos de solo uno o dos días de duración, pero que ofrecen más oportunidades de participar a nivel internacional.

Para comenzar, cree una cuenta gratuita en Tableau Public y use uno de los conjuntos de datos publicados en la página Recursos para intentar crear su propia visualización de datos.

Consejo útil: ¿necesita practicar? Participe en el Makeover Monday. Todos los domingos se publica un nuevo conjunto de datos que utilizan usuarios de todo el mundo para crear visualizaciones. El miércoles siguiente, se debate acerca de los trabajos realizados en un seminario web.

Suscribirse a nuestro blog