面向数据科学家和分析师的 7 项数据竞赛

数据竞赛有许多功用。它们是学习最佳做法、收集作品反馈和提高技能的好途径。通过数据竞赛,还可以为解决问题集思广益,起到头脑风暴的作用。

无论其功用是什么,数据竞赛都会让您有机会突破极限,鼓励各种数据相关领域的精英人才进行创新。

您可以在以下列出的一系列数据竞赛中一试身手;从数据可视化到数据科学,这些竞赛涵盖了各种各样的主题。

Iron Viz

网站:Tableau.com/zh-cn/iron-viz
主办方:Tableau

每年,Tableau Public 都会举办几场数据可视化比赛,为终极可视化挑战 Iron Viz 造势。虚拟“资格赛”会在全年持续举办,每场比赛都通过一个特定的主题来展现数据可视化技能。每场比赛的获胜者将在 Tableau 全球用户大会或 Tableau 全球用户大会欧洲会议上,面对 17000 名观众现场展开 Iron Viz 最终角逐,三位预赛获胜者相互竞争,使用相同的数据集创建数据可视化。

Viz 参赛作品的评判基于几个标准:可视化的总体设计、可视化和数据的故事讲述效果,以及对数据和结果的分析深度。即使未能获胜,您也可以通过 Iron Viz 竞赛涉足分析领域,并从该领域的同行和专家获得反馈。

Kaggle 竞赛

网站:kaggle.com/competitions
主办方:Kaggle

如果数据竞赛清单中没有包含 Kaggle,我们就会有失职之嫌。Kaggle 是最知名的数据科学竞赛举办平台之一。该网站最初举办的是机器学习竞赛,并通过这类竞赛确立了自己的知名度。Kaggle 竞赛奖励丰厚,常常吸引成千上万的参赛者,包括团队和个人。

这些竞赛会提出复杂的问题,让参赛者努力创造解决问题的最佳算法。参赛者可以学到知识、赢取礼包,甚至得到奖金。大多数竞赛的奖金为数万美元,但某些竞赛的奖金曾超过 10 万美元。到目前为止,最高的单笔奖金是 1 百万美元,任何团队只要能战胜房地产公司 Zillow 用于预测房产价值的“Zestimate”基准模型,就可以获得这笔奖金。除了为各种组织举办竞赛之外,Kaggle 还举办一年一度的数据科学碗比赛,旨在通过科学实现社会进步。

Kantar Information is Beautiful 奖

网站:informationisbeautifulawards.com
主办方:Information is Beautiful and Kantar

只要接触过数据可视化,您就很可能知道 David McCandless 的网站 Information Is Beautiful,这个网站展示了可视化设计如何促进信息的传递。在此基础上,该网站还颁发 Information is Beautiful 奖,让人们关注那些质量最高、最有创意的数据可视化。

他们每年都会为那些将数据转化为精美可视化的创作者颁奖 — 评判标准包括数据的组织是否合理、是否突出显示了相关信息,以及是否呈现了相关主题的见解。比赛在 Information is Beautiful 颁奖典礼上达到高潮。获得入围资格的参赛者会出席现场活动,而进入决赛名单的参赛者将参加年末举行的颁奖典礼。在 2018 年的颁奖典礼上,晋级决赛的选手发现他们的可视化跃然出现在宴会提供的饼干上

从饼干留名到数千美元的奖金,数据竞赛让水平最高、最有才华的参赛者大放异彩。即便您一开始并没有那样的雄心壮志,数据竞赛也非常有助于磨练各个层次的专业技能。

Driven Data 竞赛

网站:drivendata.org/competitions
主办方:Driven Data

与 Kaggle 非常相似,Driven Data 同样通过主办数据科学竞赛,鼓励公众探索如何解决复杂的预测问题。他们通过建立统计模型来帮助预测,以此针对全世界的紧迫社会问题寻求解决之道。虽然竞赛规模不及 Kaggle,但 Driven Data 专注于解决对我们的世界有实际影响的问题,有利于人类和自然。一些知名度较高的竞赛包括 AARP 基金会赞助的预测老年人人身安全的竞赛,以及通过美国自然保护协会和缅因海湾研究所举办的一项竞赛,该竞赛旨在通过对视频片段中的鱼进行测量和统计来帮助实现可持续渔业。

参赛作品的评判标准是它们能否参照当前数据的真实值来有效预测数据,以便解决问题。随后,主办机构会整合胜出的模型,以便更好地实现其目标。某些赛事为您提供炫耀资本,一些赛事为您提供经济奖励,但所有的赛事都会确保它们能够积极影响这个世界。

CrowdANALYTIX 社区

网站:crowdanalytix.com/community
主办方:CrowdANALYTIX

CrowdANALYTIX 还举办数据建模竞赛,深入探索机器学习、人工智能、深度学习以及自然语言处理。这些挑战赛不像其他赛事一样正式,但参与者获得的回报却毫不逊色。像这里列出的许多其他赛事一样,一些竞赛着眼于学习,另一些则提供各种奖励。

该平台包括两个“层”:一是由机器人组成的机器层;二是由构建这些机器人及算法的数据科学家组成的人类层。在这里,数据竞赛略有转变,更多地被视为正在进行的工作,以便实现一致的迭代。 获胜的算法将移至 CrowdANALYTIX 的数据库,在那里受到监控并根据监控结果进行微调。如果算法出现性能降级,则会被移回社区并在社区进行调整或重建。

Coda Lab 竞赛

网站:competitions.codalab.org
主办方:Coda Lab

Coda Lab 是计算研究的开源平台。这项赛事的举办目的是促进协作性研究和代码测试。虽然它们没有提供声名显赫的奖品,但它们能够共同创造出更加高效并且可以重复的代码。Coda Lab 非常重视数据的编程和代码构建,对于希望涉足协作式项目和挑战的人,这无疑是一个不错的途径。

Topcoder Open

网站:tco19.topcoder.com
主办方:Topcoder

Topcoder 与 Coda Lab 类似,也通过协作来编译代码测试和研究。他们在主网站上发布了众多的挑战和竞赛,涵盖各种主题,例如数据科学、编码和 Web 设计。其中很多挑战提供了不错的奖励,还有一些则单纯以挑战为目的。

最有吸引力的是一年一度的 Topcoder Open,即“终极编程和设计锦标赛”。其中包含一系列竞赛,如算法、开发、UI 设计和质量保证。初赛为在线比赛,获胜者可以使用在比赛中赢得的积分来获得其他奖励,还有机会参加在美国举办的 TCO 决赛。TCO 还举办较小的地区性活动,让更多的人可以接触这项竞赛。这些活动的持续时间只有一两天,但它们在世界各地提供了更多参与机会。

首先在 Tableau Public 上创建免费帐户,然后使用资源页面上发布的某个数据集来尝试创建数据可视化。

热门提示:需要练习吗?不妨试试 Makeover Monday!每个星期天,我们会发布一个新的数据集,来自世界各地的参与者在此基础上创建数据可视化,然后我们在周三的网络研讨会上讨论这些可视化。

订阅我们的博客