Los datos están en todas partes. Probablemente ya lo sabías, ya que es difícil pasarlos por alto dado que están constantemente en las noticias, son un campo profesional en crecimiento y las habilidades de datos son cada vez más valiosas en todos los mercados laborales. Sin embargo, los datos no sólo son para las grandes empresas y no tienes que recopilar tus propios datos para analizarlos. ¡Existen miles de conjuntos de datos públicos por todas partes!

Si estás buscando aprender a analizar datos, crear visualizaciones de datos o simplemente mejorar tus habilidades de alfabetización de datos, los conjuntos de datos públicos son un lugar perfecto para comenzar. Aquí te presentamos algunos excelentes conjuntos de datos públicos que puedes analizar gratis ahora mismo. Si necesitas ayuda para darle forma a tus hallazgos, también tenemos artículos sobre blogs de visualización de datos y los mejores ejemplos de visualización de datos para que te inspires.

1. Google Trends

Seleccionado por: Google
Ejemplo de conjunto de datos: Resultados de la búsqueda de "Cupcake”

Éste es uno de los conjuntos de datos públicos más amplios e interesantes para analizar. El vasto motor de búsqueda de Google rastrea los datos de términos de búsqueda para mostrarnos qué buscan las personas y cuándo. Puedes explorar estadísticas sobre el volumen de búsqueda para casi cualquier término de búsqueda desde 2004. Ingresa cualquier término de búsqueda, o un puñado de términos de búsqueda, y haz clic en el botón de descarga para analizar los datos fuera del sitio web de tendencias.

Existe una gran variedad de filtros para reducir las tendencias según la ubicación (en todo el mundo o por país), varios rangos de tiempo, categorías o incluso tipos de búsqueda específicos (resultados de búsqueda web vs imagen vs YouTube). Puedes ver fácilmente qué temas son populares en este momento y cuáles son las tendencias actuales en la página de inicio de Trends. Google también destaca varios ejemplos interesantes de tendencias con datos visuales en esa página de inicio.

Si estás interesado en obtener más datos de Google, consulta Google Finance, Google Public Data y Google Scholar.

2. National Climatic Data Center

Seleccionado por: Centros nacionales de información ambiental (antes NOAA)
Ejemplo de conjunto de datos: Datos climáticos locales (LCD)

Si lo que te interesa es el clima y la ciencia climática es difícil encontrar más detalles que en el National Climatic Data Center (Centro Nacional de Datos Climáticos). Han hecho un pequeño cambio de marca, fusionando los centros de datos de la Administración Nacional Oceánica y Atmosférica (NOAA) para convertirse en los Centros Nacionales de Información Ambiental (NCEI).

Aquí puedes encontrar un archivo de conjuntos de datos climáticos en los EE. UU., el archivo de datos ambientales más grande del mundo. Es un recurso enorme para todo tipo de datos sobre el clima, incluidos datos meteorológicos, oceánicos, climáticos, atmosféricos y geofísicos.

3. Datos del Observatorio Mundial de la Salud

Seleccionado por: Organización Mundial de la Salud (OMS)
Ejemplo de conjunto de datos: Acceso universal a la salud reproductiva

Como parte de su objetivo central para lograr una mejor información de salud en todo el mundo, la Organización Mundial de la Salud hace públicos sus datos sobre la salud mundial a través del Observatorio Mundial de la Salud (GHO). El GHO actúa como un portal para acceder y analizar situaciones y temas importantes sobre la salud.

Los diversos conjuntos de datos se organizan según temas, como mortalidad, sistemas de salud, enfermedades transmisibles y no transmisibles, medicamentos y vacunas, riesgos para la salud, etc. Las estadísticas de salud de la OMS son una fuente de información de salud global y también se utilizan en el trabajo de los Centros para el Control y la Prevención de Enfermedades de los EE. UU.

4. Data.gov.sg

Seleccionado por: Gobierno de Singapur
Ejemplo de conjunto de datos: Residentes de Singapur por grupo de edad, grupo étnico y género, fines de junio, anual (2017)

En realidad, existen muchos sitios web de datos gubernamentales excelentes en Internet. La mayoría de ellos son increíblemente ricos en datos e información. Los Estados Unidos tienen uno de los más conocidos en data.gov, y el Reino Unido y Australia también tienen excelentes sitios similares. Con todos ellos, y con grandes muestras de población, tenemos muchos datos a los que podemos acceder. Entonces, ¿por qué Singapur?

Francamente, el sitio web de datos del gobierno de Singapur es muy accesible visualmente. La página de inicio está llena de pequeñas visualizaciones que cuentan historias sobre cada conjunto de datos. Parte de la visualización de datos es asegura que no sólo muestres la información en un formato preciso y relevante, sino que también atraigas el interés. La mayoría de los sitios de datos del gobierno son utilitarios y simples, lo suficiente como para transmitir los datos de una manera fácil de entender. Sin embargo, Singapur lleva esto un paso más allá con visualizaciones coloridas, toques de color en los gráficos y una sección de "conjuntos de datos similares" en la parte inferior de cada conjunto de datos para alentar a los lectores a explorar.

5. Earthdata

Seleccionado por: NASA
Ejemplo de conjunto de datos: Electricidad atmosférica (relámpagos)

Earthdata es parte del Programa de Sistemas de Datos de Ciencias de la Tierra de la NASA, específicamente el Sistema de Datos e Información del Sistema de Observación de la Tierra (EOSDIS). EOSDIS actúa como un medio para procesar y distribuir datos de ciencias de la Tierra desde satélites de observación de la Tierra, aeronaves y mediciones de campo.

A través de Earthdata, el público puede acceder a los datos, noticias e información sobre eventos de la NASA. Cubre datos de la atmósfera de la Tierra, la radiación solar, la criosfera (áreas árticas/congeladas), el océano, la superficie terrestre (gravedad, geomagnetismo, tectónica) y los entornos humanos.

6. Registro de datos abiertos de Amazon Web Services

Seleccionado por: Amazon
Ejemplo de conjunto de datos: 1000 Genomes Project

A medida que más organizaciones ponen sus datos a disposición del público, Amazon ha creado un registro para buscar y compartir esos diversos conjuntos de datos. Hay más de 50 conjuntos de datos públicos admitidos a través del registro de Amazon, que van desde los archivos del IRS hasta las imágenes satelitales de la NASA, la secuenciación del ADN y el rastreo web. Los conjuntos de datos también incluyen ejemplos de uso, que muestran lo que otras organizaciones y grupos han hecho con los datos.

7. Pew Internet

Seleccionado por: Pew Research Center
Ejemplo de conjunto de datos: Adolescentes, redes sociales y tecnología 2018

La misión de Pew Research Center es recopilar y analizar datos de todo el mundo. Abarcan todo tipo de temas como política, redes sociales, periodismo, economía, privacidad en línea, religión y tendencias demográficas. Si bien realizan su propia investigación y análisis no partidista y no de abogacía, también ofrecen sus datos sin procesar para el acceso público. El acceso simplemente requiere un breve registro en el sitio y un crédito para Pew Research Center como la fuente de los datos, con la exención de que Pew no es responsable de las conclusiones alternativas a partir de los datos.

En cierto modo, hacer que los datos sean accesibles también es otro proyecto de investigación para Pew. Ya tienen toda la información sobre cómo usan los datos en su investigación y están interesados en saber cómo otros también usan sus datos. Tienen sólo una petición: contactarlos por correo electrónico si algo se publica como resultado de los datos adquiridos.