Fato: os dados estão em toda parte. Isso é algo que você provavelmente já sabia, afinal é difícil ignorar os dados quando eles estão o tempo todo nas notícias e são uma área de atuação profissional em constante crescimento (ter conhecimentos de dados é um diferencial cada vez maior no mercado de trabalho). Porém, os dados não são uma exclusividade de grandes empresas, e você não precisa coletar seus próprios dados para analisá-los. Existe uma infinidade de conjuntos de dados públicos à disposição!
Se você deseja aprender a analisar dados, criar visualizações ou simplesmente aprimorar seus conhecimentos de dados, os conjuntos de dados públicos são um excelente ponto de partida. Confira a seguir sete conjuntos de dados públicos que você pode analisar gratuitamente agora mesmo. Se você não souber como usar os dados que descobrir aqui e precisar de ajuda, também temos artigos sobre blogs de visualização de dados que você pode seguir e excelentes exemplos de visualizações de dados para se inspirar.
1. Google Trends
Compilado por: Google
Conjunto de dados de exemplo: Resultados de pesquisa do termo "cupcake"
Este é um dos mais amplos e interessantes conjuntos de dados públicos para analisar. O abrangente mecanismo de pesquisa do Google registra dados sobre os termos de pesquisa para revelar o que as pessoas estão pesquisando e quando. É possível explorar estatísticas sobre o volume de pesquisas de praticamente qualquer termo desde 2004. Digite um ou vários termos de pesquisa e clique no botão de download para analisar os dados fora do site do Google Trends.
Há diversos filtros para restringir as tendências por localização (em todo o mundo ou por país), diversos períodos, categorias ou até mesmo tipos de pesquisa específicos (resultados de pesquisas da Web, de imagens ou do YouTube). É fácil ver quais são os assuntos populares no momento e quais são as tendências atuais na página inicial do Google Trends. Nessa página inicial, o Google também destaca vários exemplos interessantes de tendências com elementos visuais.
Se você tem interesse em mais dados do Google, confira o Google Finance, o Google Public Data e o Google Acadêmico.
2. Centro Nacional de Dados Climáticos dos EUA
Compilado por: Centros Nacionais de Informações Ambientais dos EUA (antigo NOAA)
Conjunto de dados de exemplo: Dados climatológicos locais (LCD)
Se a ciência meteorológica e climática é a sua praia, o Centro Nacional de Dados Climáticos dos EUA é o lugar ideal para encontrar informações detalhadas sobre o assunto. A instituição passou por uma reestruturação de sua marca, unificando os data centers da Administração Oceânica e Atmosférica Nacional dos EUA (NOAA) para formar os Centros Nacionais de Informações Ambientais (NCEI).
Aqui você encontra um arquivo de conjuntos de dados climáticos e meteorológicos de todo o território dos EUA, o maior arquivo de dados ambientais do mundo. Trata-se de um imenso recurso com todo tipo de dados meteorológicos, incluindo dados oceânicos, climáticos, atmosféricos e geofísicos.
3. Dados do Observatório da Saúde Mundial
Compilado por: Organização Mundial da Saúde (OMS)
Conjunto de dados de exemplo: Acesso universal à saúde reprodutiva
Como parte de sua importante meta de garantir melhores informações de saúde em todo o mundo, a Organização Mundial da Saúde disponibiliza publicamente seus dados sobre a saúde mundial por meio do Observatório da Saúde Mundial (GHO). O GHO funciona como um portal para acessar e analisar as condições de saúde e temas importantes.
Os diversos conjuntos de dados disponíveis são organizados por tema, como mortalidade, sistemas de saúde, doenças transmissíveis e não transmissíveis, medicamentos e vacinas, riscos à saúde etc. As estatísticas de saúde da OMS são a fonte ideal para consultar informações sobre a saúde mundial e também são usadas no trabalho dos Centros de Controle e Prevenção de Doenças dos EUA.
4. Data.gov.sg
Compilado por: Governo de Singapura
Conjunto de dados de exemplo: Habitantes de Singapura por faixa etária, grupo étnico e gênero, final de junho, dados anuais (2017)
A Internet está repleta de ótimos sites de dados governamentais. A maioria deles traz uma grande riqueza de dados e informações. Os EUA têm um dos sites mais conhecidos, o data.gov, e o Reino Unido e a Austrália também têm sites excelentes. Com todos esses sites e grandes amostras populacionais, há uma infinidade de dados para acessar. Então por que escolher o de Singapura?
Sinceramente, o site de dados do governo de Singapura é extremamente acessível visualmente. A página inicial está repleta de pequenas visualizações que contam histórias sobre cada conjunto de dados. Uma visualização de dados não deve apenas apresentar informações em um formato preciso e relevante, mas também deve ser envolvente e capturar o interesse do usuário. A maioria dos sites de dados governamentais é funcional e simples o suficiente para transmitir os dados de uma forma fácil de entender. Já Singapura alegra seu site com visualizações coloridas, gráficos com cores vivas e uma seção de “Conjuntos de dados semelhantes” na parte inferior de cada conjunto de dados para incentivar os leitores a continuar explorando.
5. Earthdata
Compilado por: NASA
Conjunto de dados de exemplo: Eletricidade atmosférica (relâmpagos)
O Earthdata faz parte do Programa de Sistemas de Dados Científicos da Terra da NASA, especificamente o Sistema de Dados e Informações do Sistema de Observação da Terra (EOSDIS). O EOSDIS tem a função de processar e distribuir dados científicos sobre a Terra provenientes de satélites de observação da Terra, aeronaves e medições de campo.
Com o Earthdata, o público pode acessar dados, notícias e informações de eventos da NASA. Esse recurso inclui dados sobre a atmosfera terrestre, a radiação solar, a criosfera (zonas árticas/congeladas), os oceanos, a superfície terrestre (gravidade, geomagnetismo, tectônica) e ambientes humanos.
6. Registro de dados abertos do Amazon Web Services
Compilado por: Amazon
Conjunto de dados de exemplo: Projeto 1.000 genomas
Como cada vez mais organizações estão disponibilizando seus dados para acesso público, a Amazon criou um registro para localizar e compartilhar esses diversos conjuntos de dados. Há mais de 50 conjuntos de dados públicos disponíveis no registro da Amazon, que vão desde declarações do imposto de renda dos EUA e imagens de satélites da NASA até sequenciamento de DNA e indexação da Web. Os conjuntos de dados também incluem exemplos de uso, mostrando o que outras organizações e grupos fizeram com os dados.
7. Pew Internet
Compilado por: Pew Research Center
Conjunto de dados de exemplo: Adolescentes, redes sociais e tecnologia em 2018
A missão do Pew Research Center é coletar e analisar dados de todo o mundo. O centro de pesquisas investiga os mais variados temas, como política, redes sociais, jornalismo, economia, privacidade on-line, religião e tendências demográficas. Além de realizar suas próprias pesquisas e análises política e ideologicamente neutras, ele também disponibiliza seus dados brutos para acesso público. Para acessá-los, basta fazer um breve cadastro no site e creditar o Pew Research Center como a fonte dos dados com uma declaração de que a Pew não é responsável por conclusões alternativas extraídas dos dados.
De certa forma, a disponibilização dos dados para acesso público é outro projeto de pesquisa da Pew. Ela já sabe como os dados são utilizados em suas próprias pesquisas e está interessada em descobrir como outras pessoas estão usando seus dados. Ela só faz um pedido: ser avisada por e-mail caso os dados sejam usados em uma obra que será publicada.