Sete competições para analistas e cientistas de dados

Coloque seu conhecimento em prática e teste suas habilidades em competições que envolvem ciências de dados, visualizações e muito mais.

As competições de dados têm vários propósitos. Esses eventos são uma ótima forma de saber mais sobre práticas recomendadas, receber feedback do seu trabalho e aprimorar suas habilidades. Além disso, as competições podem servir como ferramenta de brainstorming para você pensar coletivamente em soluções de problemas.

Seja qual for o propósito, as competições de dados são uma oportunidade de ir além dos seus limites e estimular a criatividade entre os melhores e mais brilhantes profissionais de diversas áreas do setor.

Veja a seguir uma lista de competições em que você pode praticar suas habilidades de ciências de dados, visualizações e muito mais.

Iron Viz

Site: tableau.com/pt-br/iron-viz
Hospedado por: Tableau

Todos os anos, o Tableau Public realiza diversas competições de visualização de dados até chegar ao grande desafio final: o Iron Viz. Várias competições virtuais “preparatórias” são feitas ao longo do ano, cada uma com foco em determinadas habilidades de visualização de dados e com um tema específico. O vencedor de cada competição participará do evento Iron Viz em tempo real, diante de um público de 17 mil pessoas, na Conferência da Tableau ou na Conferência da Tableau na Europa. No último desafio, os três finalistas terão que criar a melhor visualização usando o mesmo conjunto de dados.

A avaliação das visualizações é feita com base em vários critérios, como design geral, capacidade de a visualização e os dados contarem uma história e complexidade da análise de dados e resultados. Mesmo para quem não ganha o prêmio final, as competições do Iron Viz são uma ótima forma de conhecer melhor o mundo da análise e receber feedback de colegas e especialistas da área.

Competições do Kaggle

Site: kaggle.com/competitions
Hospedado por: Kaggle

Criar uma lista como essa e não incluir o Kaggle seria uma falha de nossa parte. O Kaggle é uma das plataformas mais conhecidas para hospedar competições de ciência de dados. O site começou fazendo competições de aprendizado de máquina e, desde então, conquistou a fama que tem agora. As competições do Kaggle atraem regularmente milhares de participantes, individuais ou em equipes, que disputam prêmios lucrativos.

As competições propõem problemas complexos, e os participantes se empenham para criar o melhor algoritmo a fim de resolver esses problemas. As recompensas incluem o conhecimento adquirido, gratificações variadas e até mesmo prêmios em dinheiro. Grande parte das competições que envolvem prêmios em dinheiro costumam oferecer valores na faixa de dezenas de milhares de dólares, mas algumas já ultrapassaram a quantia de 100 mil dólares. A maior quantia oferecida até o momento foi a do prêmio de primeiro lugar, no valor de 1 milhão de dólares, para a equipe que conseguisse superar o modelo de benchmark “Zestimate” da empresa Zillow, do setor imobiliário, na previsão de valores residenciais. Além de realizar competições para várias organizações, o Kaggle faz o Data Science Bowl, uma competição anual que visa melhorar a sociedade através da ciência.

Kantar Information is Beautiful Awards

Site: informationisbeautifulawards.com
Hospedado por: Information is Beautiful e Kantar

Se você conhece o mundo dos dados, provavelmente já acessou o site Information is Beautiful, do David McCandless, que mostra como o design visual estimula a transferência de informações. O site também realiza a competição Information is Beautiful Awards a fim de chamar a atenção para as melhores e mais criativas visualizações de dados.

Todos os anos, são concedidos prêmios para os participantes que se destacam ao transformar dados em arte. Os critérios de avaliação envolvem a disposição dos dados e o modo como as visualizações realçam informações e descobertas sobre o tópico. O auge da competição é a cerimônia de premiação do Information is Beautiful. A lista completa de visualizações participantes é apresentada no site, e as visualizações pré-selecionadas participam da cerimônia de premiação no fim do ano. Na cerimônia de 2018, as visualizações pré-selecionadas foram expostas em biscoitos na festa.

Com exposição em biscoitos e prêmios de milhares de dólares, as competições de dados dão visibilidade às melhores e mais brilhantes criações. Mesmo que você pretenda começar aos poucos, essas competições são uma boa forma de aprimorar o seu trabalho em qualquer nível de experiência.

Competições do Driven Data

Site: drivendata.org/competitions
Hospedado por: Driven Data

Assim como o Kaggle, o Driven Data hospeda competições de ciência de dados a fim de propor soluções coletivas para problemas preditivos complexos. A intenção é resolver desafios sociais prementes do mundo criando modelos estatísticos para auxiliar na previsão. Embora as competições não sejam grandes como as do Kaggle, o Driven Data direciona o foco para a solução de problemas que tenham um impacto tangível no mundo, beneficiando os seres humanos e a natureza. Várias de suas iniciativas de alto nível envolveram patrocínios da Fundação AARP em competições de dados que ajudam a monitorar a integridade física de idosos. Além disso, instituições como a The Nature Conservancy e o Instituto de Pesquisa do Golfo do Maine buscam estimular a pescaria sustentável usando imagens de vídeos para medir e quantificar os peixes.

A avaliação é feita com base na capacidade de usar as visualizações para prever dados que resolvam os problemas em questão, considerando valores reais de dados atuais como benchmark. Os modelos vencedores são integrados à instituição organizadora para ajudá-la a alcançar suas metas. Em algumas competições, você ganha apenas o direito de se gabar, enquanto outras oferecem prêmios em dinheiro, mas certamente todas terão um impacto positivo no mundo.

Comunidade da CrowdANALYTIX

Site: crowdanalytix.com/community
Hospedado por: CrowdANALYTIX

A CrowdANALYTIX realiza competições de modelagem de dados, abordando temas como aprendizado de máquina, inteligência artificial, aprendizado aprofundado e processamento de linguagem natural. Embora sejam mais informais, esses desafios não são menos gratificantes. Como várias outras competições listadas aqui, algumas têm foco no aprendizado e outras oferecem uma série de premiações.

A plataforma consiste em duas “camadas”: a camada automatizada de bots e a camada humana de cientistas de dados, que criam esses bots e algoritmos. A partir daí, as competições de dados passam a ser avaliadas como um trabalho em andamento que deve manter uma iteração consistente. Depois disso, os algoritmos vencedores entram no banco de dados da CrowdANALYTIX e são monitorados para receberem ajustes. Se o algoritmo ficar degradado, ele volta para a comunidade a fim de ser reajustado ou recriado.

Competições do Coda Lab

Site: competitions.codalab.org
Hospedado por: Coda Lab

O Coda Lab é uma plataforma de código aberto para pesquisa computacional. Suas competições têm foco em pesquisas colaborativas e testes de código. Embora não haja prêmios significativos, o trabalho colaborativo na plataforma visa criar códigos mais eficientes e reproduzíveis. O Coda Lab tem grande destaque nas áreas de programação e criação de código de dados, e pode ser uma boa forma de se aprofundar em projetos e desafios de colaboração.

Topcoder Open

Site: tco19.topcoder.com
Hospedado por: Topcoder

Semelhante ao Coda Lab, o Topcoder também é uma iniciativa de esforço colaborativo para compilar pesquisas e testes de código. O site principal apresenta vários desafios e competições, com temas que envolvem ciência de dados, codificação e design na Web. Muitos desafios oferecem prêmios interessantes, embora alguns sejam meramente simbólicos com foco no desafio.

A principal atração é o Topcoder Open, o grande torneio anual de programação e design. O torneio propõe uma série de competições, com temas como algoritmos, desenvolvimento, design de interface do usuário e garantia de qualidade. A primeira fase da competição é on-line, e os vencedores ganham pontos que rendem prêmios adicionais e uma viagem para a fase final do TCO, a ser disputada nos Estados Unidos. O TCO também faz eventos regionais menores para que cada vez mais pessoas participem das competições. Os eventos duram apenas um dia ou dois, mas são uma ótima oportunidade de envolvimento em âmbito internacional.

Para criar uma visualização de dados, comece agora criando sua conta grátis no Tableau Public e usando um dos conjuntos de dados publicados na página Recursos.

Dica: precisa de prática? Participe do desafio Makeover Monday! Um novo conjunto de dados é publicado todo domingo, e pessoas do mundo inteiro criam visualizações de dados que serão comentadas em um webinar na quarta-feira da mesma semana.