Data is overal. Waarschijnlijk wist je dat inmiddels wel, aangezien je er niet echt omheen kunt als het steeds in het nieuws is, een almaar groeiende bedrijfstak is en datavaardigheden voor bijna elke baan toegevoegde waarde bieden. Maar data is niet iets dat alleen voor grote bedrijven interessant is en je hoeft niet je eigen data te verzamelen om het te kunnen analyseren. Er zijn ontzettend veel openbare datasets te vinden!
Als je wilt leren hoe je data analyseert en datavisualisaties maakt, of gewoon je datageletterdheid wilt verbeteren, dan zijn openbare datasets perfect om mee te beginnen. Hier vind je een aantal openbare datasets die je nu gratis kunt analyseren. Heb je hulp nodig om je bevindingen vorm te geven? Bekijk dan onze pagina's met informatie over datavisualisatieblogs om te volgen en met de beste voorbeelden van datavisualisatie (ter inspiratie).
1. Google Trends
Beheerd door: Google
Voorbeelddataset: Zoekresultaten 'Cupcake'
Dit is een van de omvangrijkste en interessantste openbare datasets om te analyseren. De enorme zoekmachine van Google traceert zoektermdata om ons te laten zien waarnaar mensen zoeken en wanneer ze dat doen. Je kunt de statistieken verkennen op zoekvolume voor bijna elke zoekterm vanaf 2004. Voer een zoekterm of een paar zoektermen in en klik op de downloadknop om de data buiten de Trends-website te analyseren.
Er zijn allerlei filters om trends toe te spitsen op locatie (wereldwijd of op land), verschillende tijdzones, categorieën en zelfs bepaalde zoekmogelijkheden (web versus afbeelding versus YouTube-zoekresultaten). Je kunt eenvoudig zien welke onderwerpen op dit moment populair zijn en wat trending is op de Trends-homepage. Google belicht op die homepage ook verschillende interessante voorbeelden van trends door middel van datavisualisaties.
Geïnteresseerd in meer Google-data? Bekijk dan Google Finance, Google Public Data en Google Scholar.
2. National Climatic Data Center
Beheerd door: National Centers for Environmental Information (voorheen NOAA)
Voorbeelddataset: Local Climatological Data (LCD)
Als weer- en klimaatwetenschap jouw ding is, dan kun je helemaal los met de bijzonder gedetailleerde data van het National Climatic Data Center. De datacentra van de National Oceanic and Atmosferic Administration (NOAA) zijn samengevoegd en vormen ny de National Centers for Environmental Information (NCEI).
Hier vind je een archief vol datasets over klimaat en weer van de hele Verenigde Staten (het grootste ecologische-data-archief ter wereld). Het is een enorme bron van allerlei soorten weerdata, waaronder meteorologische, oceanische, klimatologische, atmosferische en geofysische data.
3. Global Health Observatory-data
Beheerd door: Wereldgezondheidsorganisatie (WGO)
Voorbeelddataset: Universal access to reproductive health
Als onderdeel van hun kerndoelstelling voor betere gezondheidsinformatie wereldwijd maakt de Wereldgezondheidsorganisatie hun data over de wereldwijde gezondheid openbaar via het Global Health Observatory (GHO). De GHO is een soort van toegangsportaal tot informatie over gezondheidssituaties en belangrijke thema's voor analyse.
De verschillende datasets zijn ingedeeld op thema, zoals sterftecijfers, gezondheidssystemen, overdraagbare en niet-overdraagbare ziekten, geneesmiddelen en vaccins, gezondheidsrisico's etc. De statistieken van de WGO zijn een belangrijke bron voor gezondheidsinformatie wereldwijd en worden ook gebruikt in het werk van de Amerikaanse Centers for Disease Control and Prevention (CDC).
4. Data.gov.sg
Beheerd door: Overheid van Singapore
Voorbeelddataset: Singapore Residents By Age Group, Ethnic Group And Gender, End June, Annual (2017)
Er staan eigenlijk een heleboel goede overheidswebsites op internet. De meesten bevatten ontzettend veel data en informatie. De VS heeft een van de bekendste (data.gov), en het VK en Australië hebben soortgelijke geweldige websites. Deze landen en de bijbehorende grote steekproefpopulaties bieden dus een enorme bron om uit te putten. Dus waarom Singapore?
Eerlijk gezegd omdat de datawebsite van de overheid van Singapore visueel gewoon erg toegankelijk. De homepage staat vol met kleine visualisaties die over elke dataset een verhaal vertellen. Bij datavisualisatie is het niet alleen van belang om accurate en relevante informatie te delen, , maar ook om het op een aantrekkelijke manier weer te geven, zodat het interesse wekt. De meeste datasites van overheden zijn nuttig en eenvoudig, en goed genoeg om de data op een begrijpelijke manier over te brengen. Maar Singapore maakt het interessant met kleurrijke visualisaties, kleuraccenten in de grafieken en een 'Vergelijkbare datasets'-gedeelte onder elke dataset om bezoekers te stimuleren verder te zoeken.
5. Earthdata
Beheerd door: NASA
Voorbeelddataset: Atmospheric Electricity (Lightning)
Earthdata is onderdeel van het Earth Science Data Systems Program van NASA, en dan met name het Earth Observing System Data and Information System (EOSDIS). EOSDIS fungeert als een middel om aardwetenschappelijke data van aardobservatiesatellieten, vliegtuigen en veldmetingen te verwerken en te verspreiden.
Via Earthdata heeft het publiek toegang tot data, nieuws en informatie over gebeurtenissen van NASA. Het bevat data over de atmosfeer van de aarde, zonnestraling, de cryosfeer (arctische/bevroren gebieden), de oceaan, het landoppervlak (zwaartekracht, geomagnetisme, tektoniek) en menselijke omgevingen.
6. Amazon Web Services Open Data Registry
Beheerd door: Amazon
Voorbeelddataset: 1000 Genome Project
Nu meer organisaties hun data beschikbaar stellen voor openbaar gebruik, heeft Amazon een register gemaakt om deze verschillende datasets te vinden en delen. Er zijn meer dan 50 openbare datasets die door het register van Amazon worden ondersteund, variërend van IRS-bestanden tot satellietbeelden van NASA en van DNA-sequentie tot webcrawling. De datasets bevatten ook gebruiksvoorbeelden, die laten zien wat andere organisaties en groepen met de data gedaan hebben.
7. Pew Internet
Beheerd door: Pew Research Center
Voorbeelddataset: Teens, Social Media & Technology 2018
De missie van het Pew Research Center is om data uit alle delen van de wereld te verzamelen en analyseren. Allerlei onderwerpen komen aan bod, zoals politiek, sociale media, journalistiek, economie, online privacy, religie en demografische trends. Ze doen hun eigen onpartijdige, niet-commerciële onderzoeken en analyses, maar bieden hun ruwe data ook aan voor algemeen gebruik. Om toegang te krijgen, hoef je je alleen maar aan te melden bij de website en Pew Research Center te vermelden als bron van de data, met een verklaring dat Pew niet verantwoordelijk is voor alternatieve bevindingen op basis van de data.
Op een bepaalde manier is het toegankelijk maken van data ook een onderzoeksproject van Pew. Ze hebben alle informatie al over hoe zij de data in hun onderzoek gebruiken en zijn geïnteresseerd in hoe anderen hun data gebruiken. Ze hebben maar één verzoek: om per e-mail contact met ze op te nemen als er iets gepubliceerd wordt op basis van de bij hen verkregen data.