Data finns ju överallt. Det visste du säkert vid det här laget. Det är nästan svårt att undvika eftersom det diskuteras så ofta i nyheterna och dessutom är en växande yrkesgren. Datakompetens blir allt viktigare inom alla arbetsområden. Men data är inte bara till för stora företag. Och du behöver inte samla ihop egen data för att genomföra analyser. Det finns mänger av offentliga dataset där ute!
Om du vill lära dig hur du ska analysera data, skapa visualiseringar eller bara förbättra din dataläskunnighet är offentliga dataset en bra början. Här är några bra offentliga dataset som du kan analysera utan kostnad nu direkt. Om du behöver hjälp med att ge dina upptäckter en bra form har vi sammanställt bloggar om datavisualiseringar som du kan följa och de bästa exemplen på datavisualisering för att få lite inspiration.
1. Google Trender
Hanteras av: Google
Exempel på dataset: Sökresultat för ”cupcake”
Det här är ett av de bredaste och mest intressanta offentliga dataset som finns att analysera. Googles omfattande sökmotor håller koll på vilka sökord som människor använder och när. Och vi kan se dem. Du kan utforska sökstatistiken för nästan alla söktermer från 2004. Skriv in en eller flera söktermer och klicka på hämtningsknappen. Då kan du analysera data om dem utan att behöva stanna på webbplatsen.
Det finns flera filter för att begränsa trender utifrån plats (hela världen eller särskilda länder), olika tidsintervall, kategorier eller specifika söktyper som webb, bilder eller Youtube. Du kan enkelt se vilka ämnen som är populärast för tillfället och vad som just nu trendar på webbplatsen för Trender. Google lyfter också fram intressanta exempel på trender med datavisualisering.
Om du är intresserad av mer data från Google kan du kolla in Google Finance, Google Public Data och Google Scholar.
2. National Climatic Data Center
Hanteras av: National Centers for Environmental Information (tidigare NOAA)
Exempel på dataset: Local Climatological Data (LCD)
Är väder och klimat din grej? Du kan inte få mer detaljerad information än från National Climatic Data Center. Varumärket har en ny profil efter sammanslagningen av datacentren National Oceanic och Atmospheric Administration (NOAA) till National Centers for Environmental Information (NCEI).
Här hittar du ett arkiv med USA-relaterade dataset för både klimat och väder. Det är faktiskt världens största arkiv med miljörelaterad data. Det är en enorm resurs för all sorts väderdata. NCEI täcker in både meteorologi, hav, klimat, atmosfär och geofysik.
3. Data från Global Health Observatory
Hanteras av: Världshälsoorganisationen (WHO)
Exempel på dataset: Allmän tillgång till reproduktiv hälsa
Världshälsoorganisationen gör all sin data om global hälsa allmänt tillgänglig via Global Health Observatory (GHO). Ett av deras viktigaste mål är att sprida hälsoinformation över världen. GHO fungerar som en portal där du kommer åt och kan analysera hälsosituationer och läsa om viktiga teman.
Dessa olika dataset är ordnade efter teman som dödlighet, hälsosystem, smittsamma och icke smittsamma sjukdomar, mediciner och vacciner, hälsorisker och så vidare. Världshälsoorganisationens statistik är en självklar källa till global hälsoinformation. US Centers for Disease Control and Prevention använder den också i sitt arbete.
4. Data.gov.sg
Hanteras av: Regeringen i Singapore
Exempel på dataset: Singapore Residents By Age Group, Ethnic Group And Gender, End June, Annual (2017)
Det finns faktiskt många bra webbplatser med data från regeringar och offentlig sektor. De flesta är otroligt värdefulla källor till data och information. USA har en av de mest välkända på data.gov. Även Storbritannien och Australien har riktigt bra motsvarande webbplatser. Med alla dessa dataset som bygger på ett stort befolkningsunderlag finns mycket data att använda. Så varför Singapore?
Singapores webbplats med den här typen av data är helt enkelt väldigt tillgänglig rent visuellt. Startsidan är fylld med små visualiseringar som berättar historier om varje dataset. En del av arbetet med datavisualiseringar är både att se till att de visar information i ett korrekt och relevant format och att de är så tilltalande att de väcker intresse. De flesta webbplatser med data från regeringar och offentlig sektor är ändamålsenliga och enkla. Tillräckligt bra för att få ut data på ett sätt som är enkelt att förstå. Men Singapore tar det till nästa nivå genom färgglada visualiseringar, färgstänk i graferna och en sektion med liknande dataset under varje dataset för att inspirera besökaren till att utforska vidare.
5. Earthdata
Hanteras av: NASA
Exempel på dataset: Luftelektricitet (blixt)
Earthdata är en del av NASA:s Earth Science Data Systems Program, närmare bestämt Earth Observing System Data and Information System (EOSDIS). EOSDIS fungerar som ett sätt att bearbeta och distribuera vetenskaplig data om jorden från observationssatelliter, flygplan och fältmätningar.
Allmänheten kan via Earthdata komma åt NASA:s data, nyheter och information om händelser. Det handlar om data från jordens atmosfär, solstrålning, kryosfären (jordens is- och snötäckta områden), hav, landyta (gravitation, jordmagnetism, tektonik) och mänsklig miljö.
6. Amazon Web Services Open Data Registry
Hanteras av: Amazon
Exempel på dataset: 1000 Genomes Project
I takt med att fler organisationer gör sina dataset tillgängliga för allmänheten har Amazon skapat ett register för att hitta och dela dessa dataset. Det finns över 50 offentliga dataset i Amazons register och innefattar bland annat det amerikanska skatteverkets (IRS) handlingar, NASA:s satellitbilder, DNA-sekvenser och webbcrawling. Dessa dataset innehåller också exempel på användning genom att visa vad andra organisationer och grupper har gjort med deras data.
7. Pew Internet
Hanteras av: Pew Research Center
Exempel på dataset: Teens, Social Media & Technology 2018
Pew Research Center har som mission att samla in och analysera data från hela världen. De täcker in alla tänkbara ämnen såsom politik, sociala medier, journalistik, ekonomi, integritet på internet, religion och demografiska trender. De genomför egna opartiska undersökningar och analyser, och gör även sin rådata tillgänglig för allmänheten. För att få tillgång krävs det att du registrerar dig på deras webbplats och anger Pew Research Center som källa. Pew avsäger sig allt ansvar för alternativa slutsatser som dras utifrån deras data.
På ett sätt är det ännu ett forskningsprojekt för Pew när de gör sin data tillgänglig. De har redan all information om hur de använder sin data i forskningssyfte, men de är också intresserade av att lära sig hur andra använder deras data. De önskar dock att du kontaktar dem via e-post om du publicerar något som är ett resultat av deras data.