7 個您立刻就能用來分析的免費公開資料集

資料無所不在。現在,您可能已經從持續不斷的新聞中得知,能夠持續擴展自己的專業領域並掌握資料技能的人,在就業市場上越來越吃香。不過,資料可不是大企業的專利,而且就算不自己收集資料,依然能進行分析,因為您可以使用大量的公開資料集!

不管是要學習如何分析資料、建立資料視覺化,還是提升資料素養與技能,公開資料集都是完美的起點。以下是一些公開資料集,您可以立刻用來分析,而且免費。如果您正整理自己的發現時需要協助,可以參考我們在資料視覺化部落格中發佈的內容,也可以從我們提供的最佳資料視覺化範例中取得靈感。

1.Google 搜尋趨勢

整理者:Google
資料集範例:「杯子蛋糕 」的搜尋結果

這是最廣泛且最有趣的公開資料集之一,值得分析。Google 利用其強大的搜索引擎來追蹤搜尋字詞資料,告訴我們人們在什麼時候搜尋什麼內容。您可以探索幾乎任何搜尋字詞從 2004 年以來的搜尋量統計資料。只要輸入任何一或多個搜尋詞並按下下載按鈕,即可在搜尋趨勢網站外的位置分析資料。

您可以使用各種篩選器來縮小趨勢的範圍,例如地點 (全球或根據國家/地區)、各種時間範圍、分類或甚至特定的搜尋類型 (網頁、圖片、YouTube 等不同搜尋結果)。您可以在搜尋趨勢的首頁上輕鬆查看目前的熱門話題以及搜尋量正在竄升的搜尋字詞。Google 也透過資料視覺化,在首頁上介紹幾個有趣的趨勢範例。

如果您對其他的 Google 資料也有興趣,請查看 Google 財經Google Public DataGoogle 學術搜尋

2.美國國家氣候資料中心

整理者:美國國家環境資訊中心 (前身為美國國家海洋暨大氣總署)
資料集範例:當地氣候資料 (LCD)

若您對氣象及氣候科學感興趣,那麼美國國家氣候資料中心絕對能為您提供最詳盡的資料。該中心近年來進行了品牌重塑,與國家海洋暨大氣總署 (NOAA) 資料中心整合成為國家環境資訊中心 (NCEI)。

這裡保存了全美國的氣候和氣象資料集檔案,是全世界最大的環境資料保存單位。這裡有大量氣候資料資源,類別包羅萬象,包括氣象資料、海洋資料、氣候資料、大氣資料和地球物理學資料等。

3.全球衛生觀察站資料

整理者:世界衛生組織 (WHO)
資料集範例:生殖健康普及化

為世界各國提供更完善的健康資訊是世界衛生組織的核心宗旨,因此,該組織透過全球衛生觀察站 (GHO) 發佈的全球衛生資料。透過 GHO 這個入口網站,使用者用可以瞭解並分析健康狀況和重要議題。

各種資料集根據主題組織得井然有序,包括死亡率、衛生系統、傳染性和非傳染性疾病、藥品和疫苗、健康風險等等。WHO 的健康統計資料是最佳的全球健康資訊來源,即使是美國疾病控制與預防中心也會使用這些統計資料。

4.Data.gov.sg

整理者:新加坡政府
資料集範例:新加坡各年齡群組、種族和性別的居民人數,六月底,年度 (2017)

網路上其實有很多很棒的政府資料網站。這些網站能提供極為豐富的資料和資訊。美國擁有最著名的 data.gov,而英國澳大利亞也各自擁有自己相對的網站。有了這些網站,再加上大量的樣本,我們自然就有很多資料可以存取。那為什麼要強調新加坡呢?

坦白說,新加坡政府的資料網站視覺效果非常厲害。光是首頁就充滿了小型的視覺化內容,講述著各個資料集的故事。將資料視覺化,不僅是為了用正確且適合的格式來顯示資訊,更是為了吸引人們的目光。政府的資料站多半實用而簡單,僅止於以容易理解的方式呈現資料。但是,新加坡政府的網站更為活潑,因為網站包含了色彩豐富的視覺化,圖表使用了濃淡有別的顏色,而每個資料集的底部還有「類似資料集」專區,用意在鼓勵使用者進行探索。

5.Earthdata

整理者:NASA
資料集範例:大氣電學 (閃電)

Earthdata 是 NASA 的地球科學資料系統計劃的一部分,具體上來說是屬於地球觀測系統資料資訊系統 (EOSDIS)。EOSDIS 主要是用於處理並分配來自地球觀測衛星、飛機和實地測量的地球科學資料。

透過 Earthdata,民眾可以查看 NASA 的資料、新聞和事件資訊。Earthdata 包括了地球的大氣層、太陽輻射、冰凍圈 (北極/冰凍地區)、海洋、陸地表面 (重力、地磁、構造) 和人類環境等的測量資料。

6.Amazon Web Services Open Data Registry

整理者:Amazon
資料集範例:千人基因組計劃

隨著越來越多的組織將其資料公開,Amazon 也建立了一個註冊表,供公眾尋找和分享這些資料集。Amazon 的註冊表共支援 50 個以上的公開資料集,其範圍從美國國稅局 (IRS) 的檔案,到美國太空總署 (NASA) 衛星圖像,再到 DNA 測序,甚至連網路自動索引都有。這些資料集也包括了使用範例,向使用者說明其他組織和團體顯示使用這些資料來做什麼。

7.皮尤網

整理者:皮尤研究中心
資料集範例:青少年、社交媒體和科技 2018

皮尤研究中心的使命就是收集並分析來自世界各地的資料。該網站探討的主題包羅萬象,如政治、社交媒體、新聞、經濟、線上隱私權、宗教和人口統計趨勢等等。該機構一方面從事無黨派、無傾向的研究與分析,一方面開放原始資料供大眾使用。只需在網站上註冊即可存取這些資料,在使用資料時,必並註明資料來源為皮尤研究中心,最後再附上豁免聲明,說明該中心對其他資料的結論概不負責。

從某種意義上來說,讓民眾能夠使用資料也是該中心的一個研究專案。該機構已提供了完整資訊說明自己在研究中使用資料的方式,同時也想瞭解其他人如何使用其資料。因此該機構有一個要求,就是當您使用取自該處的資料製作出內容並發佈時,務必透過電子郵件聯繫該機構。