2016-02-06 CK

災情大數據的隱藏性偏見

 

Power Outage During Hurricane Sandy via Twitter

(提示:地震訊息多的地區未必比較嚴重。)

2012年襲擊美國東岸的珊迪颶風 (Hurricane Sandy) 是當年最嚴重的風災,造成的損失甚至比2005年淹沒新奧良市的卡崔娜颶風更慘烈。

當時有人根據 Twitter 和 Foursquare 的資料,分析紐約市的災情與災後復原情形。[1]

也有人根據 Twitter 訊息,呈現各地停電和復電的即時狀況。[2]

然而,若僅用社交媒體的資訊估計災情分布,可能會有所偏誤。畢竟,都市地區的人口數和隨之產生的網路使用量都比偏遠地區多。[3]

戒之、慎之。

參考資料:

  1. Extracting Diurnal Patterns of Real World Activity from Social Media
  2. Power Outage During Hurricane Sandy
  3. The Hidden Biases in Big Data

 

圖:Power Outage During Hurricane Sandy

CK

提供企業資料策略分析顧問服務,也積極參與社群活動,透過科技和資料的力量,設法改造社會。

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *