災情大數據的隱藏性偏見

 

Power Outage During Hurricane Sandy via Twitter

(提示:地震訊息多的地區未必比較嚴重。)

2012年襲擊美國東岸的珊迪颶風 (Hurricane Sandy) 是當年最嚴重的風災,造成的損失甚至比2005年淹沒新奧良市的卡崔娜颶風更慘烈。

當時有人根據 Twitter 和 Foursquare 的資料,分析紐約市的災情與災後復原情形。[1]

也有人根據 Twitter 訊息,呈現各地停電和復電的即時狀況。[2]

然而,若僅用社交媒體的資訊估計災情分布,可能會有所偏誤。畢竟,都市地區的人口數和隨之產生的網路使用量都比偏遠地區多。[3]

戒之、慎之。

參考資料:

  1. Extracting Diurnal Patterns of Real World Activity from Social Media
  2. Power Outage During Hurricane Sandy
  3. The Hidden Biases in Big Data

 

圖:Power Outage During Hurricane Sandy

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。