2014-07-11

View all on this date written articles further down below.

大數據探索航空資料-美國聯邦航空管理局

最近筆者剛好讀到有關於大數據應用於航空資料分析,覺得內容值得整理介紹給相關領域的朋友們參考,一直忙到暑假才有時間整理文章。記得上Data Science Program的課程中,曾有學生邀請筆者至某航空公司擔任顧問,但筆者實在是分身乏術,因此希望這一篇能夠給航空界的朋友們一些參考。 這篇是2009年刊登在知名期刊Knowledge-Based Systems上的學術研究,主要是應用決策樹(Decision trees)從美國聯邦航空管理局(FAA)的數據來挖掘出可能會出現航空事故的特徵。研究所採用的分析工具為Megaputer Intelligence所開發的PolyAnalyst與挪威科技大學開發的Rosetta。 筆者並非航空領域的專家,只是單就從大數據的角度來跟讀者分享研究的作法,所以若有敘述有誤,請多指教。 飛航安全是國際間大家都很在意的事情,像前陣子馬來西亞航空370號班機事件就是一個遺憾的事件。而過去航空業所累積的資料非常多,在研究中有提到像是飛行員報告(Pilot reports)、保養報告(Maintenance reports)、事件報告(incident reports)、延遲報告(Delay reports)等都是可以拿來作為資料分析的基礎。因此透過資料探勘的技術從過去的歷史資料挖掘一些可能會造事故的特徵,可以盡量讓飛航的事故減少。 這篇研究的資料取自美國聯邦航空管理局(Federal Aviation Administration簡稱FAA),美國為了要提升「飛航安全」,所以建置了航空安全資料分析與分享平台(Safety Information Analysis and Sharing簡稱ASIAS),讀者若有興趣可以逕自上網查詢資料,其中有個資料庫叫做AIDS,不是愛滋病喔,全名是Accident/Incident Data System,該資料庫收錄從1978年以來的航空事故資料,相當豐富。 研究採用了2000年到2006年共6年的航空資料,並且依據美國國家運輸安全委員會(National Transportation Safety Board)所定義的事件屬性進行整理,筆者將其整理如下: 事件報告的識別號碼 事件發生的日期 事件發生的城市 事件發生的國家…