今(8/3)延續第二天的 DSP 課程「看資料找故事工作坊」,一開始由講師嘉凱和柏翰先幫大家暖暖身,複習昨天實作重點,緊接著學員們腦力激盪與資料產生火花,好構思 team project 發展主題。
一個精彩的故事值得傳頌千古,話說好久好久以前… 但同學們謹記在 pitch 前,先思忖清楚在採購資訊生命週期中,將檢視標的範疇、時程、金額等關鍵欄位哪些是必要或需求的資料盤點,及該用哪個解決方法。有趣的是在聚合多面向資料時,如何將洋蔥層層剝開不流淚,問對問題、找對方向、發掘關連,好在開放資料與海量資料裡直指文本分析脈絡而不迷路。
當各組發表專案主題時,關注面向豐富多元各有巧思極具創意,例如工程類、教育類、標案類等,此時功力深厚的助教們隨團協助辨識出真議題,幫助各組直指核心問題及實作轉換資料時困難之處,在這些饒富趣味的議題建構下,不斷反覆在假設與驗證擺盪,運用邏輯不斷檢視正確性,或是純屬訛誤非異常。一張好的圖表勝過千言萬語,但發現冰山底下的關鍵指標卻往往更驚人,交織出的數字與故事抽絲剝繭,即將發現潛藏的意義。
在有限的寶貴時間裡,大大小小的資料與圖表交疊,各組發揮創意,點出幾個大重點實屬不易,只能說橫看成嶺側成峰,遠近高低各不同,未識故事真面目,只緣身在資料中,值得後續再追蹤觀察,各組重點如下:
- Love TW愛台十二建設:試圖整理標餘款與機關關係。
- 公務員出國追追追:歸類考察事由、地點等。
- 孩子的教育不能等:關心教育建設的資源配置。
- 95281:欲追蹤限制性標案分類情形。
- 誰在做豆腐渣工程:匯理最低價得標者與稽核情形。
最後,由講師宗震及其他講師、助教分享個人學習歷程,期許學員們能夠成為全方位資料科學家,統計、程式、專業三大項度中扣合深度,這是一條提升層次的必經要道,經過這一番學習洗禮,相信大家不僅能成為 sexy 的資料科學家,還能有所收穫再上一層。