沉浸在R的異想世界

今(3/9)「資料科學計畫-團訓班」同學們相見歡,熱鬧哄哄地趕緊複習著昨天的習題,延伸前一天的重要課程,繼續用R來學統計學,今日Johnson老師提醒「合併資料」太重要了,同學們也目不轉睛地亦步亦趨跟上老師的視窗腳步,遇到疑難雜症時,講師助教群紛紛下場協助教學。

探索資料R步驟,奠定養成基礎厚 

資料探險的第一步就是要用最簡單的方法,可用好看易讀的圖表勝過千言萬語,也要留心圖表適合應用在什麼場合,例如直方圖是看一個連續型資料,和長條圖功能並不同唷!另外,延伸想想看Netfilx能預測這些影片觀賞後的評價,誤差不超過半顆星的百萬model是如何辦到的呢?

Johnson老師進一步深入講解,透過眾多隨手可得的有趣案例幫助大家來了解,及熱門的選舉議題相信又會引起一波討論熱潮,還有多款model實用教戰守則任君選用,讓同學們都聽得津津有味呢!

P_20140309_104551

 善用視覺小眉角,一目了然多更多 

CK老師剖析在巨量資料中精挑細選出重點,轉成資料視覺化的美化工程日趨重要,好幫助對方一眼洞悉當中的差異化,分享了很多小技巧、關鍵零組件和必備工具,例如要怎麼表達核四公投這件事呢!謹記Make Stories simple,「錢途Money bunch」就很符合這個標準唷!

現在有很多套裝軟體、Illustrator、Code可供自由選擇,但很可惜,並沒有完美的方法能全然一體適用,還是要看自己想要解決什麼樣問題,同步回歸到最初命題觀察視角為何,才可能詮釋這些資料和數據,找趨勢、拉關係、做比較,讓背後的故事「為什麼」有感更有力,例如地圖就是最好的資料視覺化的展現,但也要注意因果關係是否產生Bias謬誤,例如路不平的資訊回報,顯示坑洞多顯示在較高所得的區域,為何反而和我們原始想的表象不一樣呢?

P_20140309_140531

思考Team Project與達到最終目標雛型前,除了一定要先問對問題,一路蜿蜒的實作過程裡,將從哲家之眼、詩人之心、巧匠之手逐步精進。

令人振奮的Team Project,刺激可能再聚焦 

Johnson老師帶著大家從不動產交易實價登錄資料練習R實作,同學們全神貫注認真演練指令,深怕跟不上老師提醒的眉眉角角,因為接著就要導引到Team Project之所用,將拉出的資料與分析大不同。

P_20140309_170346

同學又開始瘋狂激烈的討論,如何短時間調整讓團隊有效地聚焦到同一個目標,任何人也可以針對發表內容再追問,相信今日也會和昨天一樣,下了課~仍舊燈火通明,大家繼續奮戰吧!