今(3/8)外頭冷颼颼,但在「資料科學計畫-團訓班」這群人很熱情,聚集了身懷絕技的同學們,包含資料衛生員(啥!整理乾淨有序也是很重要的工作)、資料分析師、視覺設計師、長袖善舞負責統整的PM,這裡成為千金難買早知道的知識交流好平台呢!
CK在課堂開始讓我們先學Bruce Lee《Be water, my friend》,淨空心智讓開放的心胸擁抱無限可能,如水幻化無形亦有形,唯有獨創一格才有自己的style,李小龍的鬥魂喚起我們內在的多巴胺(Dopamine)。仔細研究了一下課程,不論是學技還是學藝都豐富,相信心神領會資料心法,人人都可以當資料大師,當然我們不是要當獨孤俠,而在這個小團隊中善用自己的專長角色,互補強項組成不管是《超人特攻隊》亦是《復仇者聯盟》共同合作啦!
如何讓組織運作發揮強大,不是用科層式組織One Way一個指令就是你一個人便可達成的,更多時候是打破圍籬雙向共同協作,關係需要傳達一致的「核心價值」,完成效率才會提高吧!
現在,遇到轉化成為資料科學家的思考,讓我們老在乎追逐著要做「什麼」(what)框框邊邊的繁雜瑣事,提升到考慮簡單、明瞭、易懂的「核心價值」直指出「為什麼」(why)來透析mind map,Steve Jobs之所以為經典不是沒有原因的。Fred進一步說明萃取出來資料價值的驅動發生流程可能會從處理(data、information)→分析(knowledge)→策略(insight、action),但是要小心!常見錯誤就是knowledge可能是認知不完整或來源有誤,跑出的look insight可就大不同!
例如物聯網讓產品網網相連的資訊趨近大無限,也許會遇到以下情形(1)data很髒亂(這很常見的事,一定需要資料衛生員來整理);(2)如何分析才算綜整完整?(輪到資料分析師現身) ;(3)重點是各位老闆、看倌看得懂嗎?(讓視覺設計師的美化資料再出場也很重要);(4)是否能指引回該事件策略不違背價值核心呢?(PM偉大的工作,不然離題跑太遠,讓前頭超完美的操作導引到無可救藥的致命錯誤,這任務算成功還是失敗呢!)
果然,團隊很重要吧!課堂老師熱心地分享許多好好用的實務工具,哇!一張圖表讀出千萬商機?所言不假,KDD資料探勘流程的首要工作,第一題永不離「你問對問題嗎?」,可惜的是自上而下,經常不知道自己要什麼?以及該要問的1H5W(5個老婆!誤~但Rafe老師,你內心真的是這樣想的吧!),也提醒當我們看著資料說故事是指Data support,常嘴邊講的data driven可要慎用,千萬不要被資料牽著鼻子走,還是多加揣摩Rafe老師的心法,用一張好圖表(航空運輸、旅行業者)如何玩出近億好成績可不是蓋的,實作演練看能不能從鄉民變工匠,工匠變大師,這次有這麼厲害的團隊組成,同學們我們一起努力吧!
Johnson老師教我們統計學的內功心法,幫忙打通資料科學的任督二脈,銘記在心~先對資料區分成類別資料(字串)如性別、血型等,和數值資料(數值)如離散資料整數、時間月份等,這些型態幫助資料整理時,可是不能省的功夫。我們來看一下信義區還是大安區的豪宅俱樂部,到底誰比較鑲金包銀呢?Johnson老師分析的好詳細,也包含要先釐清自己需求的關鍵目標問問題,命題要用多少$$才買得到台北市新成屋?啥!3,000萬就可以,為什麼?來上課就知道為什麼了!另外呼籲!「敘述性統計給予簡潔的摘要,但任何簡化都可能產生誤導唷!」
Aaron Levenstein : “Statistics are like a bikini…”令人感到玩味好奇的是,到底是看得到的,還是被覆蓋到的那個部分,每回看著數字想像,我不能同意更多了!
今天課堂紮實豐富,包含很刺激的腦力激盪進行分組討論及發表,在每一個學習環節都在逐步精進的道路,朝著目標往前邁進。