十一月 2014

View all on this date written articles further down below.

用最熱門的R語言─航向資料科學的偉大航道

隨著科技的快速發展,人類逐漸能夠利用海量數據的方式,為自然與社會中的各種活動做記錄。在巨量、即時與多樣的海量資料面前,世界上各種棘手的難題,似乎都有機會找到解答。然而,解答的前提在於能夠藉由資料分析歸納出複雜問題的模型,進而預測答案。資料分析扮演了至關重要的角色。 在寬廣無垠的資料之海中,進行資料分析如同海上尋寶,最基本的需求就是要有一艘能夠乘風破浪的船艦。R 語言具有免費、跨平台、佔有率高、可塑性高等優勢,各式各樣的 R 社群蓬勃發展。在國際知名的 KDnuggets 論壇統計當中,R 語言已經連續三年獲得資料科學家最常使用的資料分析語言第一名。 透過經驗豐富的老水手領航,往往能夠少走一些冤枉路。DSP 設計《R 語言探索之旅》課程的初衷在於幫助有志一同航向偉大航道的夥伴們備妥出航的船隻,航向資料分析領域的藍海。本課程很榮幸邀請到

面對大數據,我們透過管理攻略正在挖掘資料金礦!

今(11/27)來自不同領域的菁英們專注探究《大數據時代的管理攻略》應有的態度與思維。BIG DATA至今在各行各業都能應用上,從零售、顧問、航空、建築、金融到食品製造業等都有用武之地,還有許多重視資料價值的利益相關者,然而BIG DATA的迷思並不是多就是好,問題在於如果都是同一種資料的差異性不大,筆數多少反而不是問題,重點在於需要不同「多樣性資料」才能交叉分析,例如紐約收到311通報下水道經常堵塞的原因排放很多種,當中有些是家庭或是餐廳不正當排放,如何稽查2萬多家餐廳查出違規的大量排汙業者?試圖把「餐廳名單與下水道地理資料、與有處理購買排汙服務的業者」交叉去看,發現過濾後的違規名單比對高達95%,因此應先把小資料處理好再處理大資料才是正道。 CK(劉嘉凱)提到如從行銷角度來看,解構BIGDATA這幾個字(也是縮寫),可以由顧客模型、智慧預測、微細的行為追蹤、跨裝置限制、歸因模型、即時性、可行動性釋之。但目前公司組織遇到的多半是處於物有不足(工具)、智有不明(專業領域知識)、數有不逮(數學統計),要如何跨領域做資料分析,所以更需要使用資料科學方法帶來好的資料分析,以解決真實世界的問題,舉凡現在不管是醫療產業,還是智慧城市都有了更深入的應用。 資料思考掌握資料即是資產是經濟資源,對應到人資應該開出什麼職缺?才能幫助公司營運效率提升。例如Capital One從小公司開始勇於挑戰創新,一開始就嘗試計算出信用卡資料,應該針對不同顧客模型做差別定價跳脫傳統思維大翻身。從資料中萃取知識到建立資料分析思維,進一步塑造資料驅動的企業文化。 首先,可以觀察公司組織拿資料驅動做為決策類型,到底老闆想要解決的是一次性?還是經常性問題?例如預知美國颶風來臨前,多放一些事前準備物資,WELMART關心的不只是常見手電筒,而是利用BIG DATA跑出「啤酒和草莓餅乾」當作真正存糧因應。資料分析的目標不僅僅是從BI商業智慧知道發生了什麼狀況之外,還要能輔助進一步未來能做出什麼決策,因此資料科學的角度來看,需要一個清楚全觀的PM來確認背後動機、該問對什麼問題,再把資料處理流程中從工程師到分析師對應不同技巧的需求,來幫助公司做決策的技巧,包含和團隊中的溝通及專業知識,從「DSP學習地圖」了解每一種角色類別(專業經理人、工程師、分析師、設計師等)該如何入門下手,循序漸進的脈絡幫助你或是公司的資料達到成熟度,包含每個階段的需求不同,關心如何取得資料→描述資料→探索資料→預測→行動建議。 這是資訊爆炸的時代,也是注意力缺乏的時代,如何讓你的公司向REAL-TIME MARKETING終極目標前進,尤其現在是社交網路和手持裝置與帶動BIG DATA的興起,讓FUNNEL到CUSTOMER JOURNEY的每個階段都在產生許多資料,如何從顧客一進門開始就開始計算他的背景,並能合理預測推薦,當中眾多行為其實是跨地理疆界,看看國外競選的方式知曉釐清差異性後,漸漸拉出許多傳統無法計算到的境界,今天我們用眾多的個案來檢視他們背後的DATA-DRIVEN,讓學員紛紛學到對應的真正TA是誰,才能設計出對應的行銷方法。 Johnson(謝宗震)提到的資料分析心法,資料科學的方法從觀察現狀、問對問題→將問題轉成科學模型→進行分析計算→將結果導回「真實世界」的問題,在有限的時間下要如何分配學習資源呢?在2013年底試做一個關於當時新聞報導豪宅的小專案,先定義問題:如何「預測」頂級豪宅的市場價格?找出影響成交價的重要因子,及預測相似物件的市場價格,跑出結果和當時最後「實際」最後成交價相當接近,雖不中也不遠矣! 但資料也是有極限的,數據化的紀錄總是會喪失部分訊息,BIG DATA的議題中要關心哪些資料是重要的?以及資料蒐集的方法也許必須先釐清,重點不在大資料還是小資料,而是哪些變數因子是重要且有用性,不管是拿來找結果還是做預測,才能精準判斷好的行為驅動,例如1948年最具戲劇性的美國總統大選與民調結果失誤差很多,WHY?檢視背後操作方法,當中「隨機抽樣」是非常重要的。 Jerry(吳柏翰)帶來的「實際商業個案」讓所有學員聽得津津有味,即便到最後大家保持精神抖擻的專注聆聽著,到底是什麼魔法讓大家看的點頭如搗蒜呢?老闆總有想知道的績效問題,大家一起來挖掘資料金礦,包含透過三個不同產業特性找出「誰是高利潤(肥羊)客戶、誰會當叛逃客戶、到底是哪些商品該一起搭售」?除了經驗判斷外,我們手上握有資料集的時候,還需要更資料科學的作為,首先定義好老闆到底是想要知道或是解決什麼問題?例如目前各大電信業者很關心手機門號的客戶租約一旦快要到期,是否有可能分析出他是否會被其他業者吸引而跳槽?是否現有業者需要提出更好的方案當作誘因? 問對問題並找對真正影響營收或利潤的可能變數,並且要用正確的方法分析,Jerry用好幾種方法一步步帶著學員解析過程,最後大家還能清楚知道真正的結果與背後意義到底是怎麼被換算出來的,並破解傳統一次性結論的盲點,才不會產生見樹不見林或是見林不見樹的謬誤,則造成預估與實際誤差很大,只有用對好的方法才能讓大家縮短夢想與實際的差距,所以同時呼籲為什麼需要「資料科學團隊」,因為幫助的不只是個人資料思考的延伸,而是帶來企業以資料作為決策的輔助工具,讓你的公司組織運作起來更有效率! 今DSP智庫驅動和經理人月刊合作的課程很精采,課後仍有許多學員排隊等候與我們激盪不同的想法或想進一步學習其他進階內容,包含12/13 《R語言的探索之旅》也讓大家非常期待,不管學員們想要來課堂上課吸收新知,或是徵求企業內訓、企業諮詢的朋友們,如果有進一步需求,歡迎與我們service@dsp.im保持聯繫。

11/22 DSP資料狂想派對~感謝各界共襄盛舉

風和日麗的美好星期六,很高興能和大家聚在「天地人文創」,參加「DSP資料狂想派對」就是Opening Party,分享從社群走向公司的喜悅。 從Code for tomorrow和SYSTEX/Etu共同發起的子計畫Data Science Program開始,在這一年來,DSP成功舉辦數次規模不同的課程與主協辦、參與SmartGov政府開竅會議與Code for Healthcare工作坊等及Hackthon活動,而在各界絡繹不絕的需求之中,我們也發現作為社群不足之處,DSP 智庫驅動便誕生了。 活動一開始,由DSP智庫驅動大家長劉嘉凱(CK)為大家解釋何謂「資料思考」,也就是透過資料分析、發揮資料價值,來解決各層面的問題。其實資料與我們並不遙遠,只要用對方法,透過循序漸進學習,甚至進一步導入組織現有管理流程。 Johnson :

《R 語言的探索之旅》12/13 課程開放報名

[A0] R 語言的探索之旅 面對撲面而來的資料浪潮,包含 Google、Facebook、Intel、Pfizer、Bank of America 等國際級企業,都已經採用 R 語言進行資料分析,許多全球一流大學如 Stanford、Johns Hopkins 和 UCLA 也將 R 視為資料分析課程的先修科目。根據國際知名的 KDnuggets 論壇統計,R 語言已經連續三年獲得資料科學家最常使用的資料分析語言第一名的殊榮。 《R 語言的探索之旅》將帶領想要踏入資料分析殿堂的學員,從問題導向的資料萃取和資料清理開始,進行基本的統計分析與資料視覺化,再進一步探索資料的趨勢與潛在意涵。讓資料從生澀冷硬的數位食材,搖身成為風險評估與決策輔助的美味佳餚。   ■■■■■■  報名網頁:http://goo.gl/aJIeyF  ■■■■■■   課程特色 本課程屬於 《DSP…

是的!我想要用資料看世界

坐在金庫上面是什麼感覺,若是不得其門而入? 大數據超展開的時代,我們是資料的提供者,也是資料的使用者;是資料分析的受惠者,也是被迫貢獻的受害者。資料產生資訊、資訊萃取知識、知識生成智慧,於是我們的生活被資料所驅動著,企業或個人掌握越多資料,就越有主導的能力。 而你,今天「資料」了嗎? 如果答案是肯定的,代表你感受到這股如海嘯般巨量資料浪潮,感受到鋪天蓋地的資料分析行銷詞彙,感受到掌握資訊的種種好處。開始想學習、掌握、運用資料,讓生活變得更美好,主動或被動的。當然,身為勞工,或許只是想避免被這股潮流給淹滅。在老闆索取解決方案的時候,能夠理性解構問題,資料佐證邏輯。最好,能夠組織資料團隊面對更大問題。 是的,我想要用資料看世界 學習從來就不是愉悅的,但這次,DSP 與經理人月刊合作,省去艱澀學術詞彙,以資料思考為支點,資料分析技巧為槓桿,我們共同開設 11/27 統計+資料分析課程-《大數據時代的管理密技》。課程佐以豐富商業案例探討,例如如何運用資料思考架構,判別高價值顧客、鑑別叛逃客戶、建構搭售商品策略。 你,想用資料看世界嗎? 【課程資訊】 報名網頁:http://goo.gl/i0Kq9s 上課時間:2014年11月27日(週四) 09:00-17:00 上課地點:YOUR SPACE,台北市光復南路102號3樓 【課程大綱】 09:00-10:30 從資料思考到資料策略 10:45-12:00 問對問題的方法、最常用的資料分析方法 12:00-13:00 午餐 13:30-14:30 資料分析流程:蒐集資料、分析資料、解讀資料 14:45-17:00 商業個案研究 誰是肥羊客戶 誰是叛逃客戶 哪些商品可以一起搭售 【講師】…

Data for Social Good – 由資料驅動的公益新浪潮

掌握資料原力,並非企業的獨享權利。在國際上,不論是公共服務或是公益計畫,從分析現況、提升工作效率、服務創新到政策研究,有越來越多的案例顯示,成功的關鍵在於「善用資料、跨域合作」。 感謝網路星期二主辦的公益演講活動,讓我有機會分享一些國際案例,並加上個人很榮幸參與 Code for Healthcare 計畫的經驗,希望能讓「公共服務提供者」的想像力起飛。   Data for Social Good - 由資料驅動的公益新浪潮 from DSP智庫驅動   想參與後續活動的朋友,請訂閱 hackpad

DSP資料狂想派對

  資料的大量增長已經是事實,如何提取資料的價值,也成了社會、商業與政府的共同利益課題。綜觀資料價值的提取,資料科學的能量,在不同的領域,均扮演關鍵的價值轉兌力量。 資料固然很有價值,但是需要「人」去發掘、去運用。 為解決社會各界資料科學人才嚴重短缺的問題,全國第一家以培育資料科學人才為目標的社會企業「DSP 智庫驅動」(dsp.im) 成立了。 我們的三個發展方向: 透過教育訓練,培養資料科學家解決真實問題的能力。 提供顧問諮詢服務,協助商業、非營利或政府組織導入資料思考以提升營運效率。 發揮資料力量,解決社會問題。 我們誠摯邀請 DSP 的老朋友、想要探索資料科學的樂趣或是想用資料力解決社會問題的新朋友,前來與我們交流,聽聽我們的理想,瞭解如何參與,或是給我們一些指教。 活動資訊 活動時間:2014 年 11 月 22 日(六)14:00 - 17:00 活動地點:天地人文創(台北市齊東街 74 號 1 樓,捷運忠孝新生站 2 號出口,往齊東街7分鐘) 活動議程…

統計+資料分析《大數據時代的管理密技》11/27課程開放報名

DSP智庫驅動這次非常榮幸有機會和經理人月刊合作,共同開設11/27統計+資料分析《大數據時代的管理密技》來因應當代大數據之所趨,讓你學會判別誰是肥羊客戶、誰會叛逃、哪些商品可以一起搭售,尤其下半年有很多節慶活動,值得企業持續關注焦點。   當大多數的人聽到數字,統計就頭痛,這卻是身為經理人必備的知識,課程深入淺出,引導上班族找到問題,分析問題的方法,解決問題,是大數據時代下的管理必備課程。 從資料思考,資料策略,常用的分析方法到商業上常見的個案研究,讓你成為資料分析高手,輕鬆管理大數據。我們致力於培養資料科學家,養成以資料解決解決真實問題的能力,資料科學家是未來的十大熱門行業,盡早入門,為自己培養今天的工作能力,明天的競爭力。   【課程大綱】 09:00-10:30 從資料思考到資料策略 10:45-12:00 問對問題的方法、最常用的資料分析方法 12:00-13:00 午餐 13:30-14:30資料分析流程:蒐集資料、分析資料、解讀資料 14:45-17:00商業個案研究 誰是肥羊客戶 誰是叛逃客戶 哪些商品可以一起搭售   【講師資訊】 劉嘉凱(CK):企業資料策略分析專業顧問 謝宗震(Johnson) :DSP資料科學家 清華大學統計學博士 吳柏翰(Jerry) :DSP資料科學家   【課程資訊】 報名網頁:http://goo.gl/i0Kq9s 上課時間:2014年11月27日(週四) 09:00-17:00…