一月 2015

View all on this date written articles further down below.

R語言大進擊!奮進的DSP Data Camp@NCCU

經過一天半的集中訓練,將各位學員的 #R語言 從基礎到Regression的潛力都迸發出來,也讓同學再行檢視第一天所構思的主題是否已釐清問題與細緻化,接著開始試做小部分資料集,把內部資料集與外部資源重新整合好達到產品的最小可行性。明天就要正式上場的成果發表會,今(1/21)看到同學們努力奮進地再探過程囉! 1.「我愛劉金標」   2.「Ubike微笑調度」   3.「叫我包租婆」   4.「You-UBike」   5.「DSP學生省錢大作戰」   更有趣的內容,敬請明天繼續期待最終回DSP 資料科學冬令營,無緣沒跟上隊的朋友不要氣餒,1月底還有4天的《A1: 資料分析基礎班》,座位有限趕緊報名吧! 註:成果授權方式:各組產出作品成果歸屬該隊成員共有,他人若轉載或引用在商業用途,請務必取得作者同意並註明出處。 進擊的資料分析班 >> 《A1: 資料分析基礎班》顛覆傳統的教學方法,透過四天的密集課程,從資料思考的訓練開始,使用適當的商業案例與分析工具,帶領學員由淺入深,探索資料內涵,瞭解並描述資料與資料之間的微妙關聯,進而建立解釋資料趨勢的統計模型。最後,經由分組合作,綜合演練所學,完成一個小型專案。 開課時間:2015年1月31日、2月1日、2月7日、2月8日 詳細資訊

快樂的寒假熱活學習就在DSP Data Camp @NCCU

今(1/19)來自來自台北、新竹、台南、高雄以及屏東各地的同學們,一起聚集在政大DSP 資料科學冬令營邁向 #資料科學家 的路徑,首先#NCCU 陳百齡老師勉勵大家在這個創新的實驗會有不同資料的火花呈現,接著DSP CK和同學們說明這4天的遊戲規則,相信戳合不同背景、專長、性別的多元思維,這番資料思維大作戰將會很有趣。   一開始熱鬧登場的講師Rafe帶著各位同學用 #群眾智慧 一起來重新想像定義到底什麼是 #資料思考 ,由邏輯、有資料分析、有理論基礎下如何有個聰明的開始,才能從Data到Information往Knowledge進行。即便在強大的Coding找出解決問題的一個「點」之前,仍應該要先釐清定義好問題,能從Mind Map爬梳你的TA在Low power單一訊息要如何往High power移動,找到真實的Root Cause。當中有位同學舉例了在他創業中真槍實彈的經驗,促成他很想要來參加冬令營的重要理由,就是極度需要在 #商業模式 前驅動作的 #資料分析能幫助釐清大前提以便優化轉換率,來看看Code for Healthcare經驗什麼是達到好的混搭 mash up。   下午緊接登場的Alto老師告訴我們如何從雜亂無章的資料中,能夠找出創新的想法後再重新分類,例如紐約311一張來電圖就能表達時間、比例、項目等,逐年檢查後仍被客訴最多的項目,未來可能將被優先立法的方向。現在Big data的時代可同時讓線上調教的工具相當多元且更簡易,而對於所蒐集到資料的方式,一定要反覆去詢問及檢視,同學不妨也可以進階學習如Vlookup等功能,把文字資料抓進來後要有效率如何整理,如果出現規律就應該檢視這個區塊,例如利用3個資料集開始進行更聰明的分類,檢視像是排序是否有可能重複或是有些空格有特定意義,每次都要思索做完後是否還可以聰明再進化。   各組第一回初步發想: 「叫我包租婆」 「省錢大作戰」 「U Bike微笑調度」…

如果這輩子只能選修一堂硬派的資料分析課程

根據 LinkedIn 最新統計,「資料分析」名列該網站全球熱門工作技能排行榜第一名,比各種資訊工程開發管理的技能還要搶手。     資料科學不但橫跨多個領域,而且觀念和技術一直與時俱進,這對想入門的初學者可能是個頗大的困擾。試想這個情境:你是一位職場新鮮人,在學期間可能曾經學過(或是聽過)一些資料處理和分析的知識,例如:程式語言、數學統計、計量方法、機器學習甚至是資料探勘,因為興趣或是求職的需求,現在決定要認真學習資料分析。 你將會面對以下的考量: 學習地圖 教材選擇 課程規劃 工具 實作練習 同儕討論 教練或導師 現在市面上有很多內容相當豐富的線上課程,我鼓勵大家盡量嘗試。若你能努力自學,循序漸進認識資料分析的基礎理論和技術,恭喜你。 若你想浸潤於一個可以和同儕切磋、與講師互動討論的環境,或是在很有限的時間內獲得最大的學習效果,挑選一個適合自己學習風格的實體課程,或許是個不錯的選擇。 若你想要在極短時間內吸收高強度的知識,從實踐中體驗資料真理並且享受資料分析的樂趣,而非「光聽不練」,那麼,你可以考慮加入 DSP 的課程。 不過,這時候你可能又會面臨一個新的問題:DSP 針對「資料分析師」的養成課程眾多,從淺到深,有工具上手課、資料分析基礎班、進階班等等,究竟應該在哪個階段才進來上課? 我個人的建議: 從DSP 學習地圖來看,最淺或較深的課程 (即 DSP 的 A0 或是 A2…

[標案松] 當我們駭在一起

DSP 獨步全國的「標案松」,圓滿達成首發任務。 資料科學家們若想發揮所學貢獻社會,透過資料分析找出政府公共服務的趨勢、罩門或改善契機,會是一個很好的切入點。 這也是我們舉辦標案松的理由之一。 其他理由包括: 找個漂亮的藉口,讓來自各地或是各行各業,素昧平生的資料愛好者在假日齊聚一堂 共同合作一些小型資料專案,切磋交流 用資料力作公益 這是我們第一次試辦,而且礙於場地限制,只能讓三十位朋友參加。 短短一天之中,大家做出了許多精彩成果: [校園採購比一比] 針對經常被忽視的學校採購案進行探索,發掘最常出包的標案類型,例如營養午餐或師生旅遊 [圍標檢測] 透過異質資料的交叉分析,嘗試找出廠商圍標的群聚 [反圍標小幫手] 根據決標資料,嘗試找出廠商圍標的模式 [開放採購之資料標準] 將我們政府採購資料庫的資料格式轉化為國際上正在推動的 Open Contracting Data Standard. [發包不出包] 從政府採購的廠商黑名單著手,逆向回推失敗廠商的行為模式 關於標案松的更多詳情,請參考以下連結: 標案松:入口網頁 標案松:共筆紀錄 政府採購決標資料集

《A1: 資料分析基礎班》開放報名

企業已經逐漸掌握資料蒐集與儲存的方法與工具。然而,隨著資料日益增長與龐雜,如何從資料找出問題或商機,卻是越來越艱鉅的挑戰。因此,「統計分析與資料探勘」成為目前全世界最搶手的工作技能,也就很容易理解了。 面對堆積成山的資料原石,這些資料分析師,專注於運用資料思考方法,發揮一點點巧思,將資料逐步琢磨為讓人眼睛一亮的寶石。 《A1: 資料分析基礎班》顛覆傳統的教學方法,透過四天的密集課程,從資料思考的訓練開始,使用適當的商業案例與分析工具,帶領學員由淺入深,探索資料內涵,瞭解並描述資料與資料之間的微妙關聯,進而建立解釋資料趨勢的統計模型。最後,經由分組合作,綜合演練所學,完成一個小型專案。   —-> 前往報名 <—-   【課程目標】 學員應該自我期許,達成下列學習目標: 認識資料思考的方法 製作可以再利用的資料分析程式碼 (reproducible code for data analysis) 資料匯入與整理 探索式資料分析 基本統計分析 假設檢定 迴歸分析 小組合作,從頭到尾完成一個資料專案   【上課時間與地點】 時間:2015 年1月31日、2月1日、2月7日、2月8日(連續兩個週末,共四天,每日10:00 - 17:00)…