十月 2014

View all on this date written articles further down below.

資料科學的學習許願清單

由於想要跨入(或是剛剛入行)資料科學領域工作的人專業背景相當繁雜,而資料科學又是一個跨越多個傳統知識範疇的新領域,因此 DSP 希望集思廣益,瞭解不同專業背景者的學習需求,進而邀請各界專業人士,共同設計對應的課程。 開放諮詢主題:資料科學的個人學習地圖 開放諮詢時間:發佈日期開始隨時可以提出建議,之後將定期彙整需求,擇期公開報告。 許願範例: 聽說資料科學家是 21 世紀最性感的職業,我是管理學院畢業的,從來沒寫過程式,究竟該如何入門呢? 我是資工系畢業,會寫 PHP (or Python) 程式,想要學習爬資料、清資料的方法。 我是電子商務公司的產品經理,只會 Excel,想要學習如何從營運報表中找到問題,發現商機。 我是視覺設計師,由於工作需要,想要學習如何使用 d3.js。 我從事統計分析工作,由於公司沒有買我最會用的套裝統計軟體,因此想要學學 R 語言。 我服務於某某 NGO(環境、教育、婦女、兒童等等),我們組織擁有多年又大量的個案資料,卻不知道該如何使用。我該學哪些知識,才能解決這個問題? 輪到你囉!歡迎使用下面的留言版,開始許願!   (Image Credit)

群策群力,勇踏前人未至之境

「資料的大量增長已經是事實,如何提取資料的價值,也成了社會、商業與政府的共同利益課題。綜觀資料價值的提取,資料科學的能量,在不同的領域,均扮演關鍵的價值轉兌力量。」 基於上述前提,Code for Tomorrow 和 SYSTEX/Etu 共同發起了《DSP 資料科學計畫》,從 2013 年 9 月開始公開籌備,12 月舉辦第一次課程,到現在剛好滿一年了。 在這期間,我們不但成功舉辦過五次訓練課程,更主辦、協辦、參與甚至是贊助眾多既精彩又有意義的社會性活動,例如《SmartGov 政府開竅會議》和《Code for Healthcare 工作坊》,或是實踐開放資料應用價值的《Data Fiesta 資料狂歡節》,還接受各地區企業、大學和大型會議邀請,分享推動資料科學訓練的經驗,讓各界人士逐漸體認到資料科學其實並不遙遠,只要用對方法,是可以循序漸進學習,甚至是導入組織現有的管理流程。 由於來自各界絡繹不絕的需求,原本以社群模式運作的計畫已經不敷使用。因此曾經參與本計畫工作的夥伴們決定共同出資,成立一家「以資料力改變社會」的社會企業,希望能運用商業模式,串連世界各地的資料科學家,共同協助社會、政府和企業培養資料人才,提煉資料價值。 於是,「DSP 智庫驅動股份有限公司」在 2014 年 10 月誕生了。 我們設定了三個長期發展目標: 透過教育訓練,培養資料科學家解決真實問題的能力。 提供顧問諮詢服務,協助商業、非營利或政府組織導入資料思考以提升營運效率。…

資料力,做公益

在 DSP,我們除了教導現役的資料科學家如何增強功力或是培養未來的資料科學家,更不斷思考要如何才能讓這群資料科學家得以發揮專長回饋社會,「用資料力做公益」。 Data for social good 是一個方興未艾的浪潮,正在世界各地快速擴散中。 隨手舉幾個案例: 社會福利 分析城市內的遊民如何使用政府或民間組織提供的社福資源,找出政策改善的關鍵要素。 協助某 NGO 評估其針對「低收入、新手媽媽」提供的護理照顧服務的成效。 環境保育 運用感測器資料,描繪火山口的生態系分布狀況。 教育 根據社會經濟統計資料,找出兒童教育資源最貧乏的區域,讓非營利組織前往協助。 幫助公立學校改良影響學生學習進展的「預警指標」,期能盡早發現需要特別幫助的學生。 醫療衛生 協助政府部門透過資料分析找出可能含鉛的房屋,以便派員實地檢測。 分析歷史資料,嘗試找出改善醫院急診室醫療品質的方法。 智慧城市 協助政府機關分析空屋歷史資料,瞭解空屋的特性,以為擬定未來政策的依據。 協助當地政府分析財政資料,以找出開源和節流的方向,減輕預算拮据的壓力。 因此,我們正在規劃推動相關系列計畫,暫名為「非營利組織:資料培力計畫」。 我們非常感謝推動社會公益一向不遺餘力的「網路星期二」已經響應這個構想,將 11 月份的聚會主題定為「Data for Social…

DSP 週年慶:計畫進度報告

DSP 滿一週歲了。 若從去年九月的公開籌備會議算起,DSP 已經滿一週歲了。 在過去一年之中,我們不但成功舉辦了五次的課程,更主辦、協辦、參與甚至是贊助了眾多的公開活動。(如下圖) DSP 計畫是眾人努力的成果,取之於社會,當然要用之於社會。 在過去一年中,我們維持承諾,在每期課程保留三個學費全額補助名額給政府或是非營利組織工作者。 此外,扣除全部開銷,我們還剩下大約四十萬元的結餘款。(細目) DSP 計畫即將轉型,朝一個嶄新的階段出發。 我們想邀請大家集思廣益,幫忙想想要怎樣運用這筆預算,透過 Code for Tomorrrow,替社會做點小小的貢獻。(共筆討論版在這裡)

自我挑戰,更上一層樓

當你的服務受到市場肯定,因此開始提供更多元的服務,雖然熱鬧風光依舊,但是似乎開始有些對焦不順的感覺,該怎麼辦? DSP 一開始很單純,只有《團訓班》一種課程,而課程的設計原則是基於「如果一輩子只能上一堂資料分析課」的前提。後來,我們陸續提供新的課程,例如《資料爬理析 Python 實戰班》、《看資料找故事》等等。 課程選擇增加,固然滿足了一些人的學習需求,卻意外造成另外一些人的困擾。不只一位學員問過「我究竟該學哪一門課」或是「我該先學哪一門課」之類的問題。甚至還有企業的老闆問我:「我究竟該派員工去上哪一門課才對?」 這是一個警訊。 因此,我們決定先暫緩開課的腳步。停下來想想下一步該怎麼走,才能超越自我,更上一層樓。 今天秋陽高照,我們和一些對資料科學推廣教育有著共同熱誠的朋友相約於淡水河畔的關渡自然公園。一夥人迎著徐徐涼風,伴隨著蟲鳴鳥叫,重新檢討最基本,也是最重要的學習地圖。 在大自然的懷抱裡,眾人果然妙思連連,靈感不絕。從如何彌補學校教育之不足、滿足業界工作具體需求、各種資料工具的使用、到如何提升學習效率,均有所探討。最後,更是將討論收斂為一張「資料科學學習地圖」。 這張學習地圖將會對映到所謂的資料科學流程 (the data science process),不但能讓組成資料科學團隊的各種角色,清楚掌握本身的相對定位以及發展軌道,還可以讓 DSP 在研發課程時,更精準地定義範疇以及目標受眾。 師者,所以傳道、授業、解惑也。 值此教師節前夕,我們雖不敢以師自稱,但是仍然自我鞭策,要把「傳道、授業、解惑」做得更好。 請大家拭目以待!