八月 2014

View all on this date written articles further down below.

《第一次畫地圖就上手》課程開放報名

我們生活中所產生或是遭遇的資料,例如人口、交通狀況、土地使用、自然生態與環境、疾病傳染、氣象擴散、災害區位甚至是公共管線分布,很多都和空間有著密切關聯。地圖是構成地理資訊的重要元素,也是表達空間分佈資訊的y重要應用。在實際生活中,我們默默享受了眾多空間資訊所提供的服務,例如導航應用分析、社交網路打卡服務、網路熱點、旅遊網誌,或是常見的「等公車」其實都跟 GIS 的服務息息相關。若想要愉悅地開始使用這些地理資料,最好先學習兩種知識:地圖和地理資訊系統 (Geographic Information System, GIS)。地圖,可能要包括學習如何「看」地圖和「畫」地圖兩部分。至於 GIS,則是一門整合測繪製圖、資料庫系統、資訊發展、電腦圖學與專業整合的技術。對多數人來說,GIS 是一個不易進入的領域,並不容易取得與應用,因此,本課程的設計為入門級學程,將從介紹地圖與地理資訊系統的原理與基本應用,並帶領學員以個人實作的方式,蒐集、處理、分析及整合地理空間資料,以繪製主題式地圖,完成自己的 GIS 專案!課程目標學員應該自我期許,達成下列的學習目標:瞭解地圖與認識地理資訊系統基礎學會蒐集與分析基本的地理空間資料學會繪製主題性地圖、說地圖故事 課程大綱地圖學基礎介紹GIS 概論GIS 工具與系統環境準備實作:主題地圖製作地圖類型點類型資料應用面類型資料應用資料蒐集與工具應用地圖雲服務的應用(資料和工具) 課程報名上課時間:2014年9月27-28日,10am-5pm上課地點:台北市內湖區瑞光路 318 號(精誠資訊大樓)報名網頁 

如何創造一個由資料驅動的社會、產業、城市與國家

在這個「資料科學」的各種關鍵字(例如巨量資料、開放資料、智慧城市和物聯網)被炒作到歷史高點,成為商業、政府治理、科學研究或是高等教育的顯學或潮學的時節,我很感謝 2014 台灣資料科學愛好者年會的邀請,讓我有機會分享對於創造資料價值、資料驅動的商業管理或政府治理、或是人才培育的一些看法。 我的演講內容大綱如下: 資料科學在台灣,目前只是一種「幻覺」。 想要改善現況,創造真正的「市場」,其實是有方法的。 透過 Code for Tomorrow / DSP 的交叉火力支援,我們設法分頭並進,促成跨界交流、體驗資料價值、展開實際的討論、並開始一點點改變現況的嘗試,這些方法包括: 開放發展(利害關係人,大家一起來) 激發資料價值(開放體驗資料應用的價值與潛力) 資料科學教育(有節奏、有系統地訓練各種專長的資料科學人才) 拋磚引玉之後,期待各界先進給我們指教,甚至討論各種形式的合作! 簡報檔如下。

資料科學 in 白色巨塔

身為一位統計背景的資料科學愛好者,能夠應用所學來回饋社會是多麼興奮的事。日前到高雄參與 Code for Healthcare ─ 以醫療為主題的跨領域 hackathon,正是貢獻所學的機會。這樣的場合參與成員至少包含:高雄氣爆的受災戶、第一線的救災、醫護人員、醫事、醫務管理人員、資料科學家、系統工程師、設計師。 資料科學是一門實實在在的入世學問,理論與技術專精的資料科學家能夠與第一線的 domain experts 進行團隊合作才能完全發揮該學門的精神。前線人員提出他們面臨的真實問題,透過跨領域團隊合作才能夠提出確實的建議。譬如在這兩天的時間中,我所參與的兩個團隊分別提出: 高高屏地區緊急醫療能量的初步估計模型; 利用醫務管理平台的數據提出改善現有流程的建議。 已故劇團國寶李國修先生曾提到:「一輩子做好一件事,就功德圓滿」。透過跨領域的交流,讓不同領域的專家能協力合作,如此一來,成就的豈止一件好事? 本文同步刊載於《讀數一格》。

橫看成嶺側成峰,遠近高低各不同,未識故事真面目,只緣身在資料中

今(8/3)延續第二天的 DSP 課程「看資料找故事工作坊」,一開始由講師嘉凱和柏翰先幫大家暖暖身,複習昨天實作重點,緊接著學員們腦力激盪與資料產生火花,好構思 team project 發展主題。 一個精彩的故事值得傳頌千古,話說好久好久以前… 但同學們謹記在 pitch 前,先思忖清楚在採購資訊生命週期中,將檢視標的範疇、時程、金額等關鍵欄位哪些是必要或需求的資料盤點,及該用哪個解決方法。有趣的是在聚合多面向資料時,如何將洋蔥層層剝開不流淚,問對問題、找對方向、發掘關連,好在開放資料與海量資料裡直指文本分析脈絡而不迷路。 當各組發表專案主題時,關注面向豐富多元各有巧思極具創意,例如工程類、教育類、標案類等,此時功力深厚的助教們隨團協助辨識出真議題,幫助各組直指核心問題及實作轉換資料時困難之處,在這些饒富趣味的議題建構下,不斷反覆在假設與驗證擺盪,運用邏輯不斷檢視正確性,或是純屬訛誤非異常。一張好的圖表勝過千言萬語,但發現冰山底下的關鍵指標卻往往更驚人,交織出的數字與故事抽絲剝繭,即將發現潛藏的意義。 在有限的寶貴時間裡,大大小小的資料與圖表交疊,各組發揮創意,點出幾個大重點實屬不易,只能說橫看成嶺側成峰,遠近高低各不同,未識故事真面目,只緣身在資料中,值得後續再追蹤觀察,各組重點如下: Love TW愛台十二建設:試圖整理標餘款與機關關係。 公務員出國追追追:歸類考察事由、地點等。 孩子的教育不能等:關心教育建設的資源配置。 95281:欲追蹤限制性標案分類情形。 誰在做豆腐渣工程:匯理最低價得標者與稽核情形。 最後,由講師宗震及其他講師、助教分享個人學習歷程,期許學員們能夠成為全方位資料科學家,統計、程式、專業三大項度中扣合深度,這是一條提升層次的必經要道,經過這一番學習洗禮,相信大家不僅能成為 sexy 的資料科學家,還能有所收穫再上一層。

千萬資料可以化約成幾個數字,但每個數字背後都有一個故事

這是最好的時代,也是最壞的時代;這是智慧的時代,也是愚蠢的時代;這是堅信的時代,也是疑慮的時代;這是光明的季節,也是黑暗的季節;這是希望的春天,也是絕望的冬天;我們什麼都有,也一無所有。ー狄更斯《雙城記》 在波濤洶湧的時代浪潮下,更值得我們用心省思,該用什麼角度來關懷這個社會,例如前(7/31)發生高雄氣爆事件損失重大,然而 Code for Healthcare 更早前於高雄開始關注醫療品質改善相關議題,這次事件讓更多朋友挹注關心,欲知善用資訊可以更有效率協助更多需要幫助的待援角落。試想如果我們能善用資料科學,用真實的資料爬梳出背後,來驅動改善週遭的大小環節,或許每個人的小日子在大時代底下,可以過的更從容自在,讓生命的故事更有意義又精彩。 今(8/2)由 Code for Tomorrow 籌備委員會與 精誠集團/Etu 所共同舉辦的 DSP 課程「看資料找故事工作坊」熱鬧登場,此次有許多各界菁英與會聆聽,這次使用的資料與機關採購相關,這麼酷的事讓每個人都聚精會神聽得津津有味,眼睛都亮了起來! 首先登場的講師 Code for Tomorrow 的徐子涵,帶領大家從資料當中找出故事的脈絡文本,可觀察英美數位媒體發現許多趨勢並非舊事,多能善用資源經營更細膩的環節,學員們如能從本身的背景 Know How 探索出問題就是莫大的價值。我們試圖讓說故事從策展的角度整套流程出發,找出以人為本的相互關係,爬梳環環相扣的故事情節。 故事揭開序幕,回想英國衛報1821年5月已有了開放資料的雛型,至今 WikiLeaks 所帶來的資訊衝擊,試想當媒體在關注特有議題時,會如何處理機密摘要欄位、特有術語等以正確解讀資料數據,則需要一群具有專業素養的團隊來層層解構。現今頗值得思考,媒體在組織上該有什麼結構性的變化,有什麼流程可以自動化或外部化,以幫助在龐大真實資料樣貌中,獲取實質意義與價值。 緊接著,由講師台大天災中心博士後研究員李孟學,剖析政府採購與資料科學之間耐人尋味的故事,試圖幫大家從採購資訊生命週期中,激盪出不同層次值得省思的議題。說故事之始就要反覆提問,何謂廠商專業度、機關的執行能量、施工查核檢視品質或是否有異常等結構性議題,可以從緊湊扣合的流程中釐清出些許蛛絲馬跡,在每個冰山一角的底下還有許多可以解構的真實,由資料科學角度來做政府採購預警藍圖,便可以降低不確定及詭譎的因子,讓採購風險做好更完善的防弊措施。 下午開始,由講師清華統計所博士後研究員謝宗震和學員們講解,如何用好的研究方法探索資料,透過反覆觀察千萬資料,替資料把脈找出故事脈絡。探索資料型態時,講師提醒學員在觀察單一變數時,謹記著區分類別型資料及數值型資料的要訣,以及當使用不同的圖形技巧時,為何可以看出同樣資料但是有不同解讀的端倪。 另外,還有一些小訣竅值得注意,例如南丁格爾玫瑰圖並不是圓餅圖,而是扇形圖拉,小護士不只是小護士,南丁格爾當時已能將數據視覺化。講師很認真和學員們說明先要探索問題目的,是要做對照、找關係、看趨勢,才選用哪些合適的技術性方法和資料與之交疊進行分析。期許學員們身為資料科學家就要像廚師一樣,看再多的食譜也還是要親自下廚,才知道練好功夫的真方法。 最後,由講師 Code for Tomorrow 的劉嘉凱分享該如何看資料找故事,就從探索性資料的實作下手,學會如何迅速掌握資料的脈絡與結構。最關鍵的第一步按圖索驥盤點資料,大家一起來玩資料吧!先用公式取出所需要的資料欄位,再篩選分析進行標的分類,雖然大家原背景及所學程度不一,過程中難免會有卡卡小挫折,但這時實力堅強又可愛的助教群紛紛下場協助救援,所以同學們都不用擔心啦!嘉凱老師很細心地一一說明,在轉換中經常發生的Tips該如何處理才適切合理,減少大家走冤枉路的時間,各位朝下一步奮進吧! 今天課程結束前,DSP 學員們還認真地思考推敲學習目標所對應到的資料與項目流程,相信產出結果會非常精彩,敬請期待!