資料思考

資料科學,打火救人

對抗火災的最佳策略是採取預防性攻擊,防患於未然。 若用資料科學的語言描述,就是定義問題、資料盤點與清理、分析建模、預測、決策支援。 以高雄市為例,每年的火災案件不到一百件,但是消防隊員還是忙不完。 有一個重要的原因是雖然每年「火災」數量不多,但是「火警」的案件卻是數以千計。 火警和火災,差別只在一線間。家中瓦斯爐燒開水未關,鄰居報案後,消防隊來得及破門而入關掉瓦斯,就只是火警;來不及關掉,就可能演變為造成生命與財物損失的火災了。 不論火災或火警,其危險因子(例如起火原因、建築物特性、人口特徵等等)可能都是共通的,若能評估火警風險,或許就等同建立了火災風險模型。 這即是 D4SG 資料英雄計畫「火災風險地圖」專案正在設法解決的公共問題。 我們很榮幸與高雄市政府消防局合作,號召一群「用資料力做公益」的資料英雄,利用週末和晚上,共同分析過去數年的消防案件,從無到有,開始打造台灣第一個「資料科學,打火救人」的實戰經驗。 高雄,加油!   相關資訊: D4SG 計畫 打火就打火,談大數據?

2016 DSP 資料科學夏令營,參與學員的真心話

「2016 DSP資料科學夏令營@NCCU」圓滿落幕囉,這次DSP找來實力與中二程度兼具的講師群,讓同學們在緊湊扎實還累到爆的營隊中縈繞著歡笑與淚水。同學們在各組專案的表現真的是讓大家驚呼連連,這幾天陸續收到同學們的真實心裡話,這些真讓DSP的講師群們非常感動唷~ 政大公行,積極進取的同學A: 受到會計老師的啟發,對於 R 語言產生了好奇心,並報名這次四天的夏令營活動。第一次參加短期專案報告的營隊,很充實也學到多過去未曾學習到的知識,講師的實務經驗豐富,提供我對於資料分析與統計知識應用更多的想像空間,助教和藹可親,用心幫我們 debug,不同背景的組員們互相學習同心協力,在短時間內分工合作完成一份不錯的成果,這四天收穫良多,奠定了不少寶貴的 R 語言基礎,很棒的活動。 政大MBA,群策群力的同學B: 對我來說,參加這次的營隊是個很好的學習過程。提供了一個自我檢視的機會,解決問題、執行能力也會受到考驗。在極短的時間內,需要大家跨領域合作能力與專案管理能力。了解自己在完成專案的過程中,應該在團隊裡扮演甚麼樣的角色,並更明確知道自己的長處與不足之處,藉以做後續的加強或補足,抓住自己在團隊的定位。 由於學員的背景差異很大,講師和助教非常專業能夠幫助不同程度的人都能在課堂上有所收穫,而最重要的是助教的專業也讓大家可以從過程中得到一些很立即的幫助、建議,可以感覺到助教十分用心解決學員問題,並營造非常愉悅的學習環境,讓沒有基礎的同學在面對 R 語言時也不會害怕或抗拒,相信對於和我一樣沒有程式背景的同學也會因為助教的熱誠與專業而更加喜歡 R 語言的魅力! 輔大企管,學習不倦的同學C: 為期四天DataCamp@NCCU在掌聲與歡笑中完美落幕,從Day1的懵懂到現在終於有了成長的感覺,LEVEL UP+。感謝強大的助教群的耐心教學,你們給的comment跟經驗談真的很棒!! 謝謝組員們強的carry,沒有你們沒有最後的成果 GOOD!! 在各路高手中能成為一個TEAM既是幸運也是緣分,相互交流的感覺真的很開心,我們的成長也隨之而來。 雖然每天跟專案時間賽跑超超超超超超超累 = =+ 但看著生命在燃燒卻又綻放如煙火般的絢爛奪目,心中真的是有無限的滿足與感謝,腳踏實地享受生活的感覺真的頗爽的XDD 哥學的不是coding,是一種態度 逢甲資工,全力以赴的同學D: 終於回台中了,四天先感謝組員carry,每天7點多起床2點多睡覺,整天盯著電腦有種已經開始上班的fu,台北真的是一個好地方,每個人都有自己的想法,看事情的面向也差很多,認識了不少新朋友,希望未來還有機會再見面。 淡江統計,努力上進的同學E:…

大象學跳舞

跟不上,就淘汰! 身為歷史悠久,業務既多且雜的市場長期領先者,要如何跟上國際潮流,提升員工的資料素養,進而為組織注入企業創新的基因?這是我們經常被客戶問到的問題。 在物理學上,所謂「行動慣性」(active inertia) 是指移動中的物體傾向於維持現有的行進軌道。這個概念,後來被時任美國麻省理工學院的企業管理學者 Donald Sull 借來描述企業因循既有行事方式的行為,甚至在面對具破壞性的變化時,仍沿用過去的成功模式來因應,最後落入失敗的陷阱。 很諷刺地,企業的行動慣性通常是由過往的成功經驗所造成。 在舊時代用血淚鍛鍊出來的企業文化與作業流程,促成了企業今天的偉大成就。然而,這些經驗卻往往是組織在面對新時代挑戰時的枷鎖,導致企業無法敏捷地嘗試創新。最好的狀況,是慢慢凋零;最壞的狀況,則是被市場淘汰。 至於企業究竟該如何避開行動慣性的陷阱,Sull 和 Clayton Christensen 早在1995年時就有過一場精彩的討論。Christensen 則在幾年後建立完整的論述,正式提出知名的「破壞性創新」理論。 我們有些客戶,組織龐大、人員繁雜、而且科層分工明確。全公司從上到下,以能夠徹底執行公司營運總部所頒佈的工作準則為榮。 精實,甚至是通過多種國際認證的管理方法,讓這些公司的營收都達到令人敬佩的程度。 但是在面對「運用數據,敏捷創新」的國際趨勢時,這些公司的原本優勢突然不再有明顯作用,甚至開始變成發展的阻力。 在DSP智庫驅動,我們很榮幸能和客戶攜手合作,共同成長。在客戶嘗試轉型的過程中,提供資料分析以及建立資料團隊方面的顧問諮詢服務。 綜觀我們客戶的轉型經驗,可以歸納出兩個成功因素: 跨部門的資料盤點 運用資料,促成跨域交流合作 在大企業內部,不論是生產、行銷、業務或是其他部門,都各自有著相當程度的資料蒐集與儲存流程。但是彼此間的資料流通卻不易達成,因此被稱為「數據孤島」(data silos)。 若能在這些數據孤島之間建立流通的「橋樑」(可能是資訊系統,也可能是某些經過良好訓練的員工),就成功了一半。 其次,透過執行內部或外部專案,讓各部門之間有機會共組夢幻球隊,一起打幾場精彩的比賽,就拿到成功的另外一半了。 至於組隊方式,則視企業狀況而定。有些企業採取任務性編組,有些則乾脆從各領域部門挑選菁英,成立新的部門,直接對集團最高層的專業經理人負責。 以中華電信為例,業務涵蓋固網通信、行動通信,以及數據通信三大領域,員工超過兩萬人,組織架構除了總公司之外,還有多個分公司、電信研究院以及電信學院等單位。去年DSP智庫驅動協助該公司執行一項前所未見的企業內部資料科學訓練計畫,稱為「資料科學種子團隊培訓計畫」。由各事業單位遴選「種子」參加培訓,訓練內容包括業務應用、量化分析與資訊科技。通過長達六個月的訓練課程,成果相當豐碩。在去年的人才培育基礎之上,今年中華電信更上一層樓,進行組織改革,在公司總部正式成立「大數據辦公室」,目前有數十位成員,集中在大數據分析技術以及業務應用的相關資源,應用於內部業務與未來發展。 上述兩個成功因素,推動上未必有先後順序,但是具備高度關聯,缺一不可。…

災情大數據的隱藏性偏見

  (提示:地震訊息多的地區未必比較嚴重。) 2012年襲擊美國東岸的珊迪颶風 (Hurricane Sandy) 是當年最嚴重的風災,造成的損失甚至比2005年淹沒新奧良市的卡崔娜颶風更慘烈。 當時有人根據 Twitter 和 Foursquare 的資料,分析紐約市的災情與災後復原情形。[1] 也有人根據 Twitter 訊息,呈現各地停電和復電的即時狀況。[2] 然而,若僅用社交媒體的資訊估計災情分布,可能會有所偏誤。畢竟,都市地區的人口數和隨之產生的網路使用量都比偏遠地區多。[3] 戒之、慎之。 參考資料: Extracting Diurnal Patterns of Real World Activity from Social Media Power Outage During…

緊急醫療,資料一線牽

為改善緊急醫療品質,高雄市政府消防局、高雄醫學大學附設醫院(高屏澎醫療網)、高雄市政府衛生局、台灣外傷醫學會和DSP智庫驅動攜手舉辦「緊急醫療資料動線地圖工作坊」,邀請消防、衛生、醫療以及資訊科技等領域先進跨界合作,齊力盤點散落於各機關的相關資料,探討資料整合的可能性,進而勾勒出緊急醫療的未來發展方向。     就病患的角度來看,緊急醫療應該要同時涵蓋「緊急救護」和「急診醫療」兩個環節。但是,就主管機關而言,消防體系、衛生體系和醫療體系卻經常是三條平行線,老死不相往來。 有鑑於此,這次工作坊分為兩組進行,分別探討「消防急救」以及「從救護車到急診室」的資訊溝通現況,並繪製相關的資料動線。 「從救護車到急診室」這一組,參與成員包括衛生局、消防局、醫院以及資訊科技學界與業界代表。由於參與者皆具有豐富的實務經驗,因此僅經過一小段看似離散的討論,就很快描繪出目前的緊急醫療資料動線。     從上圖可以看出,各個緊急醫療環節的資料管理機關並不相同,彼此間也缺乏資料交換的機制。因此,若想要針對特定病人,重建其「顧客旅程」,在現行架構下無法實現。 考量執行的成本與可行性,「從救護車到急診室」這一組提出下列建議: 「事件代碼」(Event ID) 目前救災救護指揮中心每次接獲民眾通報,均會建立獨立的事件代碼。 隸屬衛福部的緊急救護系統也是根據該事件代碼登錄案件。 因此,應該設法讓由醫院端負責的各類病患紀錄系統也能同步記載該事件代碼,才能串連病人的急救與健保資料,以呈現每次急救事件的全貌。 病患手環 為了促成事件代碼的串連,可以考慮採用條碼列印的拋棄式手環(類似醫院內常用的病患手環)。 如何從救護車裡面即時列印不重複條碼、如何掃描紀錄該條碼資訊等技術問題,市面上均有相當成熟的應用技術。 減少重複登錄資訊 指揮中心派遣紀錄與緊急救護系統,既然在理論上已經可以「事件代碼」互相串接資料,就應該檢視兩套系統目前所需要填寫的各項欄位是否有重複,並評估減少欄位數量的可行性。 緊急救護資料之在地備份 根據目前作業流程與規範,地方消防局將資訊填入衛福部的緊急救護系統之後,並無存取本身資料的權限。 可能解決方法:(1) 要求衛福部開放地方消防局使用自身資料的權限;(2) 地方消防局在上傳資料給衛福部的同時,同步將資料寫入自家的資料庫,以便日後使用。 上述建議均為戰略方向性的指引,而非技術細節的討論。雖然未臻週延,但若能持續討論,將能為台灣僵固沈悶的緊急醫療體系打開一扇充滿發展契機的大門。   註:本文為2015年12月25日在高雄市政府消防局舉辦之「「緊急醫療資料動線地圖工作坊」活動紀錄 II。紀錄 I…

彙智共創「緊急醫療資料動線地圖」工作坊

「橫看成嶺側成峰,遠近高低各不同,不怕不識資料源,只要一下午就通。」 本文為2015年12月25日在高雄市政府消防局舉辦之「「緊急醫療資料動線地圖工作坊」活動紀錄 I,紀錄 II 則是《緊急醫療,資料一線牽》。 起源 緊急醫療常牽動院前救護與院內照護兩區塊,但其決策是一個複雜的過程;實務操作者必須權衡許多訊息來源,其中包含最佳實務與實證指引、區域調適後的運作協議、並配合自身所處的現場實境判斷。 當所有資料清楚收集並彙整時,我們期待一個經過訓練且思路清明的腦袋可以完美地進行問題決斷。 很不幸的,在目前的時空下,這些緊急醫療決策通常承受著時間張力壓迫,結合隱晦的後勤資訊,並在混亂的急救場域下合成而來。 更麻煩的是,這種現實面的缺陷亟待改善,但肩負急救過程主要歷史紀錄的緊急醫療管理系統,卻對這些緊急醫療過程的參與者提供非常寒酸的反饋。這也莫怪許多沉痾問題日復一日的出現,而品質改善的迴圈也遲遲無法封閉。 承接 改善緊急醫療品質首重辨識與面對問題,完整紀錄與精準回饋絕對是重要基石。傳統醫療照護的品質改善過程,在病患照護結果呈現與回饋指引制定端常有資料收集不足之憾;從病患發現通報、現場救護處置、派遣及後送傳遞、至抵院接收照護、甚至後續預後評估,這連續性醫療照護過程之中,持續產生許多傷病患的時空資訊。 這些資訊長久以來分別收錄於許多異質資料庫中,當這些資料管理源彼此缺乏縱深與廣域的互惠溝通下,要進行我們醫療系統的流線化、最佳化、及現代化革新,往往事半功倍。 國內今年開始啟用新版救護紀錄單,其中也特別強化特殊傷病之記錄;這些不同急症,其實也受其他監測系統所紀錄。但許多資料追蹤軌道是永遠的平行線,這種老死不相往來的結果,不但造成許多資源重複配置與重工的問題,也硬生生剝奪了我們實務求解時旁徵博引的想像力。回憶並承接過往 Code for Healthcare 的跨界對談與共創精彩,我們看到新方向。 轉尋 如何有效率的適時適地傳遞接收合適的傷病患,資訊傳遞的優化將是關鍵。我們希望在緊急醫療資訊透明互惠分享並共創價值的原則下,藉由促進各緊急醫療資訊所屬之利害關係者更多的對話與合作,進一步強化緊急醫療資訊活用,並從而改善資源重複配置與欠缺公眾反饋之情形。隨著資料驅動決策的時代開展,精確辨識合適而可靠的資料來源,即是我們活動大腦前需踩穩的一塊入門磚。 如何從緊急救護場域尋找合適共振信息,並嵌合資料元件來解構過程萃取洞見,進而快速運用至處置綱要制定,或協助臨床決策實務運用,絕對是跨部門未來的共同課題;也是我們這次要切入的重點。 合眾 挑選在聖誕節後的午後,我們在高雄市消防局進行了一場橫跨院前派遣、救護、院後照護及醫政管理的跨界資料源盤點活動。 我們邀請許多緊急醫療院前救護與院內照護生態圈內的同好,包括: 消防端(到院前派遣及緊急醫療管理系統) 疾管局(傳染症監測) 外傷醫學會(外傷登錄系統) 緊急醫療資訊整合中心(重症追蹤與急診壅塞監測) 健保局(全民健保資料) 開放源專家(資料分析、資訊科技)…

最棒的寒假禮物!「DSP 資料科學冬令營」真實感動同學的學習與收穫

這次我們DSP智庫驅動為了造福中南部的同學,有更多機會認識從資料思考到探索性資料分析的厲害之道,1/19 – 1/22特在中部靜宜大學舉辦「DSP 資料科學冬令營@PU」,此次同學們的反應可說是相當認真學習,和在北部舉辦夏令營的同學相較,完全是不同人文風格取向,有的專案會積極找尋商業價值,有的專案會思考幫助社會公益,不管哪種樣貌各有千秋,只能說同學們~大家該給自己一個最大的讚!這幾天陸續收到同學們的真實心裡話,這些真讓DSP的講師群們非常感動唷~    積極進取的同學A: 這四天學到了豐富的資料分析與思考的概念,從一開始的題目訂定、過程中不斷的的討論與互動、還有因為要改題目的方向的困難,一整天下來晚上還要繼續燒腦袋思考題目,而且組員來自不同學系背景,所以也獲得不少平常自己不會去想到的面向,而且還可以聽到其他組的分享,與組員互動相當有趣,受益良多。R語言也學到了不少基礎知識,遇到問題的時候助教也會提供協助,可以快速且順利解決想要解決的問題。 努力上進的同學B: 這是我第一次參加資料科學營,我覺得很特別,每組都有來自不同領域的成員,因為這次的活動巧妙的認識與共事,活動過程中,我接觸到許多有別以往的知識,如ggplot2、dplyr、用 markdown製作簡報以及資料收集和分析的方法,四天的活動很匆促,但對自己完成的專案覺得還不錯,很高興有這個機會,認識這麼多對資料有興趣的人,也謝謝老師這四天用心的帶領! 認真以赴的同學C: 這四天專題尋找,光是要決定題目要費了很大一筆功夫,方向以及深度都要全方位的考慮到,對於程式的初學者來說,要跑一些程式圖,完全幫不上忙,只能幫忙小組整理資料、資料分類。這四天來,真的學到了不少東西跟一些R語言進階程式,之前在學校只有學到股票分析以及如果算選擇權的權利金而已。 學習不倦的同學D: 記得第一天要在短時間內生出專案的主題時覺得超級困難,對於該找哪些資料、該呈現甚麼圖表也完全沒概念。但是後來在學習R的過程中,慢慢的迸出一些新的想法,也發現一些可以學以致用的圖,最後把它們呈現在我們的專案中,非常有趣。而且四天要生出專案雖然過程蠻崩潰的,但是很感謝講師及助教們,給了我們很大的幫助,也在每天報告完再聽講師及助教給我們的許多建議中,學習到很多簡報以及資料呈現的技巧。 團結力量大的同學E: 雖然當初是被主任威脅來的,但是這四天是個不一樣的新體驗,透過這次的課程,對用R的畫圖方法又多了一些,也知道了Markdown這個東西,這是系上沒有教的,是一種新發現;以往的報告總是和自己系上,有相同背景,這次的小組則變成不同背景的人一起做分析,有不同看法,對資料有不同認知,也會激發出不同的成果,很開心這四天的參與。 群策群力的同學F: 這次很榮幸參與這次的活動,從資料思考到視覺呈現,雖然我是財數系但是有coding的基礎,還一度被認為是資工系,還蠻容易上手R的,對於這次我最享受的應該就是跟組員們一起做報告的過程吧,大家都把各自的看家本領都拿出來了,讓我大開眼界。 反應聰穎的同學G: 本身是資工系,在面對大數據、資料處理時經常使用Database、Excel...等或是直接使用程式處理資料。這次來到這個營隊除了對R有了初步的認識以外,還學習到立即能夠派上用場的能力(ggplot2、ggmap...等)感覺收穫滿滿!感謝講師們的用心,講師們年紀與學員相仿較未有距離感也是此次營隊我最愛的地方之一XD! 集思廣益的同學H: 從一開始不懂R語言,到後面資料分析,四天之內大家都會利用回家一起討論,並且有問題就趕快更改資料內容,這樣的TEAM使我們大家迅速的成長,這樣的營隊讓我學習到不只團隊合作,在短時間內有效率地做出一個小專案。 合作無間的同學I: 在這四天裡,學到許多R統計語言的語法,也認識很多不同學校不同系所的朋友們,雖然已經放寒假了,但花了這四天假期來冬令營,非常充實,也非常有幫助性,多增加自己在資訊軟體的能力,對自己未來的幫助很大!很謝謝DSP團隊        每一次的夏令營與冬令營都是DSP智庫驅動走進校園,貼近各位國家未來棟樑人才的最好時機,所以每一回講師與助教也都全力以赴,希望能給同學們最好的認真態度,同學們~為了更好的前程,我們一起努力加油唷!

無遠弗屆拉近溝通距離的IoT與車聯網

昨(1/6)舉辦於金華官邸Start-Up Hub 青創基地舉辦1月Data Mixer「當智慧生活物聯網注入資料科學 DNA」,分享從當物聯網遇到智慧家電,以及車聯網中的技術秘辛哪裡耐人尋味的故事,此次好些相關領域與指標性龍頭業者積極參與,明顯感受到拍照率相當高又持久的分享會,可見關注程度很吸睛! 探索智慧家電的應用情境看漲 當互聯網+遇上家電變成了智慧家電,如何讓無所不在的家電有聰明的概念,到底要讓它們智慧化到應用的場景絕不只是連網而已,背後是軟硬兼具需要各種語言的交合想像大不同,從原型設計、組裝零件到市場量產。此次讓DSP智庫驅動 Tim遠征大陸、日本、美國等地走訪,明顯感受在地組成的智慧團隊文化差異性很大,因此未來的智慧家電,因著各地發展蘊底性格將造就不同的趨勢風貌,例如大陸地區有整個滿滿像光華商場的大型建物,裡面販售各式各樣的零組件,所以開發成本可以大幅降低。 而美國矽谷會看到工程師善用「群眾智慧」解決開發模組的問題,挑戰4天就要開發一個模組功能,隨時要有心理準備,當討論不到一半就有不少人像背後靈從中插入參與,透過高度腦力激盪多向溝通,讓原本空空如也的Github突然暴增就是因為互相點燃火花加乘靈感就來了,既隨興又不盲從的美國團隊合作精神。 想像IoT物聯網‬思維下的‎資料思考面向 從美國矽谷經驗反應出的面向,應包含big data, fast data, edge analytics and real-time insights」,當中的big data係指因為不斷成長而讓資料數據達到10B +Rows(5TB) 以上,像是風力、水力發電機的資料;fast data是指因為從Sensors感應所持續獲得的資料數據,應該也要1秒達到1M以上的程度才能稱之,這可以讓台灣的廠商思考一下自身產品獲取的資料規模是否夠大夠快,以及面對收集有用的資料與有效率分析流程的挑戰,反思一下台灣企業應該打理建設到哪個階段! 這10年內各大車廠紛紛自建數據中心 不難想像多螢幕載體乘載大量資訊的需求,隨著人類文明的發展,無感式接軌滲入了我們的生活,不只是智慧型手機,汽車上的多項精密設備已能接收大量數據,準確計算發生情境,進而推演這位駕駛行為背後的意涵,Jerry舉例VOLVO可能強調安全係數多一點的數據收集、雙B可能在意馳騁快感多一點的情境數據,各大車廠都想為客戶帶來更多備受禮遇的個人化需求,特殊差異化的市場發展是必然,所以從後端胃納的資訊拋到資料中心後,將形成這個品牌可以快速到各個國家發展在地化的數據網絡,資料所介接的開源技術體系其實很複雜龐大,基於服務層級協議多方合作,包含回饋到前端如何從「設計開發、供應鏈更迭、個人化保險、影像辨識即時支援、車內金流支付、自動駕駛、應用行為APP、代理商廣宣等」發展情境大不同,這些透過技術切分出的無痛式資訊幫助企業,確保創新與捕捉商機,間接提升了客戶對於汽車品牌的好感度大幅提升,所以從資料角度來看羊毛出在狗身上,還是狗自己因為自己的喜好習性被重視,得以很樂意的付錢。 大膽預見車聯網即將發生的效益與挑戰 1.透過汽車平台銷售「產品」變成提供各式「服務」;2.產生同業競爭差異化,與創造破壞式創新;3.強化客戶體驗,與消費者關係更緊密,CRM更確實;4.縮短製造與開發時間;5.因為擁有獨一無二的資料,品牌更清楚您的客戶需求,提高競爭力。 同時,在準備踏入車聯網這個龐大體系燒錢之前,請認真思考傳統思維是否能夠轉變?供應鏈網絡的廠商是否願意被整合? 產品結合服務後是否能夠真正落實?解決資訊安全可能造成的疑慮?以上皆是的話,歡迎你一起透過車聯網讓人性應用面向更偉大的航線。

資料人同樂會~用心感受資料帶來的人性與溫度

昨(12/11)於金華官邸Start-Up Hub 青創基地舉辦「Data Mixer資料人同樂會」,DSP回首本(2015)年度我們與大家一起用資料完成了哪些重要項目,對於台灣這寶島而言,是新創企業發揮創意,與傳統企業知曉轉型,欲多加善用開放資料(Open Data)與大數據(Big Data)活躍度大增的一年,相信結果對於產官學研與社群都有的滿滿收穫,也有意想不到的精彩,例如前(12/10)台灣在國際組織OKF的開放資料評比( OKF Global Open Data Index 2015)名列第一的表現榮登多家媒體報導,看待此國際競爭仍有各自表態,不管是名次、項目還是指標導引績效實用度等操作內涵,且待大家2016年資料力更加精采可期! 協助非營利透過資料追求更美好 DSP Johnson知識長提供「公益加值資料工作坊」幾個有趣的成果貢獻,例如雙連視障關懷基金會探求【視障按摩師的就業公平機會】用各項圖表超完美展開視覺化的呈現,更有條理的解析視障按摩師在時間、收入與地點的分布如何做調勻與開發機會;瑞信兒童醫療基金會關心現行【病童申請醫療補助人數下降】似乎與常識理解並不相同,所以透過探索性資料分析 (EDA) 了解背後真正原因,才得以幫助真正需要的病童;台灣環境資訊協會希冀了解因從事工業活動產生的【重金屬排放小旅行】如何汙染這片土地,進而影響台灣人民的健康情形。 雖然工作坊實際只有一天半,但能藉由跑完大量且有效資料產出的價值已很驚人,資料視覺化的呈現更讓大夥兒嘖嘖稱奇,認真看待這個環境已有的直接與間接問題,最終能更有同理心的想要發揮資料的力量改造社會的大問題,這裡的溫暖不再只是想想而已,而捲起袖子不等於走向街頭,我們透過資料科學的方式積極參與,這份心這個力道其實真的可以做很多有益福祉的事情!   推動政府採購資料走向國際舞台 今年DSP智庫驅動與法人單位合作進行一項重要的國際參與,以CKAN方式透過實質的資料力量,將年達上千億經濟規模的「政府採購資料」放進世界的脈絡中,對於政府、企業、納稅人來說這個生態圈是值得關注的重要議題。剛好,台灣現正朝向以科技化方式透明治理,故而透過本專案影響作用,希冀朝向更簡明的方式將其標準化或建立完整SOP,便於管理人檢視資源配置是否發生物以類聚或是高度集中化情形,得以有效率挹注關心,所幸現已有政府機關願意積極共襄盛舉,另外,參與這個具有代表性的國際組織,藉由互動式討論出的合作議題所帶來的活絡效益,相信後續發酵會越加明顯吧!   用資料科學看商圈選址的現代風水 對於零售業而言這是一個很大動盪的一年,從松青超市易主可能就是零售量販與超市的版圖轉移,現在的資訊情報透過非常多樣化的資料混搭 (Mash-Up),才能得以更精準的計算與競爭對方的相對距離有多近,這次的主題實況展演真是太精彩嘞,藉由商圈的評估與選址精密的計算點、線、面之外,還添入了許多開放資料集與蒐集超混搭內部的重要情報,經測量多維度的時空交錯所跑出的Location、Location、Location,相當於人流、金流、商流、資訊流做完密集整合的體現,這就是看商圈錢潮最佳風水的科學法門,就不難想見這是個具有聰明腦曉得提早擁抱與應用資料多樣性的企業,勇於追求知己知彼,百戰不殆的至高境界!   「健保核刪」關係著周遭每個你、我、他 台灣的健保財務資料目前尚未全部公開,但是過程中已產生的核刪資訊結果,卻可能是影響病患實際就醫品質的重要風險,欲收集散落在各地「申報:核刪」資訊做比對檢視合理性,到底是否核刪資料有跡可循,還是可能是沒原因沒道理的輪流問題?如何讓醫師無壓力地提供給病患有品質的所有選項,避免不得已可能會被刪的有限選項?是否牽涉哪些利益團體,可能間接損害國民的健康,造成國力逐步衰微的徵兆?這是個全民繳健保的時代,相對地也應該能逐步掌握知的權利,大家除了追問頂新問題,也可以透過資料作其他項目有意義的實質貢獻,歡迎有志之士響應這個關心全民的資料公開活動。希冀最終能屏除不必要的浪費資源之外,也兼顧民眾能更安心掌握健保補助的醫療狀態。   DSP與各位愛好資料的夥伴們~年終歲末之際回首本年度,因為資料多樣性賦予豐富產業生命力,能為眾多領域帶來嶄新變化漸露萌芽且紮實的進展,DSP時時與各位一起關心資料相關最新動態,期許未來2016年的各項應用領域更加如實如質地蓬勃發展!

跨域動腦想像力,整合資料促公益

日前(11/6)於金華官邸Start-Up Hub 青創基地舉辦以「Data for Social Good」為二次深度主題的Data Mixer資料人聚會,比上次(10/7)的D4SG議題又更聚焦了些非營利組織的故事,DSP智庫驅動與開拓文教基金會祈願幫助即將在11/28-29的公益加值資料工作坊暖身,透過更有品質與概念的資料集中借題發揮找端倪,善用不同的資源整合找到最大的符合效益。 今次提出初步資料並發想議題概念的朋友們,包含「瑞信兒童醫療基金會、大渡山學會、國際生命線台灣總會、中華民國家庭照護者關懷總會、‎主婦聯盟環境保護基金會‬、‎雙連視障關懷基金會‬」等提出他們自己尋找已久的疑惑,欲徵求跨界領域的不同朋友和他們作伙,用不同的思考方式或是動手做,希望能釐清未知的線索,目的並不是在超級短的時間內求出最精準的答案,但是細分資料內容的過程中,即便全然去個資識別化,仍足以有不同樣貌的故事脈絡有跡可循,這些案例其實從不遙遠,只不過是發生在每個大城市、小角落裡不同大小人物的真實事情,傾聽他們娓娓道來!   善用資料擺對資源,找到對社會的真心關懷與純愛 除了事先預備的議題,現場加碼的朋友也都很厲害,故事信手拈來,列舉如下: 少子化是必然,但兒童在尚未長大成人階段,所遭遇到的醫療環境是否能適當配置資源,尤其當與補助條件下的量化數字做優化,比對家庭經濟因素質化條件,這些結果可能不一定如大家所想像。 同樣地,少子化延伸到高等教育的實施,如果大專院校的部分轉型會是應然,那該如何提早讓學校這端預估學生對某些科系的學習意願,利用學校的強項資源,幫助未來學生發揮他們的天賦潛能。 早期社會與現今社會所面臨的狀況大不同,有人是為了學業、工作、婚姻、人際等原因求助於生命線,透過自1986年後至今長達30幾年資料累積,不同資料欄位,除了一般常見的屬性,另外還有更細緻的標籤,例如星期、談話時間、用語、原因等,不常見但很有特色,如能找出高危險群因子的徵兆,或許可以更早幫助解決這些個人化的窘境。 少子化對應的就是老年化,這個龐大的社會議題不只是勞動人口的老化,更是經濟體制的縮影,現在的我們已經感受到需要對需要照護者的關懷,繼5月通過長照法後,希望也加速通過長照保險法。期待能夠整理出全台灣的照護機構、可用床位等服務能量,也能夠讓民眾知曉鄰近居家地區的所在情形,讓未來開放資料與開辦長照計畫有政策上的實質結合。 非營利組織可以被想像到如財務短缺、志工招募等議題,還有身心障礙者如視障者具備工作能力,但遇到組織調人力、成本等資源協調考量該是怎麼配置,也蠻常見於眾多不同類型組織,但非營利項目可能條件無法用精確的數字衡量計算,使用的標準不標準對於管理人員又該怎麼看待。 這些事情都在台灣活生生的上演,這麼多值得感動你我他的故事,最美麗的風景應該是放下身段服務社會的人心,關懷大眾的你怎麼能錯過11/28-29在南港的「公益加值資料工作坊」,歡迎非營利組織工作者、政府工作者、社會企業實踐者、資料分析師、資料工程師、說故事的人,敬請提早報名以免向隅!

資料大革命,你參加了沒?

2015年10月21日是「世界統計日」 (World Statistics Day)。你沒聽錯,統計不但有自己的節日,而且全世界超過85個國家響應,舉辦各種慶祝活動。 我們正站在「資料革命」的浪頭,資料的價值備受重視。若想掌握契機,兌現資料價值,我們必須做到兩件事:(1) 提升所有人的資料聽說讀寫能力 (data literacy),(2) 加速產生高品質、高價值的資料。 看得懂資料、懂方法,才能分析資料,進而詮釋資料的意涵,提出改善方案,創造更美好的未來。 有了好資料,才能具體地討論資料應用。否則,巧婦難為無米之炊。 兩者環環相扣,缺一不可。 以下是世界統計日的一分鐘宣傳影片。 延伸閱讀 慶祝世界統計日的理由 (Why World Statistics Day is something worth celebrating) 世界統計日官方網站

【開放採購】政府標案的國際資料標準

你有聽過 OCID 嗎? DSP 智庫驅動是亞洲第一個拿到 OCID Prefix 的機構。在我們前面的,只有來自歐美的單位,包括政府機關(例如英國、美國、加拿大和墨西哥政府)以及國際組織(例如 World Wide Web Foundation、Natural Resource Governance Institute 等)。 透過國際合作,我們不但讓台灣的政府資料更為開放,還要讓全世界的人都能使用台灣的資料!   開放採購國際夥伴計畫 (Open Contracting Partnership) 根據估計,每年全世界各國政府的採購金額高達 9.5 兆美元。有鑑於各國政府採購金額龐大,透明度卻不足,因此「開放採購國際夥伴」(Open Contracting Partnership) 邀請各國專家,共同設計了「開放採購資料標準」(Open Contracting Data…

善用資料力成為造福社會的推進力

日前(10/7)於金華官邸Start-Up Hub 青創基地舉辦以「Data for Social Good」為主題的Data Mixer資料人聚會,滿滿地好朋友、老朋友和新朋友們齊聚關注~如何善用資料的力量,讓社會公益的資源挹注,能運用的更有效率、更具價值,好讓每個希望的種子本身就有能力展翅飛翔!我們一起用資料的力量改造社會吧!   Data for Social Good需要你、我、他 DSP智庫驅動的CK執行長介紹了「

學會這招,就能讓你所提出的公共政策(或商業企劃)更靠譜

不論是公共政策或是商業企劃,只要學會運用資料科學,就能大幅提升成功的機率! 先說個小故事。 和台灣人一樣,英國人被法院裁定罰款之後,未必會按時繳交罰金。而且,法院僅是寄發催繳通知信,成效也很有限。(只有 5% 的收信人會如期繳款。換句話說,有 95% 的呆帳。) 因此,英國法院決定推出「簡訊催繳」方案。 問題是:簡訊的內容應該如何設計,才能達到最大效果(繳款率)? 於是,英國法院和內閣辦公室的資料科學團隊合作,進行實驗。 他們設計了四種簡訊內容: 沒有簡訊(對照組) 標準文案 標準文案 + 金額 標準文案 + 姓名 標準文案 + 姓名 + 金額 他們總共進行了兩次實驗(樣本數分別為 1054 人 和 3633 人),獲得很有趣的發現:…

與中央部會攜手合作,資料跨界思考助決策

今(104)年8月6-14日,由智庫驅動、國家發展委員會及開拓文教基金會聯合主辦為期4天【公共政策與治理 - 資料思考工作坊】,在班主任 行政院副院長張善政引領之下,參訓學員為跨20個中央部會30多名菁英種子,各組初探以房價、農業、消防、選舉、交通等為研提方向,領域專家學習遇多樣化資料取捨時,運用不只是以IT背景者所會的專業知識,更善用資料多樣性做活化發揮,期以未來擬定策略發展貫通脈絡之一致性,或是改善便民服務措施更親民。各組專案成果初探表現具風範,不僅實踐跨部會密集溝通交流,更促進創意發想層級找問題大不同,藉由資料混搭應用完成的雛型,經初步發現了些重要的因果洞見,這些蛛絲馬跡的線索仍值得後續釐清與追蹤。 班主任 行政院副院長張善政與學員們於結訓交流分享心得及經驗,首先,各部會仍需加速完成資料盤點綜整情形,藉由透析不同類別的有用資料來源,各部會相關單位才得以互相支援利匯報,以提供混搭應用的實踐基礎。再者,目前遇到眾多資料,經檢視欄位屬性應與其他單位所擁有資料具高度相關,卻遇到疏漏缺疑之憾的瓶頸,應查明是否排除無法取得的原因,如能跨部會直接取得綜理,以利整合到位,得節省大量的人力與時間成本避免重工。最後,從過去缺乏資料可用至今資料氾濫成災,面對大數據多亂雜疑的當下,現今處於撈取、清理、彙整、分析、建模的不斷循環過程,需要歷經反覆幾次的檢視再檢視,稍能解決當下的難題合理性,但驗證到源頭的真實樣貌,如欲做為提早發現的警示功能防弊端,這些見微知著的過程與功夫還需花上些時間,不管是統計回推或預測這是持續的過程,期勉各位齊努力。 這4天的學習與經驗交流,智庫驅動講師們不斷提醒著學員們如何利用資料創造價值,應有目的性地做資料分析,需要在資料分析流程中釐清各資料層級,當完成EDA資料分析後,並注意到資料邏輯性、因果性及限制性,才會產生資料建模的真正關係,以免結果缪誤失真理。此次課程提供了諸多國內外政府施行的應用案例,與視覺化分析的多項運用,提供各部會學員後續延伸發想之參考。國內於推動Open Data邊學邊做至今,更加清楚理解應以最後目的而開放,而非以開放為目的。此次跨20個中央部會種子擦出高度創意火花皆表現亮眼,相信國內政府機關未來推行與擬定發展政策時,透過資料思考到爬理分析,將更有效率地幫助執行團隊展現兼具高度、廣度與深度的重要決策施行。