活動紀錄

老師和學生 誰對於學習表現的影響比較大?

老師和學生,誰對於學習表現的影響比較大?這是個非常重要,但可能也是極具爭議性的問題。 誠致教育基金會所開發的「均一教育平台」,致力於提供免費且優質的線上教育機會給每一個人,故此名為「均一」。近年誠致也開始和各地的學校合作,以 Online-to-Offline 混搭模式,嘗試新型態的教育模式。 在累積了多年的廣大使用者行為記錄之後,誠致的夥伴們決定加入D4SG資料英雄計畫,並且問了一個關鍵問題:如何個人化推薦學習單元,以達到每個人最佳的學習效果? 何謂「學習效果」?應該如何衡量?又該如何驗證「推薦」的成效?這些都是環環相扣,相當複雜的問題。 經過數週的討論,資料英雄們終於問出了一個更根本的問題:老師和學生,誰對於學習表現的影響比較大? 基於這個新的問題定義,專案團隊開始探索「學生線上學習行為」、「教師線上授課行為」和「學生在校學習表現」之間的關聯性,並且將工作目標設定為「找到一些重要的發現,以供誠致以及全國教育工作者參考」。 讓我們拭目以待!    

右手寫 Code,左手 CPR 的資料英雄

  「到院前心肺休止」(Out-of-Hospital Cardiac Arrest, OHCA) 佔救護車出勤比例雖低,但是死亡率卻頗高,因此備受緊急救護與醫療界的重視。 高雄市政府衛生局想要分析歷年的 OHCA 資料,改善下列問題: 瞭解 OHCA 發生風險因子與地理分布,以便優化資源配置 分析「旁觀者介入」程度與有效性,調整相關政策規劃與執行 提高存活機率 除了文獻上經常被探討的危險因子,衛生局也想瞭解是否還有尚未被研究的在地性因子。 參與本 D4SG 專案的資料英雄們,技能專長琳瑯滿目,從 CPR 證照、程式開發、統計分析、資料探勘到系統開發,有人是醫學系學生,有人是消防隊緊急救護員、還有醫院急診部的醫師。 透過剖析真實的在地資料,期望能針對上述三個關鍵問題,找到改善現況的答案!

《採購開竅資料挑戰賽》成果速記

台灣首度舉辦的《採購開竅資料挑戰賽》,針對政府採購的兩大挑戰,從去年11月開始,歷經兩個月的共同工作,順利產出五組成果,並於1月14日舉行成果分享會。 0. 開放採購之國際趨勢 成果分享會一開始,由我先分享「2016 開放政府夥伴高峰會」(OGP Summit 2016) 的參與心得。 除了介紹開放政府/開放採購的最新國際趨勢,我還歸納整理了五個心得: Transparency in public procurement is trendy Public-Private partnership is also trendy Many dedicated international organizations Standardized measures for integrity & transparency…

22 一月 2017

《採購開竅資料挑戰賽》成果速記

台灣首度舉辦的《採購開竅資料挑戰賽》,針對政府採購的兩大挑戰,從去年11月開始,歷經兩個月的共同工作,順利產出五組成果,並於1月14日舉行成果分享會。 開放採購之國際趨勢 成果分享會一開始,由我先分享「2016 開放政府夥伴高峰會」(OGP Summit 2016) 的參與心得。除了介紹開放政府/開放採購的最新國際趨勢,我還歸納整理了五個心得: Transparency in public procurement is trendy Public-Private partnership is also trendy Many dedicated…

打擊家暴的資料英雄

「我是因為小燈泡事件而選擇加入家暴防治的資料英雄專案。」這是依珊在D4SG資料英雄計畫期中聚會的開場白。 依珊和一群原本不認識的人,因為對於家暴防治懷有相同熱誠而相遇,在每週三晚上七點,往往連晚餐都來不及吃,就匆匆趕赴臺北市家庭暴力暨性侵害防治中心,和該中心的工作人員進行資料分析的工作會議。 這群資料英雄包括能在談笑間完成複雜資料格式轉換與清洗的東尼和Brian、不斷提出關鍵問題的依珊和曜容,在超短時間內讀完十幾篇中英文論文的郁秀、沈默寡言埋頭寫程式的阿泰、以及總是一臉嚴肅思考如何建模的雅韵。 他們的共同目標: 建立家暴風險預警管理模型 降低家暴發生率 提高社工服務效能 在家防中心高度專業的工作同仁帶領之下,經過一個多月的努力,他們逐漸認識家庭暴力的種類、成因與個案處理流程,並開始探索第一手的個案處理紀錄資料。 在社會學的領域,對於家暴危險因子的定義通常是質性的,例如「過往受虐經驗」、「關係衝突」或是「居住穩定性」。為了建立統計模型,資料英雄們持續和社工師進行困難的對話,共同嘗試將這些質性指標轉換為可量化的指標。 在未來的一個月,他們希望能協助家防中心將個案資料整理乾淨,繪製家暴熱點地圖與資訊看板,並初步建置家暴預警分析模型。 加油!

資料科學,打火救人

對抗火災的最佳策略是採取預防性攻擊,防患於未然。 若用資料科學的語言描述,就是定義問題、資料盤點與清理、分析建模、預測、決策支援。 以高雄市為例,每年的火災案件不到一百件,但是消防隊員還是忙不完。 有一個重要的原因是雖然每年「火災」數量不多,但是「火警」的案件卻是數以千計。 火警和火災,差別只在一線間。家中瓦斯爐燒開水未關,鄰居報案後,消防隊來得及破門而入關掉瓦斯,就只是火警;來不及關掉,就可能演變為造成生命與財物損失的火災了。 不論火災或火警,其危險因子(例如起火原因、建築物特性、人口特徵等等)可能都是共通的,若能評估火警風險,或許就等同建立了火災風險模型。 這即是 D4SG 資料英雄計畫「火災風險地圖」專案正在設法解決的公共問題。 我們很榮幸與高雄市政府消防局合作,號召一群「用資料力做公益」的資料英雄,利用週末和晚上,共同分析過去數年的消防案件,從無到有,開始打造台灣第一個「資料科學,打火救人」的實戰經驗。 高雄,加油!   相關資訊: D4SG 計畫 打火就打火,談大數據?

2016 DSP 資料科學夏令營,參與學員的真心話

「2016 DSP資料科學夏令營@NCCU」圓滿落幕囉,這次DSP找來實力與中二程度兼具的講師群,讓同學們在緊湊扎實還累到爆的營隊中縈繞著歡笑與淚水。同學們在各組專案的表現真的是讓大家驚呼連連,這幾天陸續收到同學們的真實心裡話,這些真讓DSP的講師群們非常感動唷~ 政大公行,積極進取的同學A: 受到會計老師的啟發,對於 R 語言產生了好奇心,並報名這次四天的夏令營活動。第一次參加短期專案報告的營隊,很充實也學到多過去未曾學習到的知識,講師的實務經驗豐富,提供我對於資料分析與統計知識應用更多的想像空間,助教和藹可親,用心幫我們 debug,不同背景的組員們互相學習同心協力,在短時間內分工合作完成一份不錯的成果,這四天收穫良多,奠定了不少寶貴的 R 語言基礎,很棒的活動。 政大MBA,群策群力的同學B: 對我來說,參加這次的營隊是個很好的學習過程。提供了一個自我檢視的機會,解決問題、執行能力也會受到考驗。在極短的時間內,需要大家跨領域合作能力與專案管理能力。了解自己在完成專案的過程中,應該在團隊裡扮演甚麼樣的角色,並更明確知道自己的長處與不足之處,藉以做後續的加強或補足,抓住自己在團隊的定位。 由於學員的背景差異很大,講師和助教非常專業能夠幫助不同程度的人都能在課堂上有所收穫,而最重要的是助教的專業也讓大家可以從過程中得到一些很立即的幫助、建議,可以感覺到助教十分用心解決學員問題,並營造非常愉悅的學習環境,讓沒有基礎的同學在面對 R 語言時也不會害怕或抗拒,相信對於和我一樣沒有程式背景的同學也會因為助教的熱誠與專業而更加喜歡 R 語言的魅力! 輔大企管,學習不倦的同學C: 為期四天DataCamp@NCCU在掌聲與歡笑中完美落幕,從Day1的懵懂到現在終於有了成長的感覺,LEVEL UP+。感謝強大的助教群的耐心教學,你們給的comment跟經驗談真的很棒!! 謝謝組員們強的carry,沒有你們沒有最後的成果 GOOD!! 在各路高手中能成為一個TEAM既是幸運也是緣分,相互交流的感覺真的很開心,我們的成長也隨之而來。 雖然每天跟專案時間賽跑超超超超超超超累 = =+ 但看著生命在燃燒卻又綻放如煙火般的絢爛奪目,心中真的是有無限的滿足與感謝,腳踏實地享受生活的感覺真的頗爽的XDD 哥學的不是coding,是一種態度 逢甲資工,全力以赴的同學D: 終於回台中了,四天先感謝組員carry,每天7點多起床2點多睡覺,整天盯著電腦有種已經開始上班的fu,台北真的是一個好地方,每個人都有自己的想法,看事情的面向也差很多,認識了不少新朋友,希望未來還有機會再見面。 淡江統計,努力上進的同學E:…

[D4SG] 資料對話 跨域合作 讓寶島更美

D4SG 資料英雄計畫,試營運專案之一的「農地重金屬污染與列管分析」,由台灣環境資訊協會提出需求,由政治大學資科系和新聞系的高材生團隊負責執行,透過資料科學方法「快篩」出全國各縣市「疑似重金屬污染,卻未被農委會列管的高風險農地」。 環資協會於上週五 (2016.06.03) 發布調查結果新聞稿,立刻被公視與其他媒體報導。     並於短短三天內獲得環保署的正面回應: 目前經航照判釋尚有6千公頃(經換算約960筆)仍屬農用,已訂定第4、5期農地調查計畫,其中第4期正進行中,為加速調查期程,第5期計畫將提前於今年農閒期開始調查,並預計於1年內完成調查,於調查完成後約2-4年可完成改善。   農委會也隨後出面回應:初篩非確例,不能直接當結果,並將由農委會主委曹啟鴻向朝野立委說明,以釐清社會疑慮。 這個 D4SG 專案成果公佈後,只花了不到一週的時間,就達成下列效益: ‎環境團體‬與‎資料英雄‬合作,用數據協助政府抓出施政漏洞 運用跨部會的‎開放資料進行‬交叉分析,實踐‎資料治理 ‬獲得資料管理單位(環保署、農委會)的正向回應 將由農委會主委親自披掛上陣,向立委說明   我們樂觀地期待,還會有更多的效益持續發酵,直到環境污染獲得明顯改善。   相關資訊: 政府開放資料的下一步,以資料驅動的公共治理 調查:993處重金屬超標農地 838處未列管(公視) 農地污染威脅食安?農委會:超標均銷毀(中央社) 食安大隱憂!全台8百多處農地污染疑未處理?(台灣環境資訊協會新聞稿) 環保署積極進行農地調查 與環團共同守護農地(環保署回應新聞稿) 農地污染引恐慌 農委會:願設溝通平台(聯合報)

《KAMERA 急診資料挑戰賽》得獎者點評

台灣緊急醫療資料活化的首次實踐 台灣首見為期兩個月的緊急醫療資料競賽《KAMERA 急診資料挑戰賽》,於上個月順利落幕,前三名的隊伍從上百組的參賽隊伍中脫穎而出。第一名是清大統計所碩一的團隊(李少芃、楊承翰、陳以臻,成績:99.076);第二名是中研院與政大合作之TIGP-SNHCC學程的博士生陳志明(成績:99.041),同時也是《痞客邦 Visitor Log 資料挑戰賽》的第一名;第三名則是由台積電品管工程師、和碩大數據工程師組成的團隊(宋培源、王宜婷,成績:98.879)奪得。 成果分享會於 4/29(五)高雄市消防局國際會議廳舉行,會中高醫外傷科主任陳昭文醫師提到急診壅塞的種種困境,點出緊急醫療資料需要活化、透明、互惠,以及《KAMERA 急診資料挑戰賽》計畫的前世今生。緊接著是本次競賽前三名的隊伍成果分享,以下分別對其點評。       第三名:KMeans 創造新變數,GEE 建構預測模型 第三名隊伍的兩位參賽者目前任職於台積電品管、和碩大數據部門(宋培源、王宜婷),為清華統計碩班同學。他們的預測策略先從探索性資料分析 (exploratory data analysis, EDA) 開始,使用大量的 boxplot 觀察出急診室檢傷總人數與醫院、班次、月份的關係,接著做K-Means分群法對檢傷總數,創造出新變數 group 加入 GEE 預測模型 (Generalized Estimating Equation,…

《KAMERA 急診資料挑戰賽》成果發表會

台灣首見的緊急醫療資料競賽《KAMERA 急診資料挑戰賽》,吸引了上百組隊伍參加,針對高屏地區過往的「急診量能資料」進行探勘,分析充滿不確定性的緊急醫療作業歷程,建立急診壅塞的預測模型。 我們在上週五(2016年4月29日)舉辦頒獎典禮暨成果發表會,分享優勝者的作品。並很榮幸地邀請到行政院長張善政主持座談,與衛生、消防、醫療以及防災領域的專家,探討如何跨域整合,激盪出促進緊急醫療資訊透明化的新方向,進而由各界合作,共同改善急診問題。 以下為該活動的速記。 1. 活動開始前的籌備工作   2. 活動議程表   3. 主辦單位「高屏澎醫療網」(由屏東縣政府衛生局蔡木財副局長代表)致詞   4. 場地東道主高雄市政府消防局劉一娟專門委員致詞   5. 三組佳作隊伍領獎 (頒獎人:高雄醫學大學劉景寬校長)   6. 第三名隊伍(宋培源、王宜婷)領獎 (頒獎人:高雄市政府消防局劉一娟專門委員)   7. 第二名隊伍(陳志明)領獎 (頒獎人:高雄市政府衛生局蘇娟娟副局長)   8. 第一名隊伍(李少芃、楊承翰、陳以臻)領獎…

大數據可以猛如潮水,水能覆舟亦能載舟!

3/9(三)當天最熱門的新聞大概就是Alpha Go擊敗棋士李世乭!人機大戰開打的敗亡,是否代表人工智慧已經造成人類的威脅則尚不可得知。但是,當晚我們在青創基地舉辦的Data Mixer 每一招卻想得是如何讓機器與資料的協作,幫助人類生命得以更加美好,所以資料如潮水能覆舟亦能載舟。 活化緊急醫療資源 – KAMERA 急診資料挑戰賽 自2010年起,高屏緊急醫療應變聯盟 (KAMERA project) 開發了一個跨院急診壅塞即時監測系統,是目前台灣最大型的緊急醫療監測雲端系統。DSP去年與KAMERA共同舉辦工作坊,將分享資料人與緊急醫療體系的合作經驗,包含括領域團隊的合作,從地方消防局到中央衛福部,到醫院這一段的緊急醫療資料動線有了完整的鋪陳,這一段資料旅程的寶貴是彙整了許多第一線人員,在現場實際接觸的動態情形更顯得來不易,包括對於送急診的司機大哥而言,他們希望有即時的資料可以告訴他們要將病患的往哪裡正確位置送去最得宜,未來這可以將理論與技術完整勾稽後,將得以協助跨領域團隊應用在醫事管理上更有效率! 今年DSP與KAMERA繼續合作舉辦資料挑戰賽,利用群眾外包的智慧,共同檢視高屏地區發生災難危急時,(1)什麼樣的情形需要和外部地區求援?(2)醫院各自平時和可額外承載外傷人數的最大乘載量又為何?對於參賽者的貼心小提醒!急診數據可能會有週期性,周間/周日要考慮,甚至是尖峰時段在哪裡?這個競賽到2016/4/10上傳到為止,歡迎各界高手來PK KAMERA 急診資料挑戰賽。 怪獸電力房屋 – 當開放資料遇上節電綠能 我們善用開放資料,將台電資料調出每戶平均用電量、總戶數、老人比例、總和所得稅、樓層面積等資料混搭與交叉比對,再把離群值挑出後,可以知道每個台北市行政區的村里用電量情形,目前可以分析爬梳出來,例如:(1)老人多半集中在士林區、(2)耗電量集中在內湖區賣場、台北車站區域,也許未來可以推估各自村里的商業應用找出價值,例如耗電量高但是人少的地區,可能需要檢視是否為老型住宅,可能需要老舊的管線或電器用品需要汰換;另外,有許多老人的區域可以開立有療癒系的商店,或是長照看護的診所等,都可以透過電力的檢視,將資源重新配置用在最需要的地方做調幅。 掌握機器學習的工具與應用 《