大數據的出現改變了今日社會諸多領域的運作方式,而資料科學的發展目的則是針對資料進行理解、分析與溝通,並設法找出洞見與應用方式。資料科學本身即是跨領域的知識組成,包含了資訊科學、統計學、商學、傳播學、社會學及其他領域知識。本次由 DSP 智庫驅動與國立政治大學-ITSA社群運算與巨量資料跨校資源中心聯合主辦的資料科學夏令營,邀請專業的講師群授課,透過四天的密集訓練,協助同學瞭解資料科學的基本知識與實作技術,為青年學子未來投入資料科學領域儘早做好準備。
活動目標
學員應該自我期許,達成下列學習目標:
- 認識資料科學的基本概念
- 瞭解資料科學的工作流程
- 學會 R 語言的基本操作與資料分析
- 經由分組專案,學習在時間壓力下,進行團隊溝通與合作
- 體驗 end-to-end 的資料分析旅程
活動時間與地點
- 時間:2015/6/30 – 7/3(共 4 天,每天 10am – 5pm,中午休息一小時)
- 地點:國立政治大學社會科學資料中心 數位展演廳(台北市文山區指南路 2 段 64 號)
活動介紹
本營隊將介紹跨領域資料科學團隊工作的基本流程,讓學員學習運用統計學、資料探勘的概念與工具,針對真實的問題,以團隊合作模式,使用實際資料進行個案分析與小組專案。
本活動強調課堂討論與分組實作。學習方式包括:
- 主題演講
- 個案研究
- 工具與資料實作
- 分組專案
本活動以目前相當熱門的 R 語言為工具,上機實作丶分析資料,帶領學員一窺資料科學的門道。
基本學習結束後,將有時間讓學員組成資料科學團隊,分組作業,綜合演練所學知識技能。各組將針對真實的社會、商業或校園問題(例如交通、居住、市場分析或選課),選擇角色扮演(例如政府部門、民間組織、企業或大學),從事資料分析,最後並舉辦分組報告,互相討論與交流。
活動內容
- 資料思考的核心概念與入門訓練
- 探索性資料分析
- 描述性統計與視覺化探索 (心法)
- 小組專案
- R語言環境設定與資料讀取
- 基本語法語物件結構
- 資料處理 (Data processing with dplyr and reshape2)
- R 語言的資料探索
- 描述性統計與視覺化探索 (實作 with dplyr and ggplor2)
- 探索性資料分析 (進階)
- 熱點圖、泡泡圖、地圖
- 群聚分析
- 小組專案
- 專案報告
先備知識
報名者建議至少需要具備以下技能或心理準備,以獲取較好的學習效果:
- 面對大量數據或是程式碼不會從內心興起一股莫名的恐慌
- 曾經使用試算表軟體進行任何資料分析的工作
- 看得懂英文軟體介面和操作說明
必備器材
學員須自備可以上網的筆記型電腦,建議使用下列作業系統:
- Windows 7 或以上 / Mac OS X 10.9 或以上 / Ubuntu 14.04 或以上
建議活動開始前先自行安裝以下工具,安裝過程中有任何問題可參考DSP的疑難指南,講師也會在課堂上說明安裝注意事項。
- R(R-3.1.3 以上版本)
- RStudio IDE(0.98.1103 以上版本)
講師介紹
![]() |
劉佳欣 (Rafe) 資料探險家,喜歡從資料中尋找蛛絲馬跡探索推理,用樸實的分析方法點石成金。現為交大博士候選人,賣過 20 塊一杯的手搖飲料,也賣過一張兩三萬的 Business Flight Ticket。從連鎖飲料店經營分析,到航空公司網站銷售管理,從唯利主義到追尋學術意義,浪子回頭不換金的資料分析經驗。希望能在這次營隊的參與,帶給大家不同的資料分析衝擊。 |
![]() |
杜貞儀 (Crystal) 善用數字與地圖說故事的人。同時具有生物與環境科學背景,熟悉統計分析與數值模擬的生態研究者,喜歡新事物帶來的挑戰。目前為台大海洋所博士 |
![]() |
謝宗震 (Johnson) 清華統計所博士。擔任 TW R User Group 顧問的 Johnson 對於統計方法與工具的推廣具有極大的熱忱,期望利用統計思維及分析工具幫助各個領域解決問題。在許多人眼裡,數字往往艱澀難懂、遙不可及;在他的眼裡,數字是知識的原石,透過統計工具的建模與分析,將數字琢磨成有意義的東西,就像文字一樣具有生命力,述說著一個又一個現實世界的狀況,傳遞重要的訊息。 |
![]() |
陳奎銘 (BEN) 利用資料的投機者,醫學影像、生物資訊、腦科學研究,甚至是股票市場,都是曾經努力過的領域。目前為一家生技公司的研發工程師,從事生物資訊分析,試圖利用不同biomarker建立model,預測疾病分期。同時也是R語言的愛好者,習慣把生活中的疑難雜症都交給R處理,期許自己能夠將資料科學融入生活中。 |
適合對象
凡是有興趣接觸資料科學領域的的學生,不論是管理學院、理工學院、文法農學院、醫學院或是社會科學相關科系的大專學生或研究生,皆可報名。
報名資格
限政府立案大專院校之學生。(請於錄取後接獲通知時,須提供蓋註冊章的學生證影本)
報名方式
- 本活動預計招收 42 名。
- 由於本活動強調學員專長背景的多元性,因此並非先報名先錄取,而會按照報名人專業背景進行審查與評估,以便組成 5~6 個綜合型團隊。
- 學員請在線上報名時如實填寫自身背景。
- 主辦單位於收到線上報名資料後,經過適當分組考量,再通知學員是否錄取。
錄取方式
- 本營隊採兩階段報名、錄取與繳費,重要日期如下:
- 第一階段錄取名單公布時間:104/5/22
- 第一階段繳費截止日期:104/5/29
- 第二階段錄取名單公布時間:104/6/5
- 第二階段繳費截止日期:104/6/12
- 欲參加之學員須於104年6月2日報名截止前填妥報名表。因本營隊會按照報名人專業背景進行審查與評估,第一階段未獲錄取之同學,仍有機會在第二階段審查中獲得錄取資格。
- 分階錄取學員皆應於該階段繳費截止日期前完成繳費,並提供在學證明。
- 確定錄取學員若未於繳費截止前將活動費用匯款完畢,視同放棄錄取資格,名額將由備取學員遞補,主辦單位不另作通知。
繳費方式
接獲錄取通知的學員,請按照指示進行繳費。
活動費用
一般價:NT$12,000
學生特惠價:NT$ 3,600
特別感謝政治大學支援本活動大部分經費,讓學生能以極優惠的價格,享受四天企業級專業課程。
主辦單位
- DSP 智庫驅動
- 國立政治大學-ITSA社群運算與巨量資料跨校資源中心
註1:主辦單位保留隨時調整活動內容之權利,以公告為準,並不另行通知。
註2:依學員出席情形全勤者,將核發電子學習時數證書。
聯繫窗口
電話:(02) 2939-3091 分機 63964 李小姐
Email: scs.nccu@gmail.com