2016 DSP 資料科學夏令營@NCCU

2016-SummerCamp-v3大數據的出現改變了今日社會諸多領域的運作方式,而資料科學的發展目的則是針對資料進行理解、分析與溝通,並設法找出洞見與應用方式。資料科學本身即是跨領域的知識組成,包含了資訊科學、統計學、商學、傳播學、社會學及其他領域知識。本次由 DSP 智庫驅動與ITSA社群運算與巨量資料跨校資源中心聯合主辦的資料科學夏令營,邀請專業的講師群授課,透過四天的密集訓練,協助同學瞭解資料科學的基本知識與實作技術,為青年學子未來投入資料科學領域儘早做好準備。

立即報名

活動目標

學員應該自我期許,達成下列學習目標:

  • 認識資料科學的核心思維
  • 激發用資料解決問題的創意
  • 學習如何有系統的從數據中釐清脈絡、掌握趨勢
  • 學會 R 語言的基本操作與初階資料分析
  • 經由分組專案,學習在時間壓力下,進行團隊溝通與合作
  • 體驗 end-to-end 的資料分析旅程

活動時間與地點

活動介紹

本營隊將介紹跨領域資料科學團隊工作的基本流程,讓學員學習運用統計學、資料探勘的概念與工具,針對真實的問題,以團隊合作模式,使用實際資料進行個案分析與小組專案。

本活動強調課堂討論與分組實作。學習方式包括:

  • 主題演講
  • 個案研究
  • R語言實作
  • 分組專案

本活動以目前相當熱門的 R 語言為工具,上機實作丶分析資料,帶領學員一窺資料科學的門道。

基本學習結束後,將有時間讓學員組成資料科學團隊,分組作業,綜合演練所學知識技能。各組將針對真實的社會、商業或校園問題(例如交通、居住、市場分析或選課),選擇角色扮演(例如政府部門、民間組織、企業或大學),從事資料分析,最後並舉辦分組報告,互相討論與交流。

活動內容

第一天
  • 資料思考
    • 資料科學的核心思維
    • 資料產品的完整流程
  • 探索性資料分析
    • 掌握資料脈絡 – 描述性統計
    • 了解資料趨勢 – 用對統計圖表
  • 小組專案
  • 快速回顧 R 語言基本操作
    • 環境設定
    • 基本語法
    • 物件結構
第二天
  • R 語言的工程面
    • 資料讀取
    • 資料處理 (Data processing with dplyr and reshape2)
  • R 語言的資料探索
    • 描述性統計與視覺化探索實作 (with dplyr and ggplot2)
第三天
  • 探索性資料分析 (進階)
    • 熱點圖、泡泡圖、地圖
    • 群聚分析
  • 小組專案
第四天
  • 小組專案
  • 專案報告

先備知識

本課程具有R語言資料分析實作,報名者建議至少需要具備以下技能或心理準備,以獲取較好的學習效果:

  • 具備基本的程式語言經驗 (擔心有困難的同學請見行前自修)
  • 面對大量數據或是程式碼不會從內心興起一股莫名的恐慌
  • 看得懂英文軟體介面和操作說明

必備器材

學員須自備可以上網的筆記型電腦,建議使用下列作業系統:

  • Windows 7 或以上 (帳號不得包含中文)
  • Mac OS X 10.9 或以上
  • Ubuntu 14.04 或以上

活動開始前先自行安裝以下工具,安裝過程中有任何問題可參考DSP的疑難指南

  • R(R-3.2.5 以上版本)
  • RStudio IDE(0.98.1103 以上版本)

行前自修

本活動提供行前自修教材,沒有程式語言經驗的同學,可以透過 R 語言翻轉教室 學習系統的幫助 (包含系統安裝、上課講義、筆記),學習 R語言的基本功以達到最佳的活動體驗。自修的內容建議完成 R Basic 00-02,根據過往經驗,完成這項任務大約需要 2-4 小時,過程中有任何問題同學可以在聊天室 Gitter 進行發問,活動正式開始時我們也會幫大家做一個快速複習!

立即報名

講師介紹

Rafe 劉佳欣 (Rafe) 資料探險家,喜歡從資料中尋找蛛絲馬跡探索推理,用樸實的分析方法點石成金。現為交大博士候選人,賣過 20 塊一杯的手搖飲料,也賣過一張兩三萬的 Business Flight Ticket。從連鎖飲料店經營分析,到航空公司網站銷售管理,從唯利主義到追尋學術意義,浪子回頭不換金的資料分析經驗。希望能在這次營隊的參與,帶給大家不同的資料分析衝擊。
johnson1 謝宗震 (Johnson) 清華統計所博士,對於統計方法與工具的推廣具有極大的熱忱,期望利用統計思維及分析工具幫助各個領域解決問題。DSP智庫驅動 (dsp.im) 共同發起人,是台灣提供系統性資料科學教育訓練的先行者,目前已輔導超過300位政府、企業、非營利組織人士成為資料分析人才。
林敬昇_a 林敬昇 政大統計所,在Gogolook擔任資料分析實習生。
實習中,運用統計機器學習,協助公司挖掘資料之石,點石成金。
學校中,帶領小型資料分析團隊,運用健保資料庫進行人口統計、醫療相關研究。
雖然資料科學是茫茫大海,但期許自己以資料為信仰,在汪洋大海中為旅人提供方向與價值。
楊崇甫_a 楊崇甫 政大統計所,目前致力於健保資料庫的分析與統計,如何處理各種不同定義的原始資料檔,使其能夠被有價值的用來解決實務上的問題與發覺未來可能會發生的現象常常是我所必須思考的內容。R是我工作上的好夥伴,在資料海中讓我披荊斬棘,擁有強大資料視覺化功能的R更讓我在分析的呈現上感到驕傲,不知不覺間,如何讓各種資料『視覺化』竟然已經成為我平常的娛樂之一了。
陳昱霈_a 陳昱霈 (GU) 政大統計所,自從接觸到資料分析領域後便一頭栽進去而無法自拔。如果中文的旖旎在於其所傳達的無限意境;那麼程式語言的冷豔則是在於能把資料的潛在價值赤裸裸地攤開。致力於用所有人都聽得懂得語言建立起溝通橋樑,並且期許自己能利用資料分析幫助解決社會問題,讓臺灣變得美好。

適合對象

不論是管理學院、理工學院、文法農學院、醫學院或是社會科學相關科系的大專學生或研究生,歡迎報名。

 

報名資格

限政府立案大專院校之學生。(請於錄取並接獲通知後,提供蓋註冊章的學生證影本)

報名方式

  • 本活動預計招收 42 名。
  • 由於本活動強調學員專長背景的多元性,因此並非先報名先錄取,而會按照報名學員專業背景進行審查與評估,以便組成 5~6 個綜合型團隊。
  • 學員請在線上報名時如實填寫自身背景。
  • 主辦單位於收到線上報名資料後,經過適當分組考量,再通知學員是否錄取。

錄取方式

  • 本營隊採兩階段報名、錄取與繳費,重要日期如下:
    • 第一階段錄取名單公布時間:105/5/23 (一)
    • 第一階段繳費截止日期:105/5/30 (一)
    • 第二階段錄取名單公布時間:105/6/6 (一)
    • 第二階段繳費截止日期:105/6/13 (一)
  • 欲參加之學員須於105年6月5日報名截止前填妥報名表。因本營隊會按照報名人專業背景進行審查與評估,第一階段未獲錄取之同學,仍有機會在第二階段審查中獲得錄取資格。
  • 分階錄取學員皆應於該階段繳費截止日期前完成繳費,並提供在學證明。
  • 確定錄取學員若未於繳費截止前將活動費用匯款完畢,視同放棄錄取資格,名額將由備取學員遞補,主辦單位不另作通知。

繳費方式

接獲錄取通知的學員,請按照指示進行繳費。

活動費用

一般價:NT$12,000

學生特惠價:NT$ 3,600

特別感謝ITSA教育部資通訊軟體創新人才推升計畫支援本活動大部分經費,讓學生能以極優惠的價格,享受四天企業級專業課程。

主辦單位

  • DSP 智庫驅動
  • ITSA社群運算與巨量資料跨校資源中心

註1:主辦單位保留隨時調整活動內容之權利,以公告為準,並不另行通知。
註2:依學員出席情形全勤者,將核發電子學習時數證書。

聯繫窗口

電話:(02) 2939-3091 分機 63964 李小姐
Email: scs.nccu@gmail.com

立即報名

延伸閱讀