企業已經逐漸掌握資料蒐集與儲存的方法與工具。然而,隨著資料日益增長與龐雜,如何從資料找出問題或商機,卻是越來越艱鉅的挑戰。因此,「統計分析與資料探勘」成為目前全世界最搶手的工作技能,也就很容易理解了。
面對堆積成山的資料原石,這些資料分析師,專注於運用資料思考方法,發揮一點點巧思,將資料逐步琢磨為讓人眼睛一亮的寶石。
《A1: 資料分析基礎班》顛覆傳統的教學方法,透過四天的密集課程,從資料思考的訓練開始,使用適當的商業案例與分析工具,帶領學員由淺入深,探索資料內涵,瞭解並描述資料與資料之間的微妙關聯,進而建立解釋資料趨勢的統計模型。最後,經由分組合作,綜合演練所學,完成一個小型專案。
—-> 前往報名 <—-
【課程目標】
學員應該自我期許,達成下列學習目標:
- 認識資料思考的方法
- 製作可以再利用的資料分析程式碼 (reproducible code for data analysis)
- 資料匯入與整理
- 探索式資料分析
- 基本統計分析
- 假設檢定
- 迴歸分析
- 小組合作,從頭到尾完成一個資料專案
【上課時間與地點】
- 時間:2015 年1月31日、2月1日、2月7日、2月8日(連續兩個週末,共四天,每日10:00 – 17:00)
- 地點:台北市內湖區瑞光路 318 號精誠資訊大樓 1 樓 R109(捷運文湖線港墘站步行 5 分鐘)
【課程介紹】
本課程屬於 《DSP 資料分析師學程》的入門級課程,共計四天(24 小時),學員將學習解決真實資料問題的完整流程。
本課程分為五個階段:
- 資料思考:學習如何將真實問題轉換成資料科學問題。
- 資料探索:進行資料處理,掌握資料脈絡。
- 資料分析:理解資料模型原理,執行統計推論與分析。
- 資料呈現:呈現分析結果製作,並製成可以再利用的資料分析程式碼,輔助決策。
- 綜合演練:透過個人的資料挑戰賽以及小組的迷你專案,驗收學習成效。
上課形式包括:
- 主題演講
- 個案討論
- R 語言資料分析實作
- 資料挑戰賽(個人)
- 迷你專案(分組)
【課程大綱】
- Day 1
- Data thinking
- Concepts & methods
- Data Processing
- Data import
- Filtering
- Imputation
- Exploratory data analysis
- Descriptive statistics
- Graph
- Mini project
- Data thinking
- Day 2
- Data reliability and validity
- Hypothesis testing
- A/B Testing
- Confidence intervals
- Use bootstrap methods to compute p-value
- Regression (1)
- Basic theories
- Simple regression
- Multiple regression
- Data project management
- Introduction to R Markdown
- Reproducible code for data analysis
- Mini project
- Day 3
- Regression (2)
- Diagnostics
- Goodness-of-fit
- Leveraged outliers
- Dependent errors and time series
- Feature selection
- Diagnostics
- Mini project
- Regression (2)
- Day 4
- Mini data challenges
- Mini team project
【先備知識】
我們建議報名者至少具備以下技能或心理準備,以獲取較好的學習效果:
- 具有程式語言基本使用經驗者 (有 R 語言經驗者佳)
- 看到大量數字符號不會頭暈者 (具有統計與線性代數基礎者更佳)
【上課器材與工具軟體】
學員須自備可以上網的筆記型電腦,建議使用下列作業系統:
- Windows 7 或以上
- Mac OS X 10.9 或以上
- Ubuntu 14.04 或以上
並在課程開始前先自行安裝以下工具
- R(R-3.1.2 以上版本)
- RStudio IDE(98.1091 以上版本)
注意:本課程「不會」教授 R 語言的安裝與環境設定。
【適合對象】
本課程著重於資料分析,適合具備任何一種程式語言的基本使用經驗、R 語言使用經驗,以及統計基礎知識者。
適合對象包括:
- 曾參加 DSP《R 語言的探索之旅》課程或是其他類似 R 入門課程者。
- 具有程式語言基本使用經驗,想學習資料分析理論與實作者。
- 想學習統計分析者。
【報名、費用與錄取方式】
- 報名網頁:http://dsp.kktix.cc/events/course-a1-basic-data-analysis
- 活動首頁:http://dsp.im/events/a1-basic-data-analysis-course/
- 課程費用:定價 12,800 元整(含稅)
- 名額:預計 30 名,額滿為止。
- 一般學員
- 先繳費,先錄取。
- 舊生優惠
- 僅限上過《R語言的探索之旅》的學員,九折優惠。
- 先繳費,先錄取。
- 企業夥伴優惠
- 精誠集團員工,八折優惠。
- 先繳費,先錄取。
- 最多保留 8 個名額。
- 非營利組織和政府單位優惠
- 特別保留 3 個五折優惠名額,提供予非營利組織和政府單位之正式員工。
- 報名時請填寫完整組織名稱,由主辦單位進行資格審查與錄取,非先報名先錄取。
- 請勿在收到繳費通知前逕行繳費,以免超額收取。
- 若有未經確認逕行繳費狀況,主辦單位有權拒絕錄取。
—-> 前往報名 <—-
【報名與繳費時間】
即日起至 2015 年 1 月 26 日止。
【講師介紹】
劉佳欣 (Rafe)
資料探險家,喜歡從資料中尋找蛛絲馬跡探索推理,用樸實的分析方法點石成金。現為交大博士班在職生,賣過 20 塊一杯的手搖飲料,也賣過一張兩三萬的 Business Flight Ticket。從連鎖飲料店經營分析,到航空公司網站銷售管理,從唯利主義到追尋學術意義,浪子回頭不換金的資料分析經驗。希望能在這次課程參與,帶給大家不同的資料分析衝擊。
謝宗震 (Johnson)
清華統計所博士後研究員,從事生物多樣性相關研究工作,與多位專業人士合作,發表多篇論文於該領域的頂尖期刊。擔任 TW R User Group 顧問的 Johnson 對於統計方法與工具的推廣具有極大的熱忱,期望利用統計思維及分析工具幫助各個領域解決問題。在許多人眼裡,數字往往艱澀難懂、遙不可及;在他的眼裡,數字是知識的原石,透過統計工具的建模與分析,將數字琢磨成有意義的東西,就像文字一樣具有生命力,述說著一個又一個現實世界的狀況,傳遞重要的訊息。
吳齊軒(Wush)
國立臺灣大學電機所博士生,平時致力於推廣 R 語言,曾主辦多場 R 語言推廣講座,並經常於 Taiwan R User Group 分享 R 的使用心得。有豐富的 R 語言實務經驗,包含資料的收集、整理、分析到報告製作。擅長根據專案需求,量身打造 R 的資料分析系統,以及運用 R 和 C++ 撰寫高效能演算法。
(主辦單位保留修改活動內容的權利。)
之前錯過R語言的課程,如果想報名A1資料分析基礎班,要先自學R語言,有什麼建議嗎?
Hi Ching,
這門課R的先備基礎,主要是R的基本語法以及在R環境中進行資料處理的部分。
這個部分可以參考 今年8月底 Taiwan R User Group 在台灣資料科學愛好者年會上的資料分析上手課程
http://taiwanrusergroup.github.io/DSC2014Tutorial/
看R basic課程即可。