資料工程團訓班

資料工程團訓班


用豪華的講師陣容,換取自修踩地雷的時間

巨量資料 4V (Volume, Velocity, Variety, Veracity) 的時代,無法想像沒有資料工程師的存在。

《資料工程團訓班》延攬業界一級講師,將透過整合性專案實作,帶領想要從事「資料工程」或是「資料分析」工作的學員,從資料介接、資料架構設計、資料儲存與擷取、建立分析報表、到資料庫效能調整與評估,走一趟完整的資料生命旅程,並完成一個資料工程專案。

課程用心

講師很用心設計課程,在困難的地方配合更多的實作,再加上助教大大的溫馨協助,真的可以把技術學回家。 學生L

內容豐富

很少上到的課程講義跟書一樣厚,準備的 VM 裡面也有好多寶,新手、老手都可以帶很多東西回去! 學生Q

立即報名

課程目標


學員應該自我期許,達成下列學習目標:
  • 建立資料儲存基礎設施 (Linux)
  • 資料介接與儲存 (Python)
  • 瞭解及設計資料庫 (PostgreSQL)
  • 學習撰寫結構化查詢語言 (SQL Query)
  • 摘取資料,建立分析報表 (Python Pandas)
  • 綜合所學,從無到有,完成這輩子第一個資料工程專案

課程大綱


本次課程由淺入深,採三種方案販售,有興趣的朋友請依照您的背景知識選擇最適合的方案。
  • 方案A:Linux + Python + PostgreSQL + pandas (Day 1-4, 24小時)
  • 方案B:Python + PostgreSQL + pandas (Day 2-4, 18小時)
  • 方案C:PostgreSQL + pandas (Day 3-4, 12小時)
E1process

第一天 (Linux)

  • 什麼是資料基礎設施(infrastructure)?
  • 建立與設定開發環境
  • Linux 簡介
    • Linux為開發環境的特色
  • Linux 系統常用指令實作
    • 一般操作
    • 檔案管理
      • 目錄結構
      • 檔案操作
      • 文件編輯器
    • 套件管理實作
      • APT / PIP
  • 小型專案

第二天 (Python)

  • 設定 Python 運作環境
  • Python 簡介
  • 撰寫第一個 Python 腳本 (.py)
  • Python 基本實作
    • 各種資料型態、控制結構與函式
    • 模組的匯入與概念
    • 資料互動實作
    • 設計資料流程
    • 資料收集
    • 資料轉換
    • 資料讀取
  • 小型專案
    • In-memory Extract-Transform-Load

第三天 (PostgreSQL)

  • 資料庫簡介
  • 資料庫評估解決方案要點
  • 資料庫基本實作 (PostgreSQL)
  • 基礎查詢
    • 運算式與函數式
    • CRUD Index / Primary Key / Foreign Key
    • Normalization / Denormaliztion
    • Join
    • Python + PostgreSQL實作
    • 資料庫效能提升實務
  • 小型專案
    • In-disk Transform-Load

第四天 (pandas)

  • 資料工程師的工作簡介與學習路徑
  • Python Pandas 實作
    • pandas 操作資料的一大利器!
    • pandas 提供的資料結構與操作
      • Series
      • Data Frame
    • 資料的匯入與獲取
    • 資料處理範例
    • 繪圖指令
    • PostgreSQL的存取
    • pandas + PostgreSQL 實作
    • pandas 基礎分析
  • 小型專案

適合對象


適合對象包括:
  • 社會科學想跨足資料科學領域者
  • 想培養資料工程職能的資料分析師
  • 具有程式語言基本使用經驗,想學習資料庫理論與實作者
  • 想學習資料庫實務者
關於課程方案的選擇,如果您:
  • 具備任何一種程式語言的基本使用經驗,建議選擇 方案A
  • 具備Linux 基礎知識,建議選擇 方案B
  • 具備Python 語言使用經驗,建議選擇 方案C

上課須知


時間與地點

  • 時間:2015 年 11/14、15、21、22(連續兩個週末,共四天,每日10:00 – 17:00)
  • 台北市南港區三重路19-11號4樓(南港軟體園區一期E棟)

必備工具

學員須自備可以上網的筆記型電腦,建議使用下列作業系統:
  • Windows 7 或以上 / Mac OS X 10.9 或以上 / Ubuntu 14.04 或以上
 

講師介紹


Tim 許文昌 (Tim) Taipei.py 月會主辦人之一。 2012 年參與 Evernote Hackathon,榮獲台灣區冠軍;2014 百度開放雲 Hackathon,獲得最有潛力獎。 曾任職於趨勢科技,目前跟好朋友創辦了洞悉科技,希望可以做出讓世界更好的好服務,好軟體。
Mosky 劉依語 (Mosky) Python Charmer at Pinkoi,也就是設計品購物網站 Pinkoi 的後端工程師,平時主要以 Python 語言撰寫程式。活躍於開放原始碼社群,曾在 10 場國內外研討會發表演講、教授過超過 100 小時的 Python 課程、擁有 4 個以上的開放原始碼專案、9 年以上程式開發經驗。於業內業餘累積了豐厚的 Python 與多樣資料來源以及不同資料庫互動的實務經驗,希望透過資料課程分享及傳遞這些處理資料的經驗。
tim 洪培仁 (Tim Hong) APP雙棲開發者,使用Python開發資料API介接工具,專注資料收集及軟硬整合,並使用跨領域軟硬工具及平台提出解決 方案。現任企業應用顧問、中華科大業師、北市府Open Data 顧問。關心城市、人文、設計相關領域之數位呈現,並且關注網路社會、Open Data、都市資料、人與資訊之關係。
(主辦單位保留修改活動內容的權利。)

報名、費用與錄取方式


課程費用:

  • 方案A:定價12,800元整(含稅)
  • 方案B:定價10,800元整(含稅)
  • 方案C:定價8,800元整(含稅)
  • 名額:預計 30 名,額滿為止。
  • 一般學員
    • 先繳費,先錄取。
  • 企業夥伴優惠
    • 企業夥伴員工,八折優惠。
    • 先繳費,先錄取。
    • 最多保留 8 個名額。
    • 有意加入合作夥伴的企業請洽:service@dsp.im 。
  • 非營利組織和政府單位優惠
    • 特別保留 3 個五折優惠名額,提供予非營利組織和政府單位之正式員工。
    • 報名時請填寫完整組織名稱,由主辦單位進行資格審查與錄取,非先報名先錄取。
    • 請勿在收到繳費通知前逕行繳費,以免超額收取。
    • 若有未經確認逕行繳費狀況,主辦單位有權拒絕錄取。

繳費截止期限:

2015 年 11 月9 日,星期一截止。

立即報名


 

您的姓名*

英文姓名* (供核發學習時數證明之用)

聯絡電話*

電子郵件*

任職單位 / 學校名稱*

目前職務 / 就讀系所*

統一編號

發票地址*

餐點*  葷食 素食

*現在工作最接近的角色: 產品經理人 資料分析師 資料工程師 其他

Linux 熟悉程度自評:生疏  1 2 3 4 5 精通

Python 熟悉程度自評:生疏  1 2 3 4 5 精通

課程抵用卷序號:


選擇票種*


【方案A】Linux + Python + PostgreSQL + pandas (Day 1-4, 24小時),$12,800
【方案B】Python + PostgreSQL + pandas (Day 2-4, 18小時),$10,800
【方案C】PostgreSQL + pandas (Day 3-4, 12小時),$8,800


本課程收款服務由 Allpay 歐付寶 提供,若付款有任何問題請來信 service@dsp.im