課程介紹
使用R分析營業數據和其他大型數據, 學習擷取網路資料, 資料整理, 分析與資料視覺化。
本課程之作業與測驗放置在數位化學習平台.
教科書:
自編講義
課程活動
-
1.課程簡介介紹本課程上課內容與評分方式
-
閱讀 > 1 分鐘 1.1 大數據資料處理實務2023ch01-
-
閱讀 > 11 分鐘 1.2 BD2023-ch1 11:46
-
-
2.讀取資料
- 載library(data.table)
- 使用fread()函數讀取本機資料和covid 19
- 資料格式int, num, chr
- 資料查詢方式
- 遺漏值的問題
-
閱讀 > 21 分鐘 2.1 大數據資料處理實務ch02-1 21:45
-
閱讀 > 9 分鐘 2.2 ch02-2 09:07
-
閱讀 > 1 分鐘 2.3 大數據資料處理實務2
-
3.資料篩選
- 重複資料
- 遺漏值
- 異常資料處理
-
閱讀 > 8 分鐘 3.1 ch03 08:09
-
閱讀 > 1 分鐘 3.2 大數據資料處理實務3
-
4.資料連結與整併連結不同檔案的數據方式
-
閱讀 > 21 分鐘 4.1 ch04 21:53
-
閱讀 > 1 分鐘 4.2 大數據資料處理實務4
-
-
5.邏輯運算
- 邏輯運算子
- 比較運算子
- 條件比對
-
閱讀 > 16 分鐘 5.1 ch05-1 16:58
-
閱讀 > 1 分鐘 5.2 大數據資料處理實務5-1
-
6.集合與字串處理
- 查詢符合
- 比對字串
- 符合數量
-
閱讀 > 13 分鐘 6.1 ch06 13:22
-
閱讀 > 1 分鐘 6.2 大數據資料處理實務5-2
-
7.集中趨勢統計量
- 平均數
- 標準差
- 眾數
-
閱讀 > 21 分鐘 7.1 ch07 21:44
-
閱讀 > 1 分鐘 7.2 大數據資料處理實務6-1
-
8.百分位數
- 百分位數
- 四分位數
- 十分位數
-
閱讀 > 5 分鐘 8.1 ch08 05:52
-
閱讀 > 1 分鐘 8.2 大數據資料處理實務6-2
-
9.分散趨勢統計量
- 變異數、標準差
- 四分位數、全距
-
閱讀 > 12 分鐘 9.1 ch09 12:38
-
閱讀 > 1 分鐘 9.2 大數據資料處理實務6-3
-
10.檔案資料處理
- 讀取檔案
- 濾除資料
- 基本統計量
-
閱讀 > 12 分鐘 10.1 ch10 12:59
-
閱讀 > 1 分鐘 10.2 大數據資料處理實務6-4
-
11.統計圖-散佈圖
-
閱讀 > 29 分鐘 11.1 ch11 29:44
-
閱讀 > 15 分鐘 11.2 ch12 15:14
-
閱讀 > 1 分鐘 11.3 大數據資料處理實務scatterplot08
-