授課科目名稱:資料探勘, Data Mining [104學年度(下): 2016/02-2016/06]

  • 授課教師: 吳漢銘 (淡江大學 數學系 專任副教授), 研究室: 騮先紀念科學館四樓 S432室 分機: 3147。
  • Office Hour: (五) 14:10~15:00。 E-mail: hmwu@mail.tku.edu.tw
  • 開課班級: 數學系碩士班。必/選修: 修。學分數:單學期3 學分 3小時。
  • 上課時間地點:  五/02, 03,04/Sa102
  • 先修科目: 無。
  • 實習課時間:  無。助教:

 

公告:

 

教學目的

本課程使用R為工具,讓學生實際進行資料處理及統計分析,從資料中了解問題,並擷取有用的資訊以解決問題,課程內容包含 (1) R的基礎操作; (2)圖形化之探索性數據分析; (3)迴歸分析及類神經網路; (4) 分類與預測;(5)群集分析;(6) 關聯性分析;(7) 文字探勘及一些案例分析; (8) 巨量資料議題及分析。希望藉由R之訓練,使同學們具有了解問題、數據處理、圖形呈現、統計分析、報表解釋及回應企業需求的能力。

 

教學內容及進度(依實際教學進度隨時修正)

週次 月/日 內容

回家功課/備註

第一週 02/19 課程簡介、Introduction to data mining
第二週 02/26

Exploratory data analysis(I)

第三週 03/04

Exploratory data analysis (II)

第四週 03/11 Data transformation and variable selection

 

第五週 03/18

Deal with missing values and outliers

 

第六週 03/25

Data Manipulation in R

第七週 04/01

Regression analysis

第八週

04/08

行政觀摩日(放假一天)

 

第九週

04/15

R程式資料處理練習

小考(1): 上機考,Openbook,
範圍: R functions

第十週

04/22

期中考 [上機考,Open book]

範圍: clustering, missing values imputations, data manipulation

第十一週 04/29 Cluster analysis
第十二週 05/06

Classification

第十三週 05/13

Association analysis

Artificial neural network

第十四週 05/20

Link analysis

小考(2): 上機考,Openbook
[考卷]

第十五週 05/27

Market analysis

第十六週

06/03

Association Rule Learning
Text and web mining

 

第十七週 06/10
6/4(六)

分組上台報告: 需交Powerpoint報告

分組期末報告注意事項

第十八週 06/17 期末考

 

教材課本

教師自編上課教材 。 

參考教材

  • RDataMining.com: R and Data: http://www.rdatamining.com/ 
  • Robert Kabacoff, 2015, R in Action: Data Analysis and Graphics with R, Manning Publications; Second Edition (June 6, 2015)
  • Jaynal Abedin, and Kishor Kumar Das, 2015, Data Manipulation with R, Packt Publishing, 2 edition (March 31, 2015)
  • Pawel Cichosz, 2015, Data Mining Algorithms: Explained Using R, Wiley; 1 edition (January 27, 2015).
  • Bater Makhabel, 2014, Learning Data Mining with R, Packt Publishing, (December 22, 2014).
  • Nina Zumel, John Mount, and Jim Porzak, 2014, Practical Data Science with R, Manning; 1st edition (April 13, 2014)
  • Yanchang Zhao, Yonghua Cen, 2013, Data Mining Applications with R, Academic Press; 1 edition (December 26, 2013)
  • Nagiza F. Samatova, William Hendrix, et al., 2013, Practical Graph Mining with R, Chapman and Hall/CRC (July 15, 2013)
  • Johannes Ledolter, 2013, Data Mining and Business Analytics with R, Wiley; 1 edition (May 28, 2013)
  • Graham Williams, 2011, Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery, Springer; 2011 edition (August 4, 2011)
  • Luis Torgo, Data Mining with R: Learning with Case Studies, Chapman and Hall/CRC; 1 edition (November 9, 2010)
  • 李仁鐘, 2015, 應用R語言於資料分析:從機器學習、資料探勘到巨量資料, 出版社:松崗, 2015/06/17
  • 胡嘉璽 譯 (韓偉原著), 2015, 巨量資料的第一步:基礎R語言與商業應用, 出版社:上奇資訊, 2015/02/09.
  • 黄文, 王正林, 2014, 利用R語言打通大數據的經脈, 出版社:佳魁資訊, 2014/12/26.




成績考核方式

  • 平時成績:40% (小考共2次,每次20%)。

  • 期中考成績:30% 。(上機考,Openbook)

  • 期末考成績:30% 。(交電子檔報告)

  • 調分/加分: 點名、上課表現、隨堂練習上傳、助教實習課表現。

 

備註 (上課相關)

  • 課堂以投影片(電腦_投影機)講授為主。上課前請先列印講義或將講義PDF存到個人USB隨身碟。
  • 缺課、曠課相關規定,依校規辦理。[淡江大學學生請假規則 第六條; 淡江大學學則 第三十八條]
  • 上課以「互相尊重」為最高原則並盡到「告知老師」的義務。
  • 上課請認真聽講並動腦思考。
  • 上課: (1) 可小聲討論。 (2) 可上廁所安靜去回。
  • 上課: (1) 不可使用手機相關電子產品。(手機請關靜音或震動。手機不可擺放至桌面) (2) 不可看其它書籍或上與課程無關的網站(尤其是FB)。(3) 不可聊天、睡覺、打牌 、抽煙等與學習本學科無關之事。(4) 不可飲食。
  • 四不一要: 「上課不聊天,睡覺不趴著,手機不要滑,考試不作弊,要認真。」
  • 課業上的問題,請同學互相討論後,再去問助教。 若有其它建議或問題反應,請e-mail老師FB留言
  • 上述「教學內容及進度」會依實際教學狀況修正。
  • 請隨時參閱課程網站(習題、公告、討論): http://www.hmwu.idv.tw

 

備註 (考試、成績相關)

  • 小考無特殊原因不得補考。(特殊原因請先報告老師)
  • 考試作弊或作業抄襲之同學當次及日後任何試卷及作業,老師全部不予批改。情節重大報校處理。
  • 對成績有疑問,請於當次成績公佈後一星期內連絡老師。
  • 出席點名為加分項目,但一學期之點名出席次數需達到點名總次數2/3以上始得加分。