授課科目名稱:資料採礦, Data Mining [108學年度(下): 2020/03-2020/07]

  • 授課教師: 吳漢銘 (臺北大學 統計系 副教授), 研究室: 商館大樓七樓 7F12室 分機: 66773。
  • Office Hour: (六) 12:10~14:00。 E-mail: hmwu@gm.ntpu.edu.tw
  • 開課班級: 統碩職1、2 。必/選修: 修。學分數:單學期3 學分 3小時。
  • 上課時間地點:  六/02-04節(9:10~12:00)/民生校區教學大樓515電腦教室
  • 先修科目: 無。
  • 實習課時間:  無。助教:

 

公告:

 

教學目的

本課程使用R為工具,學習資料探勘的一些原理及方法,讓學生實際進行資料處理及統計分析,從資料中了解問題,並擷取有用的資訊以解決問題。大綱如下: 上課內容為: 資料探勘簡介, R語言簡介(I)、R語言程式設計、R語言統計圖形、資料探勘簡介,探索性資料分析、遺失值處理,資料轉換、假設檢定與變異數分析、統計模型與迴歸分析、維度縮減、群集分析、分類法則、整合學習、關聯性分析、R網路爬蟲(若時間夠的話)。

 

教學內容及進度(依實際教學進度隨時修正)

週次 月/日 內容

回家功課/備註

第一週 03/07 資料探勘簡介, R語言簡介(I)  
第二週 03/14

R語言程式設計 (複習)

 
第三週 03/21

R語言統計圖形 (複習)

 
第四週 03/28 資料探勘簡介,探索性資料分析

第五週 04/04
[放假]

民族掃墓 節、兒童節 。

第六週 04/11

遺失值處理、資料轉換

 
第七週 04/18

假設檢定與變異數分析

 
第八週

04/25

統計模型與迴歸分析

第九週

05/02

練習(I)

 

第十週

05/09

期中考 [上機考,Open book]

範圍:

第十一週 05/16 維度縮減  
第十二週 05/23

群集分析(I)

 
第十三週 05/30 群集分析(II)  
第十四週 06/06

分類法則

 

第十五週 06/13

整合學習

 
第十六週

06/20

關聯性分析

第十七週 06/27 R網路爬蟲, 練習(II)

第十八週 07/04 期末考 [期末分組報告]
 

 

教材課本

教師自編上課教材 。 

參考教材

  • RDataMining.com: R and Data: http://www.rdatamining.com/ 
  • Robert Kabacoff, 2015, R in Action: Data Analysis and Graphics with R, Manning Publications; Second Edition (June 6, 2015)
  • Jaynal Abedin, and Kishor Kumar Das, 2015, Data Manipulation with R, Packt Publishing, 2 edition (March 31, 2015)
  • Pawel Cichosz, 2015, Data Mining Algorithms: Explained Using R, Wiley; 1 edition (January 27, 2015).
  • Bater Makhabel, 2014, Learning Data Mining with R, Packt Publishing, (December 22, 2014).
  • Nina Zumel, John Mount, and Jim Porzak, 2014, Practical Data Science with R, Manning; 1st edition (April 13, 2014)
  • Yanchang Zhao, Yonghua Cen, 2013, Data Mining Applications with R, Academic Press; 1 edition (December 26, 2013)
  • Nagiza F. Samatova, William Hendrix, et al., 2013, Practical Graph Mining with R, Chapman and Hall/CRC (July 15, 2013)
  • Johannes Ledolter, 2013, Data Mining and Business Analytics with R, Wiley; 1 edition (May 28, 2013)
  • Graham Williams, 2011, Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery, Springer; 2011 edition (August 4, 2011)
  • Luis Torgo, Data Mining with R: Learning with Case Studies, Chapman and Hall/CRC; 1 edition (November 9, 2010)
  • 李仁鐘, 2015, 應用R語言於資料分析:從機器學習、資料探勘到巨量資料, 出版社:松崗, 2015/06/17
  • 胡嘉璽 譯 (韓偉原著), 2015, 巨量資料的第一步:基礎R語言與商業應用, 出版社:上奇資訊, 2015/02/09.
  • 黄文, 王正林, 2014, 利用R語言打通大數據的經脈, 出版社:佳魁資訊, 2014/12/26.




成績考核方式

  • 平時成績:30% (小考共2次,每次15%)。

  • 期中考成績:30% 。(上機考,Openbook)

  • 期末考成績:40% 。(交分組電子檔報告)

  • 額外加分: 點名(10%)、作業(20%)、上課表現、隨堂練習上傳

 

備註 (上課相關)

  • 課堂以投影片(電腦_投影機)講授為主。上課前請先列印講義或將講義PDF存到個人USB隨身碟。
  • 缺課、曠課相關規定,依校規辦理。
  • 上課以「互相尊重」為最高原則並盡到「告知老師」的義務。
  • 上課請認真聽講並動腦思考。
  • 上課: (1) 可小聲討論。 (2) 可上廁所安靜去回。
  • 上課: (1) 不可使用手機相關電子產品。(手機請關靜音或震動。手機不可擺放至桌面) (2) 不可看其它書籍或上與課程無關的網站(尤其是FB)。(3) 不可聊天、睡覺、打牌 、抽煙等與學習本學科無關之事。(4) 不可飲食。
  • 四不一要: 「上課不聊天,睡覺不趴著,手機不要滑,考試不作弊,要認真。」
  • 課業上的問題,請同學互相討論後,再去問助教。 若有其它建議或問題反應,請e-mail老師FB留言
  • 上述「教學內容及進度」會依實際教學狀況修正。
  • 請隨時參閱課程網站(習題、公告、討論): http://www.hmwu.idv.tw

 

備註 (考試、成績相關)

  • 小考無特殊原因不得補考。(特殊原因請先報告老師)
  • 考試作弊或作業抄襲之同學當次及日後任何試卷及作業,老師全部不予批改。情節重大報校處理。
  • 對成績有疑問,請於當次成績公佈後一星期內連絡老師。
  • 出席點名為加分項目,但一學期之點名出席次數需達到點名總次數2/3以上始得加分。