授課科目名稱:資料探勘, Data Mining [104學年度(下): 2016/02-2016/06]
- 授課教師: 吳漢銘 (淡江大學 數學系 專任副教授), 研究室: 騮先紀念科學館四樓 S432室 分機: 3147。
- Office Hour: (五) 14:10~15:00。 E-mail: hmwu@mail.tku.edu.tw
- 開課班級: 數學系碩士班。必/選修: 選修。學分數:單學期3 學分 3小時。
- 上課時間地點: 五/02, 03,04/Sa102 。
- 先修科目: 無。
- 實習課時間: 無。助教: 無。
公告:
- 置頂: 小考、期中、期末考成績紀錄表 (最近更新: 2016/06/18)
- [2016/05/21] [***重要***] 請各位修課同學上網填寫「期末教學意見調查」。期限: 2016/05/23(一)~2016/06/05(日)。
- [2016/03/14] [***重要***] 請各位修課同學上網填寫「期中教學意見調查」。期限: 2016/03/14(一)~03/27(日)。
- [2016/02/18] 上課用資料。
- [2016/01/05] 如何上傳「學習紀錄」「練習題」「作業」「答案卷」等等。
- [2016/01/05] 講義請於下列「教學內容及進度」下載。上課時,請自行帶筆電來練習程式及案例分析。
- [2016/01/05] 校訂教學計畫表。
教學目的:
本課程使用R為工具,讓學生實際進行資料處理及統計分析,從資料中了解問題,並擷取有用的資訊以解決問題,課程內容包含 (1) R的基礎操作; (2)圖形化之探索性數據分析; (3)迴歸分析及類神經網路; (4) 分類與預測;(5)群集分析;(6) 關聯性分析;(7) 文字探勘及一些案例分析; (8) 巨量資料議題及分析。希望藉由R之訓練,使同學們具有了解問題、數據處理、圖形呈現、統計分析、報表解釋及回應企業需求的能力。
教學內容及進度(依實際教學進度隨時修正):
週次 | 月/日 | 內容 |
回家功課/備註 |
第一週 | 02/19 | 課程簡介、Introduction to data mining | |
第二週 | 02/26 |
Exploratory data analysis(I) |
|
第三週 | 03/04 |
Exploratory data analysis (II) |
|
第四週 | 03/11 | Data transformation and variable selection |
|
第五週 | 03/18 |
|
|
第六週 | 03/25 | ||
第七週 | 04/01 | ||
第八週 |
04/08 |
行政觀摩日(放假一天) |
|
第九週 |
04/15 |
R程式資料處理練習 |
小考(1): 上機考,Openbook, 範圍: R functions |
第十週 |
04/22 |
期中考 [上機考,Open book] |
範圍: clustering, missing values imputations, data manipulation |
第十一週 | 04/29 | Cluster analysis | |
第十二週 | 05/06 | ||
第十三週 | 05/13 |
Association analysis Artificial neural network |
|
第十四週 | 05/20 |
Link analysis |
小考(2): 上機考,Openbook |
第十五週 | 05/27 |
Market analysis |
|
第十六週 |
06/03 |
Association Rule Learning |
|
第十七週 | 06/10 6/4(六) |
分組上台報告: 需交Powerpoint報告 |
|
第十八週 | 06/17 | 期末考 |
教材課本:
教師自編上課教材 。
參考教材:
- RDataMining.com: R and Data: http://www.rdatamining.com/
- Robert Kabacoff, 2015, R in Action: Data Analysis and Graphics with R, Manning Publications; Second Edition (June 6, 2015)
- Jaynal Abedin, and Kishor Kumar Das, 2015, Data Manipulation with R, Packt Publishing, 2 edition (March 31, 2015)
- Pawel Cichosz, 2015, Data Mining Algorithms: Explained Using R, Wiley; 1 edition (January 27, 2015).
- Bater Makhabel, 2014, Learning Data Mining with R, Packt Publishing, (December 22, 2014).
- Nina Zumel, John Mount, and Jim Porzak, 2014, Practical Data Science with R, Manning; 1st edition (April 13, 2014)
- Yanchang Zhao, Yonghua Cen, 2013, Data Mining Applications with R, Academic Press; 1 edition (December 26, 2013)
- Nagiza F. Samatova, William Hendrix, et al., 2013, Practical Graph Mining with R, Chapman and Hall/CRC (July 15, 2013)
- Johannes Ledolter, 2013, Data Mining and Business Analytics with R, Wiley; 1 edition (May 28, 2013)
- Graham Williams, 2011, Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery, Springer; 2011 edition (August 4, 2011)
- Luis Torgo, Data Mining with R: Learning with Case Studies, Chapman and Hall/CRC; 1 edition (November 9, 2010)
- 李仁鐘, 2015, 應用R語言於資料分析:從機器學習、資料探勘到巨量資料, 出版社:松崗, 2015/06/17
- 胡嘉璽 譯 (韓偉原著), 2015, 巨量資料的第一步:基礎R語言與商業應用, 出版社:上奇資訊, 2015/02/09.
- 黄文, 王正林, 2014, 利用R語言打通大數據的經脈, 出版社:佳魁資訊, 2014/12/26.
成績考核方式:
-
平時成績:40% (小考共2次,每次20%)。
-
期中考成績:30% 。(上機考,Openbook)
-
期末考成績:30% 。(交電子檔報告)
-
調分/加分: 點名、上課表現、隨堂練習上傳、助教實習課表現。
備註 (上課相關):
- 課堂以投影片(電腦_投影機)講授為主。上課前請先列印講義或將講義PDF存到個人USB隨身碟。
- 缺課、曠課相關規定,依校規辦理。[淡江大學學生請假規則 第六條; 淡江大學學則 第三十八條]
- 上課以「互相尊重」為最高原則並盡到「告知老師」的義務。
- 上課請認真聽講並動腦思考。
- 上課: (1) 可小聲討論。 (2) 可上廁所安靜去回。
- 上課: (1) 不可使用手機相關電子產品。(手機請關靜音或震動。手機不可擺放至桌面) (2) 不可看其它書籍或上與課程無關的網站(尤其是FB)。(3) 不可聊天、睡覺、打牌 、抽煙等與學習本學科無關之事。(4) 不可飲食。
- 四不一要: 「上課不聊天,睡覺不趴著,手機不要滑,考試不作弊,要認真。」
- 課業上的問題,請同學互相討論後,再去問助教。 若有其它建議或問題反應,請e-mail老師或FB留言。
- 上述「教學內容及進度」會依實際教學狀況修正。
- 請隨時參閱課程網站(習題、公告、討論): http://www.hmwu.idv.tw。
備註 (考試、成績相關):
- 小考無特殊原因不得補考。(特殊原因請先報告老師)
- 考試作弊或作業抄襲之同學當次及日後任何試卷及作業,老師全部不予批改。情節重大報校處理。
- 對成績有疑問,請於當次成績公佈後一星期內連絡老師。
- 出席點名為加分項目,但一學期之點名出席次數需達到點名總次數2/3以上始得加分。