應用資料探勘技術實現個人化推薦之研究與實作

 

隨著使用者的持續增加,及各式各樣的網站不斷推陳出新,如何在成千上萬的網站中脫穎而出,獲得使用者的青睞,就成為當前相當熱門且重要的課題。贏得這場競賽的關鍵在於,掌握每一位使用者的真正需求,並進而提供使用者最需要的服務。掌握使用者的需求,可從使用者過去的行為推論起。

我們將應用並改良資料探勘的技術,推導出使用者的資訊需求,進而提供最符合需求的推薦資訊。本計畫將分下列三階段執行:

(一)應用傳統的資料探勘技術於個人化推薦

第一個階段我們將採取傳統關聯法則的探勘方法,由日誌資料中推導使用者的瀏覽興趣及行為,以產生個人側寫檔;並將個人側寫檔應用在使用者分群上,再利用分群結果提供個人化推薦的資訊服務。在這個階段,我們將設計並實作一套論文推薦系統雛型,以測試所得到的使用者側寫檔是否有效。

(二)多重分類的資料探勘技術研究

第二個階段,我們將進一步考慮資料的多重分類特性,設計分類階層樹的資料結構,以便進行階層式關聯法則的探勘。在這個階段,我們將分析各種相關探勘技術的效能,並進行模擬實驗以比較其效率上的差異。

(三)應用多重分類的資料探勘技術於個人化推薦

第三階段,我們將應用多重分類的概念,於個人側寫檔的推導上,包括週期性與多類式個人興趣及行為的探勘;並分別提供不同的個人化推薦。最後,我們將比較這些推薦服務的效果,以分析不同探勘技術對個人化系統的影響。

本計畫所研發的各項成果,包括:個人興趣及行為之探勘演算法、分類階層樹之資料結構及相關演算法、階層式關連法則的探勘演算法、及多類式個人興趣及行為之探勘演算法,將來皆可提供申請國家專利之用。