2010年1月21日 星期四

Data Mining基本概念之二

Data Mining是由以下幾個主要元件(major components)所組而成:
  • 資料庫、資料倉儲、網際網路(WWW)、其他資訊儲存庫(Database, data warehouse,WorldWideWeb, or other information repository)
  • 資料庫或資料倉儲服務器(Database or data warehouse server):基於使用者探勘的需要,因此服務器會負責擷取需要的相關資料
  • 知識庫(Knowledge base):這是一種專門領域的知識,用來引導搜尋或評估驗證結果模型
  • 探勘引擎(Data mining engine):這是在資料探勘系統中最重要的功能元件,用來執行關聯&相關性分析(association and correlation analysis)、分群(cluster analysis)、分類(classification,)、預測(prediction,)、異常分析(outlier analysis)和趨勢分析(evolution analysis)。
  • 模式驗證模組(Pattern evaluation module)這個元件主要用來驗證資料探勘的模型,以專注在有意義並且感興趣的結果上,通常會採用興趣值門檻(interestingness thresholds)來過濾模式,將不感興趣的模式從知識當中分開

Figure 1. Architecture of a typical data mining system

沒有留言:

張貼留言