美女视频网站软件免费下载,刘亦菲牛仔裤视频,美女视频照片

數(shù)據(jù)挖掘

2023.03.31 山東

數(shù)據(jù)庫中知識發(fā)現(xiàn)（knowledge discovery in database）是指將未加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的整個過程，此過程包括一系列轉(zhuǎn)換步驟，從數(shù)據(jù)的預(yù)處理到數(shù)據(jù)挖掘結(jié)果的后處理。數(shù)據(jù)挖掘技術(shù)可以用來探查大型數(shù)據(jù)庫，發(fā)現(xiàn)先前未知的有用模式。數(shù)據(jù)挖掘還可以預(yù)測未來觀測結(jié)果。

數(shù)據(jù)挖掘利用了來自如下領(lǐng)域的思想：①統(tǒng)計學的抽樣、估計和假設(shè)檢驗。②人工智能、模式識別和機器學習的搜索算法、建模技術(shù)和學習理論。③最優(yōu)化、進化計算、信息論、信號處理、可視化和信息檢索等領(lǐng)域的思想。

通常，數(shù)據(jù)挖掘任務(wù)分為兩大類：①預(yù)測任務(wù)。這些任務(wù)的目標是根據(jù)其他屬性的值，預(yù)測特定屬性的值。②描述任務(wù)。此任務(wù)的目標是導出概括數(shù)據(jù)中潛在聯(lián)系的模式（相關(guān)、趨勢、聚類、軌跡和異常）。本質(zhì)上，描述性數(shù)據(jù)挖掘任務(wù)通常是探查性的，并且常常需要后處理技術(shù)驗證和解釋結(jié)果。其中，預(yù)測建模涉及以自變量函數(shù)的方式為因變量建立模型。有兩類預(yù)測建模任務(wù)：一個是分類，用于預(yù)測離散的因變量；另一個是回歸，用于預(yù)測連續(xù)的因變量。

關(guān)聯(lián)分析、聚類分析和異常檢測是實現(xiàn)數(shù)據(jù)挖掘任務(wù)的方法。關(guān)聯(lián)分析用來發(fā)現(xiàn)描述數(shù)據(jù)中強關(guān)聯(lián)特征的模式。所發(fā)現(xiàn)的模式通常蘊含規(guī)則或特征子集的形式表示。由于搜索空間是指數(shù)規(guī)模的，關(guān)聯(lián)分析的目標是以有效的方式提取最有趣的模式。聚類分析旨在發(fā)現(xiàn)緊密相關(guān)的觀測值組群，使得與屬于不同簇的觀測值相比，屬于同一簇的觀測值相互之間盡可能類似。異常檢測的任務(wù)是識別其特征顯著不同于其他數(shù)據(jù)的觀測值。這樣的觀測值稱為異常點或離群點。異常檢測算法的目標是發(fā)現(xiàn)真正的異常點，而避免錯誤地將正常的對象標注為異常點。

數(shù)據(jù)挖掘主要算法有決策樹算法（如C4.5和CART算法）、K均值聚類算法、支持向量機、Apriori關(guān)聯(lián)算法、EM最大期望算法、連接分析算法（如PageRank算法）、AdaBoost迭代算法、k鄰近算法、樸素貝葉斯算法等。

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

打開APP，閱讀全文并永久保存查看更多類似文章

part0-數(shù)據(jù)挖掘引文

數(shù)據(jù)挖覺

數(shù)據(jù)挖掘的入門概念

學會數(shù)據(jù)分析背后的挖掘思維，分析就完成了一半！

數(shù)據(jù)挖掘任務(wù)類型

干貨 | 數(shù)據(jù)挖掘中的十大實用方法

更多類似文章 >>

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看