中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

成為頂尖算法專家需要知道哪些算法?

2018-10-16    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

 

機器學習算法簡介

有兩種方法可以對你現(xiàn)在遇到的所有機器學習算法進行分類。

第一種算法分組是學習風格的。

第二種算法分組是通過形式或功能相似。

通常,這兩種方法都能概括全部的算法。但是,我們將重點關注通過相似性對算法進行分組。

通過學習風格分組的機器學習算法

 

 

算法可以通過不同的方式對問題進行建模,但是,無論我們想要什么結果都需要數(shù)據(jù)。此外,算法在機器學習和人工智能中很流行。讓我們來看看機器學習算法中的三種不同學習方式:

監(jiān)督學習

 

 

基本上,在監(jiān)督機器學習中,輸入數(shù)據(jù)被稱為訓練數(shù)據(jù),并且具有已知的標簽或結果,例如垃圾郵件/非垃圾郵件或股票價格。在此,通過訓練過程中準備模型。此外,還需要做出預測。并且在這些預測錯誤時予以糾正。訓練過程一直持續(xù)到模型達到所需水平。

示例問題:分類和回歸。

示例算法:邏輯回歸和反向傳播神經網絡。

無監(jiān)督學習

 

 

在無監(jiān)督機器學習中,輸入數(shù)據(jù)未標記且沒有已知結果。我們必須通過推導輸入數(shù)據(jù)中存在的結構來準備模型。這可能是提取一般規(guī)則,但是我們可以通過數(shù)學過程來減少冗余。

示例問題:聚類,降維和關聯(lián)規(guī)則學習。

示例算法:Apriori算法和k-Means。

半監(jiān)督學習

 

 

輸入數(shù)據(jù)是標記和未標記示例的混合。存在期望的預測問題,但該模型必須學習組織數(shù)據(jù)以及進行預測的結構。

示例問題:分類和回歸。

示例算法:其他靈活方法的擴展。

由功能的相似性分組的算法

ML算法通常根據(jù)其功能的相似性進行分組。例如,基于樹的方法以及神經網絡的方法。但是,仍有算法可以輕松適應多個類別。如學習矢量量化,這是一個神經網絡方法和基于實例的方法。

回歸算法

 

 

回歸算法涉及對變量之間的關系進行建模,我們在使用模型進行的預測中產生的錯誤度量來改進。

這些方法是數(shù)據(jù)統(tǒng)計的主力,此外,它們也已被選入統(tǒng)計機器學習。最流行的回歸算法是:

普通最小二乘回歸(OLSR);

線性回歸;

Logistic回歸;

逐步回歸;

多元自適應回歸樣條(MARS);

局部估計的散點圖平滑(LOESS);

基于實例的算法

 

 

該類算法是解決實例訓練數(shù)據(jù)的決策問題。這些方法構建了示例數(shù)據(jù)的數(shù)據(jù)庫,它需要將新數(shù)據(jù)與數(shù)據(jù)庫進行比較。為了比較,我們使用相似性度量來找到最佳匹配并進行預測。出于這個原因,基于實例的方法也稱為贏者通吃方法和基于記憶的學習,重點放在存儲實例的表示上。因此,在實例之間使用相似性度量。最流行的基于實例的算法是:

k-最近鄰(kNN);

學習矢量量化(LVQ);

自組織特征映射(SOM);

本地加權學習(LWL);

正則化算法

 

 

我在這里列出了正則化算法,因為它們很流行,功能強大。并且通常對其他方法進行簡單的修改,最流行的正則化算法是:

嶺回歸;

最小絕對收縮和選擇算子(LASSO);

彈性網回歸;

最小角回歸(LARS);

決策樹算法

 

 

決策樹方法用于構建決策模型,這是基于數(shù)據(jù)屬性的實際值。決策在樹結構中進行分叉,直到對給定記錄做出預測決定。決策樹通常快速準確,這也是機器學習從業(yè)者的最愛的算法。最流行的決策樹算法是:

分類和回歸樹(CART);

迭代Dichotomiser 3(ID3);

C4.5和C5.0(強大方法的不同版本);

卡方自動交互檢測(CHAID);

決策樹樁;

M5;

條件決策樹;

貝葉斯算法

 

 

這些方法適用于貝葉斯定理的問題,如分類和回歸。最流行的貝葉斯算法是:

樸素貝葉斯;

高斯樸素貝葉斯;

多項樸素貝葉斯;

平均一依賴估計量(AODE);

貝葉斯信念網絡(BBN);

貝葉斯網絡(BN);

聚類算法

 

 

幾乎所有的聚類算法都涉及使用數(shù)據(jù)中的固有結構,這需要將數(shù)據(jù)最佳地組織成最大共性的組。最流行的聚類算法是:

K-均值;

K-平均;

期望最大化(EM);

分層聚類;

關聯(lián)規(guī)則學習算法

 

 

關聯(lián)規(guī)則學習方法提取規(guī)則,它可以完美的解釋數(shù)據(jù)中變量之間的關系。這些規(guī)則可以在大型多維數(shù)據(jù)集中被發(fā)現(xiàn)是非常重要的。最流行的關聯(lián)規(guī)則學習算法是:

Apriori算法;

Eclat算法;

人工神經網絡算法

 

 

這些算法模型大多受到生物神經網絡結構的啟發(fā)。它們可以是一類模式匹配,可以被用于回歸和分類問題。它擁有一個巨大的子領域,因為它擁有數(shù)百種算法和變體。最流行的人工神經網絡算法是:

感知機;

反向傳播;

Hopfield神經網絡;

徑向基函數(shù)神經網絡(RBFN)

深度學習算法

 

 

深度學習算法是人工神經網絡的更新。他們更關心構建更大更復雜的神經網絡。最流行的深度學習算法是:

深玻爾茲曼機(DBM);

深信仰網絡(DBN);

卷積神經網絡(CNN);

堆疊式自動編碼器;

降維算法

 

 

與聚類方法一樣,維數(shù)減少也是為了尋求數(shù)據(jù)的固有結構。通常,可視化維度數(shù)據(jù)是非常有用的。此外,我們可以在監(jiān)督學習方法中使用它。

主成分分析(PCA);

主成分回歸(PCR);

偏最小二乘回歸(PLSR);

Sammon Mapping;

多維縮放(MDS);

投影追蹤;

線性判別分析(LDA);

高斯混合判別分析(MDA);

二次判別分析(QDA);

費舍爾判別分析(FDA);

常用機器學習算法列表

 

 

樸素貝葉斯分類器機器學習算法

通常,網頁、文檔和電子郵件進行分類將是困難且不可能的。這就是樸素貝葉斯分類器機器學習算法的用武之地。分類器其實是一個分配總體元素值的函數(shù)。例如,垃圾郵件過濾是樸素貝葉斯算法的一種流行應用。因此,垃圾郵件過濾器是一種分類器,可為所有電子郵件分配標簽“垃圾郵件”或“非垃圾郵件”;旧希前凑障嗨菩苑纸M的最流行的學習方法之一。這適用于流行的貝葉斯概率定理。

K-means:聚類機器學習算法

通常,K-means是用于聚類分析的無監(jiān)督機器學習算法。此外,K-Means是一種非確定性和迭代方法,該算法通過預定數(shù)量的簇k對給定數(shù)據(jù)集進行操作。因此,K-Means算法的輸出是具有在簇之間分離的輸入數(shù)據(jù)的k個簇。

支持向量機學習算法

基本上,它是用于分類或回歸問題的監(jiān)督機器學習算法。SVM從數(shù)據(jù)集學習,這樣SVM就可以對任何新數(shù)據(jù)進行分類。此外,它的工作原理是通過查找將數(shù)據(jù)分類到不同的類中。我們用它來將訓練數(shù)據(jù)集分成幾類。而且,有許多這樣的線性超平面,SVM試圖最大化各種類之間的距離,這被稱為邊際最大化。

SVM分為兩類:

線性SVM:在線性SVM中,訓練數(shù)據(jù)必須通過超平面分離分類器。

非線性SVM:在非線性SVM中,不可能使用超平面分離訓練數(shù)據(jù)。

Apriori機器學習算法

這是一種無監(jiān)督的機器學習算法。我們用來從給定的數(shù)據(jù)集生成關聯(lián)規(guī)則。關聯(lián)規(guī)則意味著如果發(fā)生項目A,則項目B也以一定概率發(fā)生,生成的大多數(shù)關聯(lián)規(guī)則都是IF_THEN格式。例如,如果人們購買iPad,那么他們也會購買iPad保護套來保護它。Apriori機器學習算法工作的基本原理:如果項目集頻繁出現(xiàn),則項目集的所有子集也經常出現(xiàn)。

線性回歸機器學習算法

它顯示了2個變量之間的關系,它顯示了一個變量的變化如何影響另一個變量。

決策樹機器學習算法

決策樹是圖形表示,它利用分支方法來舉例說明決策的所有可能結果。在決策樹中,內部節(jié)點表示對屬性的測試。因為樹的每個分支代表測試的結果,并且葉節(jié)點表示特定的類標簽,即在計算所有屬性后做出的決定。此外,我們必須通過從根節(jié)點到葉節(jié)點的路徑來表示分類。

隨機森林機器學習算法

它是首選的機器學習算法。我們使用套袋方法創(chuàng)建一堆具有隨機數(shù)據(jù)子集的決策樹。我們必須在數(shù)據(jù)集的隨機樣本上多次訓練模型,因為我們需要從隨機森林算法中獲得良好的預測性能。此外,在這種集成學習方法中,我們必須組合所有決策樹的輸出,做出最后的預測。此外,我們通過輪詢每個決策樹的結果來推導出最終預測。

Logistic回歸機器學習算法

這個算法的名稱可能有點令人困惑,Logistic回歸算法用于分類任務而不是回歸問題。此外,這里的名稱“回歸”意味著線性模型適合于特征空間。該算法將邏輯函數(shù)應用于特征的線性組合,這需要預測分類因變量的結果。

結論

我們研究了機器學習算法,并了解了機器學習算法的分類:回歸算法、基于實例的算法、正則化算法、決策樹算法、貝葉斯算法、聚類算法、關聯(lián)規(guī)則學習算法、人工神經網絡算法、深度學習算法、降維算法、集成算法、監(jiān)督學習、無監(jiān)督學習、半監(jiān)督學習、樸素貝葉斯分類器算法、K-means聚類算法、支持向量機算法、Apriori算法、線性回歸和Logistic回歸。熟悉這類算法獎有助你成為機器學習領域的專家!

標簽: 電子郵件 數(shù)據(jù)庫 網絡

版權申明:本站文章部分自網絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:AI寒冬將至?大咖們呼吁重啟AI

下一篇:關于機器學習,你應該知道的3個熱門專業(yè)術語