中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

數(shù)據(jù)分析的三大時間軸:過去、現(xiàn)在和未來

2018-08-19    來源:raincent

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用
很多人用不同的定義解釋“數(shù)據(jù)科學(xué)”,貌似都很合理,對數(shù)據(jù)科學(xué)這個問題的思考可以聯(lián)想到與之相關(guān)的其他領(lǐng)域,例如業(yè)務(wù)分析、數(shù)據(jù)分析、商業(yè)智能、高級分析、機(jī)器學(xué)習(xí),還有人工智能。

數(shù)據(jù)科學(xué)的“絕對定義”需要大量的“數(shù)據(jù)科學(xué)”背景才能被理解,這是一個遞歸的問題……可以說,統(tǒng)計學(xué)家或程序員理解什么是數(shù)據(jù)科學(xué)要容易得多,就像歷史學(xué)家或語言學(xué)家所說的那樣,前者已經(jīng)以一種或另一種形式暴露于數(shù)據(jù)科學(xué)之中。這使我們想到,數(shù)據(jù)科學(xué)的相對定義可能更有用,以下是相關(guān)看法。

這是一個描繪所有上述領(lǐng)域的歐拉圖。每個顏色代表一個不同的字段(混合的顏色表示交集),圖上還有一個時間軸和使用案例。

 

 

(矩形的位置、大小和顏色表現(xiàn)出概念上的相似性和差異,而不是復(fù)雜性)

下面就來分析具體的概念。

一、商業(yè)

為了避免過度簡化這個問題,這里認(rèn)為“商業(yè)”這個詞沒有任何定義,而融合商業(yè)的一些應(yīng)用案例則更有意思,例如商業(yè)案例研究、定性分析、初步數(shù)據(jù)報告、視覺報告、創(chuàng)建儀表板、銷售預(yù)測。

 

 

二、數(shù)據(jù)

考慮到最初的選擇,我們可以在業(yè)務(wù)和數(shù)據(jù)的交叉點中移動最近的四個術(shù)語,目前在圖片中表示為紫色區(qū)域。這是因為“初步數(shù)據(jù)報告”,“視覺報告”,“創(chuàng)建儀表板”和“銷售預(yù)測”屬于數(shù)據(jù)驅(qū)動的商業(yè)活動。外部可以基于過去的知識、經(jīng)驗和行為反對存在商業(yè)活動范圍內(nèi)的“商業(yè)案例研究’和‘定性分析’,但你很快就會看到——這不是真正的數(shù)據(jù)科學(xué)。

 

 

分析(Analysis)是指將你的問題分割成容易消化的區(qū)塊的過程,你可以單獨研究它們之間是如何相互關(guān)聯(lián)的。另一方面,分析(Analytics)是將邏輯和計算推理應(yīng)用于分析中獲得的組件部分。在這樣做的過程中,人們在尋找模式,并經(jīng)常探索人與分析能力的結(jié)合。因此,與業(yè)務(wù),數(shù)據(jù)相反的是,我們應(yīng)該要更好地使用Business Analytics和Data Analytics。

三、時間

在進(jìn)一步討論之前,讓我們先介紹一個時間軸,因為這對于后續(xù)的分割是至關(guān)重要的。我們將分析三個時態(tài)——過去、現(xiàn)在和未來。會有一條線分割圖表,指出任何分析問題的當(dāng)前時刻。左邊的分析指數(shù)代表過去,右邊的所有這些都可以進(jìn)行預(yù)測分析。

 

 

“銷售預(yù)測”移到了右邊,因為它的名字暗示著一個前瞻性的分析過程。廣義的“定性分析”就是利用你的直覺和經(jīng)驗來規(guī)劃你的下一步——從而寓意著未來。

數(shù)據(jù)科學(xué)是一個不能沒有數(shù)據(jù)的領(lǐng)域。因此,它完全屬于Data Analytics(數(shù)據(jù)分析)的范疇。它與Business Analytics(業(yè)務(wù)分析)的關(guān)系如何?嗯,事實證明,如果屬于Data Analytics和Business Analytics范疇內(nèi)的,同時也的確屬于Data Science范疇。

 

 

不過,需要說明的是,存在不直接和即時業(yè)務(wù)分析但屬于數(shù)據(jù)分析的數(shù)據(jù)科學(xué)流程。例如,“優(yōu)化鉆井業(yè)務(wù)”需要數(shù)據(jù)科學(xué)工具和技術(shù)。數(shù)據(jù)科學(xué)家很可能每天都這樣做。但是,雖然在“石油業(yè)務(wù)”領(lǐng)域,我們不能真正說它與Business Analytics直接相關(guān)。

在“相對定義”的概念上,要更好地說明這些點,“數(shù)字信號處理”就是數(shù)據(jù)分析的一部分,但不是Data Science,也不是Business Analytics。數(shù)據(jù)、編程和數(shù)學(xué)開始發(fā)揮作用,但并不像我們在Data Science中使用它們一樣。為了一致性,讓我們用時間軸來完成這件事——數(shù)據(jù)科學(xué)既是左邊的,也是右邊的線(如同其他的)。這就給我們帶來了一個問題:是不是所有的領(lǐng)域都具有“過去屬性”?

四、商業(yè)智能

商業(yè)智能(BI)是分析和總結(jié)歷史數(shù)據(jù)的過程。

 

 

商業(yè)智能(BI)是否就一定意味著過去?不一定,但它沒有涉及到預(yù)測分析。如圖所示,回歸、分類以及其他所有典型的預(yù)測方法都屬于Data Science的一部分,但不是BI。而且,商業(yè)智能完全是數(shù)據(jù)科學(xué)的分支,因此,當(dāng)一個人在處理過去事件時,用到描述性統(tǒng)計、報告或可視化時,這說明是在做BI和數(shù)據(jù)科學(xué)。

五、機(jī)器學(xué)習(xí)和人工智能

人工智能(AI)是由機(jī)器展示的任何形式的智能,它類似自然(人類)智能,例如規(guī)劃、自適應(yīng)學(xué)習(xí)、解決問題等。

機(jī)器學(xué)習(xí)(ML)是不被編程的情況下,機(jī)器預(yù)測結(jié)果的能力。

當(dāng)然,機(jī)器學(xué)習(xí)是人工智能的一種方法,但這兩種方法常常被混淆,不可否認(rèn)地是,人類目前探索的階段處于深度學(xué)習(xí)階段,這實際上也是抵達(dá)人工智能唯一可行的路徑,因此,當(dāng)我們在談?wù)揂I所使用的人工智能的真實應(yīng)用時,我們實際上是指的是深度學(xué)習(xí)。

在我們的圖表中,兩個術(shù)語符合以下方式。

 

 

可以看出,機(jī)器學(xué)習(xí)完全包含在Data Analytics(數(shù)據(jù)分析)內(nèi),如果沒有數(shù)據(jù),它將不能執(zhí)行,此外,它還與Data Science重疊,因為它是數(shù)據(jù)科學(xué)家兵庫里最好的工具之一。此外,它還是BI的一部分,只是不涉及預(yù)測分析。

“數(shù)據(jù)科學(xué)”中的機(jī)器學(xué)習(xí)實例是“客戶端保留”、“欺詐預(yù)防”和“創(chuàng)建實時儀表板”(也是BI的一部分),其中突出的應(yīng)用包括“語音識別”和“圖像識別”。這兩者也被認(rèn)為屬于數(shù)據(jù)科學(xué)范疇,這就是為什么我們把它們放在邊界上。

為了闡述其中的關(guān)系,總體來說,機(jī)器學(xué)習(xí)完全屬于AI的一部分,但AI本身也存在一些與業(yè)務(wù)和數(shù)據(jù)分析無關(guān)的子領(lǐng)域,例如“符號推理”。

六、高級分析

我們分析的最后一個領(lǐng)域是Advanced Analytics,它不是一個數(shù)據(jù)科學(xué)名詞,而是一個營銷的名詞。它用于描述“不那么容易處理的”分析。從本質(zhì)上來說,對于一個初學(xué)者來說,這個圖表中的所有內(nèi)容都是先進(jìn)的。雖然不是最好的術(shù)語,但肯定我們在整個條款中使用的所有“適當(dāng)”術(shù)語都是有用的。

 

 

排除AI并加入Advanced Analytics(高級分析),相信這將是極富價值的收獲。

標(biāo)簽: 數(shù)據(jù)分析

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:《貴陽市大數(shù)據(jù)安全管理條例》10月起施行(附全文)

下一篇:大數(shù)據(jù)研究常用軟件工具與應(yīng)用場景