中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

不要讓數(shù)據(jù)科學(xué)成為一場騙局

2018-08-10    來源:raincent

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用
現(xiàn)在的公司熱衷于將數(shù)據(jù)科學(xué)視為點(diǎn)石成金的魔法,垂涎數(shù)據(jù)科學(xué)將帶來的革命性成果,爭相追隨科技巨頭,并翹首以待。他們重金聘請價(jià)格不菲的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師,斥巨資投入到軟件和硬件上,并花了很多時間暢想美好的未來。然而,盡管付出了這么多的努力和金錢,很多公司幾乎沒有從中獲得任何實(shí)質(zhì)性的好處。因?yàn)樗麄儼奄Y源浪費(fèi)在了太多實(shí)驗(yàn)或沒有明確商業(yè)用途的項(xiàng)目以及與實(shí)現(xiàn)組織目標(biāo)不相干的活動上。

當(dāng)曲終人散,錢也燒得差不多了,用于支持這些工作的資源也將消失殆盡。到了那個時候,數(shù)據(jù)科學(xué)將被視為一場騙局。

為了不讓數(shù)據(jù)科學(xué)淪為騙局,并為我們帶來真正的價(jià)值,企業(yè)需要考慮將數(shù)據(jù)科學(xué)從研究工作轉(zhuǎn)變?yōu)闃I(yè)務(wù)和流程的組成部分。與此同時,他們還需要考慮建立真正的信息架構(gòu)基礎(chǔ)。我們?yōu)榇藰?gòu)建了一個 AI 階梯:數(shù)據(jù)基礎(chǔ)、分析、機(jī)器學(xué)習(xí)、AI 和認(rèn)知:

 

 

為了打破目前的這種只投資無回報(bào)的模式,企業(yè)可以嘗試解決以下幾個問題:

尋找、留住和培養(yǎng)合適的人才和團(tuán)隊(duì)
為數(shù)據(jù)和數(shù)據(jù)科學(xué)制定企業(yè)戰(zhàn)略
實(shí)施數(shù)據(jù)科學(xué)計(jì)劃
應(yīng)對文化沖擊

尋找、留住和培養(yǎng)合適的人才和團(tuán)隊(duì)

偉大的數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要具備四種技能組合:數(shù)據(jù)工程師、機(jī)器學(xué)習(xí)工程師、優(yōu)化工程師和數(shù)據(jù)記者。如果你想要吸引更多的候選人,請?jiān)诎l(fā)布工作崗位時嘗試使用這四個職位和技能組合,而不是使用一刀切的“數(shù)據(jù)科學(xué)家”。

要想留住人才,需要注意幾個方面的問題。首先,需要將團(tuán)隊(duì)與他們要實(shí)現(xiàn)的價(jià)值聯(lián)系在一起:他們的項(xiàng)目如何影響業(yè)務(wù)線和整個企業(yè)?其次,他們需要感受到自己被賦能,并且知道有人在支持他們。最后,在為團(tuán)隊(duì)做出規(guī)劃時,將 20-25%的空閑時間用于創(chuàng)新項(xiàng)目,比如參加類似 Kaggle 的比賽,以及學(xué)習(xí)新的工具和技能;ㄙM(fèi)這么多時間在生產(chǎn)力方面看起來似乎很昂貴,但它為團(tuán)隊(duì)提供了發(fā)展技能的途徑——而且它比雇用和培訓(xùn)新人才更加有效。

為數(shù)據(jù)和數(shù)據(jù)科學(xué)制定企業(yè)戰(zhàn)略

制定與實(shí)際價(jià)值(特別是成本規(guī)避、成本節(jié)省或凈收入)相一致的決策。這是整個過程最重要的一環(huán),也是將數(shù)據(jù)科學(xué)從研究轉(zhuǎn)變?yōu)闃I(yè)務(wù)一部分必須跨出的第一步。簡單地說,它要求在業(yè)務(wù)所有者做出決策時與他們進(jìn)行直接對話,詢問他們是基于哪些數(shù)據(jù)做出這些決策、數(shù)據(jù)的完整性、是否有足夠的數(shù)據(jù)治理,以及企業(yè)將如何使用已開發(fā)的模型。

你可以使用直接集成到流程和應(yīng)用程序的儀表盤來推動決策,但要注意,數(shù)據(jù)可能會形成先入為主的概念。相反,我們應(yīng)該嘗試去尋找那些真正影響基礎(chǔ)決策的可能性:

“我們應(yīng)該如何定位產(chǎn)品,以最低的成本實(shí)現(xiàn)最佳的可用性?”

“哪些方面最有助于對特定客戶進(jìn)行交叉銷售或增銷?”

“哪些團(tuán)隊(duì)表現(xiàn)最好?哪些團(tuán)隊(duì)表現(xiàn)最差?“

“如何在 y 的約束下通過優(yōu)化 x 來削減供應(yīng)鏈的成本?”

 

 

重視每個決定。更快地制定決策并提高效率可以規(guī)避成本、節(jié)省成本或創(chuàng)造額外收入?梢允褂 CFO 倡導(dǎo)的任何方法和術(shù)語來表達(dá)這一價(jià)值。

確定決策的優(yōu)先級。這個過程創(chuàng)建了一個決策組合,可以作為數(shù)據(jù)科學(xué)待辦項(xiàng)的基礎(chǔ)。通過評估成功的可能性、實(shí)現(xiàn)的簡易程度和價(jià)值的多少(基于上表中的評分指標(biāo))來確定待辦項(xiàng)的優(yōu)先級。我們已經(jīng)開發(fā)了一個框架(https://ibm.biz/DecisionPortfolio),可以通過完成這個練習(xí)為組合內(nèi)容安排優(yōu)先級。

 

 

離散的交付。接下來,做出最重要的決定,并將其分解為可管理的塊,并在小的 sprint 中完成這些塊任務(wù)。先確定最小可行產(chǎn)品(MVP),然后繼續(xù)迭代。可以考慮每三周一個 sprint,在兩個 sprint 后就可以開始交付價(jià)值(無論多小)。

實(shí)施數(shù)據(jù)科學(xué)計(jì)劃

要讓數(shù)據(jù)從研究項(xiàng)目變成公司業(yè)務(wù)的組成部分,需要實(shí)施數(shù)據(jù)科學(xué)計(jì)劃。除了組建團(tuán)隊(duì)和制定策略之外,還需要將模型集成到流程、應(yīng)用程序和儀表盤中,還要計(jì)劃對模型進(jìn)行持續(xù)監(jiān)控和再訓(xùn)練。

真正的模型集成意味著我們不能像部署 csv 文件或普通代碼那樣部署模型。它們應(yīng)該更像是可重用且可信賴的服務(wù):版本化的 RESTful API,可以直接從數(shù)據(jù)科學(xué)平臺獲得輸出。將模型作為 csv 文件進(jìn)行部署會切斷與整個流程的連接,并且無法獲得來自實(shí)現(xiàn)方的反饋。將 R 或 Python 代碼交給開發(fā)團(tuán)隊(duì),讓他們將其轉(zhuǎn)換成 API,這種效率是最低的,但這也是在為后續(xù)做準(zhǔn)備工作。建立一個健壯的流程通常需要三到六個月,還需要建立反饋循環(huán),以便讓團(tuán)隊(duì)可以輕松地重新訓(xùn)練和部署模型。

將預(yù)測性或規(guī)范性分析應(yīng)用到業(yè)務(wù)中必然會要求你基于反饋重新訓(xùn)練模型,以便跟上變化的節(jié)奏。我們已經(jīng)看到了一些例子,為了驅(qū)動一個決策,一個團(tuán)隊(duì)在一年內(nèi)開發(fā)了一百多個模型,但在第二年卻什么也沒有開發(fā)出來,因?yàn)檫@個團(tuán)隊(duì)現(xiàn)在完全專注于監(jiān)控和再訓(xùn)練現(xiàn)有的模型。關(guān)鍵是要認(rèn)識到,這不是他們的方法出了問題,他們確實(shí)需要構(gòu)建那么多模型來解決問題。問題在于,在模型部署的過程中,他們沒有對這些模型的監(jiān)控和再訓(xùn)練進(jìn)行自動化。

除非你已經(jīng)經(jīng)歷過大量的數(shù)據(jù)科學(xué)項(xiàng)目,否則實(shí)施數(shù)據(jù)科學(xué)的挑戰(zhàn)可能會讓你大吃一驚——它們都是真實(shí)存在的。

衍生數(shù)據(jù)產(chǎn)品。我們經(jīng)常會忽略這樣的一個事實(shí),即我們的工程特征本身就是有價(jià)值的數(shù)據(jù)。作為建模和工程的一部分,應(yīng)該考慮將這些新數(shù)據(jù)部署為 API,并將它們集成到適當(dāng)?shù)臄?shù)據(jù)資產(chǎn)中,而不是讓它們保持私有。例如,如果數(shù)據(jù)科學(xué)團(tuán)隊(duì)設(shè)計(jì)了一個可以組合客戶數(shù)據(jù)、產(chǎn)品數(shù)據(jù)和財(cái)務(wù)數(shù)據(jù)的功能,那么就將這個功能部署為 API,并讓相應(yīng)的模型調(diào)用該 API。

應(yīng)對文化沖擊

對于眾多企業(yè)來說,數(shù)據(jù)科學(xué)之所以可能成為騙局有很多原因,其中有一個原因尤為突出:文化抵制。要突破管理層的阻力,要注意那些有興趣參與的人。一旦他們開始在流程和應(yīng)用程序中應(yīng)用數(shù)據(jù)和模型,或許支持者就會超過阻礙者。到了某些時候,管理層會問他們已經(jīng)有了哪些突破,這時阻礙者就會感到壓力,然后改變他們的立場。你向管理層展示的價(jià)值往往就是通過規(guī)避成本、節(jié)省資金或創(chuàng)造新價(jià)值來超越其他人。

個人貢獻(xiàn)者可能會出于其他原因抵制這種轉(zhuǎn)變。他們可能擔(dān)心會被機(jī)器取代,或者創(chuàng)建者不完全了解整個過程或環(huán)境。這兩種擔(dān)憂都是實(shí)實(shí)在在的。但是,在大多數(shù)情況下,自動化不會讓人失業(yè),只是讓工作變得更安全或更有效率,所以要幫助團(tuán)隊(duì)認(rèn)識到這一點(diǎn)。對于另一個擔(dān)憂(數(shù)據(jù)科學(xué)團(tuán)隊(duì)并不真正了解他們所做的事情),可以考慮讓其中一個人承擔(dān)產(chǎn)品所有者或主題專家的角色,這讓其他抵制者感覺到支持者是“我們當(dāng)中的一員”。當(dāng)他恢復(fù)到正常的角色時,你就有了當(dāng)前數(shù)據(jù)科學(xué)方法以及未來實(shí)現(xiàn)和部署的支持者。

最后,你可以通過大眾的力量來應(yīng)對文化沖擊。確定一個場景,并組織一個由高層贊助的黑客馬拉松。黑客馬拉松應(yīng)該包括有關(guān)機(jī)器學(xué)習(xí)、云計(jì)算和 API 的基本演示和高級對話。讓團(tuán)隊(duì)親自操刀,并允許公司里的個人參加,不管他們接受過何種培訓(xùn)或擁有何種背景。

為了將數(shù)據(jù)科學(xué)的煉金術(shù)轉(zhuǎn)化為真金,企業(yè)必須讓數(shù)據(jù)科學(xué)為業(yè)務(wù)帶來有形的價(jià)值。他們不能只專注于實(shí)驗(yàn),而是將數(shù)據(jù)科學(xué)作為業(yè)務(wù)模式的組成部分,并與公司的優(yōu)先事項(xiàng)保持一致。如果你遵循上述的方法,樂章將再次奏響,資金將繼續(xù)流動,數(shù)據(jù)科學(xué)將不會成為一場騙局。

作者 | Seth Dobrin

英文原文:https://www.datasciencecentral.com/profiles/blogs/don-t-let-data-science-become-a-scam

標(biāo)簽: 安全 代碼 云計(jì)算

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:數(shù)據(jù)可視化的七大趨勢

下一篇:全球最嚴(yán)個人數(shù)據(jù)保護(hù)法GDPR實(shí)施之后