中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

數(shù)據(jù)科學(xué)中各職業(yè)都在做什么?有什么區(qū)別?

2018-12-21    來源:raincent

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

本文是 TalkingData University 翻譯自 George Liu 發(fā)表在 hackernoon 的一篇文章,介紹了數(shù)據(jù)科學(xué)中不同角色的定義及相互之間的關(guān)系。并且給出了能力畫像,為從業(yè)人員的求職及發(fā)展提供了清晰的參考。

如果你在考慮從事數(shù)據(jù)科學(xué)的工作,可能會覺得這個領(lǐng)域有點(diǎn)令人困惑!什么是數(shù)據(jù)科學(xué)家?數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家之間有什么區(qū)別?機(jī)器學(xué)習(xí)工程師做什么?那么數(shù)據(jù)工程師、商業(yè)智能( BI )工程師和機(jī)器學(xué)習(xí)( ML )研究員呢?

在這篇文章中,我們將描述數(shù)據(jù)科學(xué)中的不同角色,解釋他們的定義以及差異。我們還將為每個角色建立一個“理想能力畫像”。這對于職業(yè)滿意度和求職成功非常重要——如果你申請了一個適合你的角色,你將有更大的機(jī)會獲得這份工作;如果你做了自己喜歡的事情,那么你會享受,而不是每天都想逃避!

下面一起看看數(shù)據(jù)科學(xué)中的不同角色。我們會做一些擴(kuò)展,以涵蓋對具有數(shù)據(jù)技能的候選人來說,所有可考慮的數(shù)據(jù)科學(xué)職業(yè)角色。

從廣義上講,我們可以將數(shù)據(jù)角色分為兩類:業(yè)務(wù)導(dǎo)向或工程導(dǎo)向。不同之處在于,業(yè)務(wù)向角色需要兼?zhèn)浼夹g(shù)和業(yè)務(wù)技能,例如溝通和演示;而工程向的角色著重在建模和軟件工程技能上。

另一方面,一些傳統(tǒng)角色已經(jīng)存在了很長時間,而其他角色僅僅出現(xiàn)了幾年或者剛剛興起。讓我們更詳細(xì)地看一下每個角色。

 

 

數(shù)據(jù)分析師/數(shù)據(jù)科學(xué)家

從本質(zhì)來說數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家是相同的,因?yàn)樗麄冏鐾瑯拥氖虑?mdash;—從數(shù)據(jù)中獲取價值。價值可以有不同的形式:對于數(shù)據(jù)分析師來說,價值意味著洞察,而對于數(shù)據(jù)科學(xué)家來說,是在洞察之上的產(chǎn)品發(fā)展智能。

數(shù)據(jù)分析師分析數(shù)據(jù)以獲得洞察,并幫助形成業(yè)務(wù)決策。例如是什么導(dǎo)致網(wǎng)站流量增加,或者用戶離開網(wǎng)站的主要原因是什么?而數(shù)據(jù)科學(xué)家更關(guān)心的是使用機(jī)器學(xué)習(xí)和 A / B 測試來驅(qū)動和改進(jìn)產(chǎn)品。他們可能會對諸如“更大尺寸的按鈕會增加點(diǎn)擊率嗎?”以及“哪些客戶可能取消訂閱?”等問題感興趣。

數(shù)據(jù)科學(xué)家專注于前瞻,即做出預(yù)測,而數(shù)據(jù)分析師則更多地聚焦在回顧,如分析歷史數(shù)據(jù)。

數(shù)據(jù)科學(xué)家應(yīng)該更有經(jīng)驗(yàn),能夠用科學(xué)的方法解決業(yè)務(wù)問題,包括構(gòu)建業(yè)務(wù)問題、提出假設(shè),然后設(shè)計(jì)和進(jìn)行實(shí)驗(yàn)來檢驗(yàn)假設(shè),最后得出結(jié)論(主要是研究技能,這就是為什么硬科學(xué)博士有時候是數(shù)據(jù)科學(xué)家角色的首選候選人)。而數(shù)據(jù)分析師應(yīng)該使用報告或數(shù)據(jù)可視化技術(shù)收集,清理,分析數(shù)據(jù)并傳達(dá)結(jié)果。

以上是這兩個角色之間的一般差異,但情況并非總是如此,因?yàn)閿?shù)據(jù)科學(xué)仍然是新的方向,并且遠(yuǎn)未實(shí)現(xiàn)標(biāo)準(zhǔn)化。有時數(shù)據(jù)科學(xué)家可以進(jìn)行基本分析工作,數(shù)據(jù)分析師可以執(zhí)行機(jī)器學(xué)習(xí)建模。對于數(shù)據(jù)科學(xué)中分析類的角色而言,無論頭銜如何,這兩類絕對是最受雇主追捧的重要角色。因此在求職時應(yīng)考慮與畫像的最佳契合,并成為我們的目標(biāo)(以下角色同理)。

需要指出的是,這里我們指的是通常意義的數(shù)據(jù)科學(xué)家,主要處理統(tǒng)計(jì)建模,A / B 測試,機(jī)器學(xué)習(xí),數(shù)據(jù)清洗和數(shù)據(jù)可視化。而專注機(jī)器學(xué)習(xí)的數(shù)據(jù)科學(xué)家,我們實(shí)際上將其歸類為機(jī)器學(xué)習(xí)研究員/科學(xué)家,下文會有介紹。

數(shù)據(jù)工程師

我們已經(jīng)討論了很多關(guān)于數(shù)據(jù)科學(xué)家的事情,但實(shí)際上,如果沒有數(shù)據(jù)工程師的幫助,數(shù)據(jù)科學(xué)家就無法做出貢獻(xiàn)。為什么?由于數(shù)據(jù)工程師構(gòu)建了引入數(shù)據(jù)的數(shù)據(jù)管道!如同煉油廠閑置,是由于沒有原油進(jìn)入,最終原因是石油管道還沒有建成。

我們舉一家廣告技術(shù)公司為例,我們有來自多種內(nèi)外部數(shù)據(jù)源的實(shí)時數(shù)據(jù);有來自服務(wù)器的廣告投放數(shù)據(jù),來自我們內(nèi)部數(shù)據(jù)庫的投放和客戶數(shù)據(jù),還有來自第三方提供商的投放效果數(shù)據(jù)和我們的內(nèi)部日志……為了構(gòu)建實(shí)時廣告效果分析看板并進(jìn)一步做分析和建模,我們需要將所有數(shù)據(jù)整合成合適的級別。在此之上,我們需要構(gòu)建一個數(shù)據(jù)倉庫,以便我們的查詢不會影響生產(chǎn)服務(wù)器的性能。

這就是數(shù)據(jù)工程師為我們提供的幫助。如你所見,這基本上是數(shù)據(jù)的軟件工程。

ML / DL / AI研究員/科學(xué)家/工程師

ML 研究員實(shí)際上與專注于 ML 的數(shù)據(jù)科學(xué)家相同。但與通常意義上處理所有數(shù)據(jù)科學(xué)問題的“全棧”數(shù)據(jù)科學(xué)家不同,ML 數(shù)據(jù)科學(xué)家將專注于 ML 建模,以及(或者)新機(jī)器學(xué)習(xí)算法的研究和開發(fā)。另一方面,ML工程師更關(guān)心機(jī)器學(xué)習(xí)模型的生產(chǎn)。

想象一下使用公共數(shù)據(jù)集構(gòu)建的推薦模型。在對模型進(jìn)行微調(diào)之后,我們已經(jīng)取得了很好的性能結(jié)果,但該模型仍然沒有用,因?yàn)樗皇俏覀冇?jì)算機(jī)中的一個軟件。為了讓它有用,我們需要將模型部署到生產(chǎn)環(huán)境中,比如我們的電子商務(wù)網(wǎng)站,以便它可以實(shí)時為用戶提供推薦,從而幫助我們增加收入。

將機(jī)器學(xué)習(xí)模型部署到生產(chǎn)中是一項(xiàng)工程問題,與構(gòu)建模型不同,它涉及不同類型的工程工作,例如將 ML 模型集成到軟件系統(tǒng)中,優(yōu)化模型以提高性能和可擴(kuò)展性,監(jiān)控 ML 系統(tǒng),以及用新數(shù)據(jù)重新訓(xùn)練它。當(dāng)然,還有建模部分,使用各種 ML 庫實(shí)驗(yàn)和構(gòu)建機(jī)器學(xué)習(xí)模型,以及實(shí)現(xiàn) ML 算法以滿足業(yè)務(wù)需求。

研究人員/科學(xué)家和工程師之間的區(qū)別在于“部署”部分,即是否負(fù)責(zé)將 ML 模型投入生產(chǎn)。如果是,那么我們討論的是上述的工程問題,而角色是工程師,否則,它是一個研究角色。

業(yè)務(wù)分析師(各種職能)

我們這里談到的業(yè)務(wù)分析師不是傳統(tǒng)的IT業(yè)務(wù)分析師( BA )。傳統(tǒng)的 BA 引導(dǎo),記錄業(yè)務(wù)需求并充當(dāng)業(yè)務(wù)和技術(shù)之間的聯(lián)絡(luò)人。相反,我們使用業(yè)務(wù)分析師的頭銜作為總括頭銜來涵蓋所有具有業(yè)務(wù)性質(zhì)(非技術(shù)性)且需要重要數(shù)據(jù)技能的分析師角色。

由于數(shù)據(jù)的普及,幾乎所有分析師角色都需要某些數(shù)據(jù)技能集。因此,業(yè)務(wù)分析師角色是對于具有領(lǐng)域?qū)I(yè)知識,并且精于數(shù)據(jù)的候選人來說,業(yè)務(wù)分析師是非常不錯的職位目標(biāo)。

找出這些角色的最佳方法是在求職搜索引擎上使用關(guān)鍵字。例如,在Indeed.com上,如果輸入“ analyst sql ”作為關(guān)鍵字,您將找到許多不同的職位,如 Performance Analyst,Healthcare Data Analyst 和 Demand Planning Analyst。這些是精通數(shù)據(jù)的候選人可以考慮的,不同類型的業(yè)務(wù)分析師。

BI分析師/工程師/開發(fā)人員

我們還擁有傳統(tǒng)的商業(yè)智能( BI )分析師和商業(yè)智能工程師角色。一般來說,當(dāng)我們談?wù)?BI 時,我們指的是使用“定義良好的BI基礎(chǔ)設(shè)施”在“大公司”環(huán)境中進(jìn)行數(shù)據(jù)分析和報告,

基礎(chǔ)設(shè)施指的是各種企業(yè)軟件系統(tǒng)( ERP,CRM 等)以及在他們之上進(jìn)行連接和報告 BI 工具;

“大公司” – 因?yàn)閭鹘y(tǒng)大型企業(yè)擁有財務(wù)實(shí)力來搭建和維護(hù)這些BI系統(tǒng)。

BI 分析師與數(shù)據(jù)分析師非常相似,因?yàn)樗麄兌夹枰獙?shù)據(jù)進(jìn)行分析和報告。一般來說,他們不做預(yù)測建模。不同之處在于 BI 分析師在結(jié)構(gòu)化環(huán)境(使用 BI 系統(tǒng))中與大型公司合作,而數(shù)據(jù)分析師可以在任何地方,而且不需要使用現(xiàn)有的BI基礎(chǔ)架構(gòu)。

而BI工程師/開發(fā)人員和 BI 分析師的關(guān)系,正如數(shù)據(jù)工程師與數(shù)據(jù)科學(xué)家的關(guān)系一樣,因?yàn)锽I工程師構(gòu)建了 BI 分析師可依賴的報告工具來進(jìn)行業(yè)務(wù)所需的分析。因此,數(shù)據(jù)工程師可以被視為 BI 工程師/開發(fā)人員角色的最新版本,后者可以很好地適應(yīng)前者,這要?dú)w功于類似的技能集。

數(shù)據(jù)/ ML產(chǎn)品經(jīng)理

如上所述,數(shù)據(jù)現(xiàn)在無處不在。難怪現(xiàn)在的產(chǎn)品還依賴于數(shù)據(jù)科學(xué),特別是機(jī)器學(xué)習(xí)。對于以機(jī)器學(xué)習(xí)為中心或嚴(yán)重依賴于數(shù)據(jù)科學(xué)的產(chǎn)品,精通數(shù)據(jù)的產(chǎn)品經(jīng)理最適合支持它們。具有 ML 專業(yè)知識和產(chǎn)品管理經(jīng)驗(yàn)的候選人將在這種類型的角色中占上風(fēng)。

理想的能力畫像

我們現(xiàn)在清楚地了解數(shù)據(jù)科學(xué)中的主要角色,但每位理想候選人的技能集是什么樣的?為了以直觀的方式進(jìn)行說明,我使用 Matplotlib 創(chuàng)建了蜘蛛圖將這些畫像可視化。由于這很大程度上是我的直觀看法,我們將在未來的迭代中抓取并分析來自 Indeed 的職位發(fā)布數(shù)據(jù),以驗(yàn)證畫像。

 

 

現(xiàn)在你擁有了數(shù)據(jù)科學(xué)角色和相應(yīng)的能力畫像!基于對不同角色的責(zé)任和差異的充分理解,您將能夠確定您熱衷的職業(yè)道路;理想的畫像不僅可以用于確定最適合的目標(biāo)角色,還可以作為簡歷定制和個人品牌的路線圖,以使您的個人資料與之相關(guān)。

標(biāo)簽: 電子商務(wù) 電子商務(wù)網(wǎng) 電子商務(wù)網(wǎng)站 服務(wù)器 數(shù)據(jù)分析 數(shù)據(jù)庫 搜索 搜索引擎

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:大數(shù)據(jù)和人工智能的未來將殊途同歸

下一篇:數(shù)據(jù)不足,如何進(jìn)行遷移學(xué)習(xí)?