中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

最受歡迎的5種數(shù)據(jù)科學(xué)工具

2019-03-26    來(lái)源:多智時(shí)代

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

數(shù)據(jù)和分析為數(shù)字化轉(zhuǎn)型提供了燃料,而企業(yè)充分發(fā)揮這些燃料的唯一途徑是,為其統(tǒng)計(jì)學(xué)家、數(shù)據(jù)專(zhuān)家和企業(yè)分析專(zhuān)家提供正確的數(shù)據(jù)科學(xué)工具,從而為企業(yè)提供寶貴的洞察力。

最受歡迎的5種數(shù)據(jù)科學(xué)工具

無(wú)論是用于直接統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)建模還是可視化,數(shù)據(jù)科學(xué)工具對(duì)于建設(shè)數(shù)據(jù)驅(qū)動(dòng)的企業(yè)文化都至關(guān)重要。

最近我們采訪了各個(gè)行業(yè)中經(jīng)驗(yàn)豐富的數(shù)據(jù)科學(xué)家,詢問(wèn)他們最常使用的工具。下面是我們從中精心挑選的5個(gè)工具。

1. Python

與用于創(chuàng)建自定義算法的編程方法不同,Python不是一種獨(dú)特的軟件,但它是很多數(shù)據(jù)科學(xué)家的首選。在最近數(shù)據(jù)科學(xué)網(wǎng)站KDnuggets對(duì)2052名用戶進(jìn)行的分析/數(shù)據(jù)科學(xué)軟件調(diào)查中,Python被65.6%的受訪者列為首選工具。

Cindicator公司首席數(shù)據(jù)科學(xué)家Alexander Osipenko表示:我們將Python用于數(shù)據(jù)科學(xué)和后端,這為我們提供了快速開(kāi)發(fā)和機(jī)器學(xué)習(xí)模型部署。對(duì)于我們來(lái)說(shuō),同樣重要的是確保部署工具的安全性。

Katie Malone最初是一名粒子物理學(xué)家,現(xiàn)在她是Civis Analystic公司的數(shù)據(jù)科學(xué)研究團(tuán)隊(duì)的負(fù)責(zé)人之一,她指出,Python是她作為物理學(xué)家首選的數(shù)據(jù)科學(xué)工具,而現(xiàn)在她在商業(yè)世界也在繼續(xù)使用它。對(duì)于她而言,最吸引她的是圍繞Python強(qiáng)大的開(kāi)源生態(tài)系統(tǒng),這使她能夠利用各種數(shù)據(jù)科學(xué)庫(kù)來(lái)幫助她解決特定的分析問(wèn)題。

她表示:這個(gè)社區(qū)擁有非常充滿活力的開(kāi)源人群,他們使用Python來(lái)解決有趣的數(shù)據(jù)科學(xué)問(wèn)題。

Wovenware公司創(chuàng)新總監(jiān)兼首席數(shù)據(jù)科學(xué)家Leslie De Jesus對(duì)此表示贊同,她非常依賴Python庫(kù)。

我們使用 Python庫(kù)(包括Scrapy)用于網(wǎng)絡(luò)抓取,并能夠從互聯(lián)網(wǎng)上提取數(shù)據(jù)并將其上傳到數(shù)據(jù)框架進(jìn)行分析,De Jesus說(shuō)。 同時(shí),我們使用Pandas和NumPy Python庫(kù)進(jìn)行數(shù)據(jù)分析和矩陣操作。這些都有助于我們更快創(chuàng)建代碼,而NumPy還允許復(fù)雜的廣播功能。

Tiger Analytics公司數(shù)據(jù)科學(xué)和創(chuàng)新主管Niranjan Krishnan解釋說(shuō),Python的用例非常多。

Krishnan說(shuō):我們已經(jīng)成功部署Python數(shù)據(jù)科學(xué)模型,用于優(yōu)化直接面向客戶的營(yíng)銷(xiāo)活動(dòng)和人壽保險(xiǎn)承保,以及改善在線廣告的實(shí)時(shí)定價(jià)。

這里的缺點(diǎn)是,Python是基于代碼,這里需要高水平的編程和分析技能。

他指出:而Knime和Alteryx是優(yōu)秀的菜單驅(qū)動(dòng)的低代碼替代品,也可供一般數(shù)據(jù)科學(xué)家和業(yè)務(wù)分析師使用。

2. R

與Python類(lèi)似,R是很多數(shù)據(jù)科學(xué)專(zhuān)業(yè)人員喜愛(ài)的另一種編程語(yǔ)言,它更加簡(jiǎn)單且更專(zhuān)注于數(shù)據(jù)科學(xué)。在KDnuggets調(diào)查中,R排名第三,48.5%的受訪者將其列為首選數(shù)據(jù)科學(xué)工具之一。

Civis Analytics公司的Malone表示,R具有非常復(fù)雜的機(jī)器學(xué)習(xí)和統(tǒng)計(jì)功能,這是她的團(tuán)隊(duì)成員除Python之外的常用選擇。

她指出:這取決于具體情況,我們有多種需求,所以這兩個(gè)我們都喜歡。從統(tǒng)計(jì)和定量社會(huì)科學(xué)方面來(lái)看,R更多一些。

根據(jù)Untapt公司首席數(shù)據(jù)科學(xué)家Jon Krohn的說(shuō)法,R是他的首選數(shù)據(jù)探索工具。

他指出:我可以快速查看平均值、中位數(shù)和四分位數(shù)等摘要統(tǒng)計(jì)數(shù)據(jù);快速創(chuàng)建不同的圖表;以及創(chuàng)建測(cè)試數(shù)據(jù)集,這些可輕松地共享并導(dǎo)出位CSV格式。

3. Jupyter Notebook

從數(shù)據(jù)可視化和數(shù)據(jù)通信來(lái)看,很多數(shù)據(jù)科學(xué)團(tuán)隊(duì)的數(shù)據(jù)科學(xué)工具列表中還會(huì)有Jupyter Notebook。

HackerRank公司數(shù)據(jù)科學(xué)副總裁SofusMacskássy表示:Jupyter Notebook支持R和Python,對(duì)數(shù)據(jù)訪問(wèn)和可視化提供強(qiáng)大庫(kù)支持。該工具還使團(tuán)隊(duì)能夠輕松導(dǎo)出工作簿用于演示,它正成為數(shù)據(jù)科學(xué)領(lǐng)域的標(biāo)準(zhǔn)。

對(duì)于Anexinet公司數(shù)字和分析服務(wù)高級(jí)副總裁Michael Golub而言,Jupyter的另一個(gè)好處是,可靈活使用最受歡迎的數(shù)據(jù)科學(xué)庫(kù)。Golub解釋說(shuō)Jupyter是他團(tuán)隊(duì)最喜歡的協(xié)作開(kāi)發(fā)環(huán)境。

Golub稱:Jupyter Notebook是我們協(xié)作數(shù)據(jù)科學(xué)項(xiàng)目工作的首選工具,在涉及需要教育的時(shí)候,它也非常有用。

此外,Untapt公司的Krohn稱,Jupyter Notebook是交互式構(gòu)建原型模型的絕佳工具。

他表示:在Untapt,我們利用Jupyter Notebook來(lái)編寫(xiě)原型代碼,也用于打印數(shù)據(jù)表、摘要指標(biāo)和圖表。

最受歡迎的5種數(shù)據(jù)科學(xué)工具

4. Tableau

在硬數(shù)據(jù)科學(xué)團(tuán)隊(duì)和更多以業(yè)務(wù)為中心的分析人員之間,Tableau可提供良好的橋梁。

Entersoft Security公司的SEO高級(jí)主管Pooja Pandey表示:對(duì)于數(shù)據(jù)科學(xué)家和數(shù)據(jù)科學(xué)新手來(lái)說(shuō),這是很棒的工具。這是一個(gè)快速儀表板工具,可提供可視化洞察力和分析數(shù)據(jù),它有著非常短的學(xué)習(xí)曲線。

Tableau的可視化和報(bào)告功能的速度可為各種用戶提供洞察力。

QuotesAdvisor.com首席執(zhí)行官Sophie Miles表示:它可以很快部署、易于學(xué)習(xí)且非常直觀。通過(guò)Tableau,該公司的不同部門(mén)可根據(jù)需要制定詳盡的報(bào)告。

Miles解釋稱,由于該儀表板非常靈活,因此對(duì)數(shù)據(jù)組合的臨時(shí)請(qǐng)求數(shù)量有所減少。因此,QuotesAdvisor.com的效率提高了95%。她說(shuō)道:現(xiàn)在人們花更多的時(shí)間來(lái)思考問(wèn)題,而不是生成報(bào)告。

5. Keras

根據(jù)日立Vantara公司首席技術(shù)官辦公室首席數(shù)據(jù)科學(xué)家Wei Lin表示,他最常用的數(shù)據(jù)科學(xué)工具是Python、R和Keras。他使用Python和R用于上述所有原因,而利用Keras的深度學(xué)習(xí)功能。

Lin稱:Keras是使用Python編寫(xiě)的開(kāi)源神經(jīng)網(wǎng)絡(luò)庫(kù),以快速通過(guò)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)。并且,它能夠運(yùn)行在TensorFlow、微軟Cognitive Toolkit或Thea。

Kera的優(yōu)勢(shì)在于高維模式匹配。

他表示:例如,圖像和自然語(yǔ)言處理以及支持完善的深度學(xué)習(xí)分析模型,包括卷積神經(jīng)網(wǎng)絡(luò)和短期記憶。

根據(jù)Cindicator公司的Osipenko表示,Keras的最大吸引點(diǎn)在于它可幫助節(jié)省大量時(shí)間。

他指出:我們添加新工具的主要標(biāo)準(zhǔn)是,它是否能讓你作為數(shù)據(jù)科學(xué)家的工作變得更輕松。這里的例子就是Keras,這個(gè)開(kāi)源高級(jí)包裝器,可大大加快開(kāi)發(fā)神經(jīng)網(wǎng)絡(luò)的過(guò)程。任何在TensorFlow編寫(xiě)神經(jīng)網(wǎng)絡(luò)的人都會(huì)明白我在說(shuō)什么。即使Keras不完美,但它可以改變這個(gè)開(kāi)發(fā)流程,讓你的代碼對(duì)其他開(kāi)發(fā)人員更具可讀性。”成都加米谷大數(shù)據(jù)培訓(xùn)機(jī)構(gòu),小班教學(xué),免費(fèi)試聽(tīng)。

標(biāo)簽: [db:TAGG]

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:云計(jì)算是否安全?

下一篇:云計(jì)算能否完全取代存儲(chǔ)網(wǎng)絡(luò)?