中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

尷尬了,數(shù)據(jù)故事講不好,模型再酷炫都沒(méi)用

2018-08-06    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線(xiàn)!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

導(dǎo)言:數(shù)據(jù)科學(xué)風(fēng)靡了幾年,已經(jīng)完成了從普及到應(yīng)用的商業(yè)落地,越來(lái)越多的公司都已經(jīng)同意數(shù)據(jù)驅(qū)動(dòng)戰(zhàn)略的重要性,但雇幾個(gè)數(shù)據(jù)科學(xué)家和有一個(gè)數(shù)據(jù)團(tuán)隊(duì),并不等同于公司就能坐享數(shù)據(jù)科學(xué)的果實(shí)。

數(shù)據(jù)科學(xué)家慢慢發(fā)現(xiàn)在科研階段引以為豪的高端模型,在向沒(méi)有技術(shù)背景的管理層做展示的時(shí)候毫無(wú)吸引力,得出的商業(yè)建議在付諸實(shí)施的時(shí)候也大打折扣。

作者認(rèn)為要想做一個(gè)有影響力的數(shù)據(jù)科學(xué)家首先得學(xué)會(huì)講好故事,他給出了三個(gè)有效建議來(lái)幫數(shù)據(jù)科學(xué)家提高從洞察到行動(dòng)的轉(zhuǎn)換率。

有兩類(lèi)數(shù)據(jù)科學(xué)家:一類(lèi)科學(xué)家專(zhuān)注于數(shù)據(jù)分析(A類(lèi)),另一類(lèi)專(zhuān)注于模型構(gòu)建(B類(lèi))。

在數(shù)據(jù)科學(xué)項(xiàng)目中,兩種科學(xué)家可能出現(xiàn)如下兩種問(wèn)題:

• 模型不適用于應(yīng)用體系。

• 洞察的結(jié)果對(duì)于改進(jìn)產(chǎn)品沒(méi)有用處。

這兩種結(jié)果常發(fā)生在從數(shù)據(jù)科學(xué)到其他領(lǐng)域的過(guò)渡之中:一種是從數(shù)據(jù)科學(xué)到軟件工程,另一種是從數(shù)據(jù)科學(xué)到業(yè)務(wù)執(zhí)行。

這兩種轉(zhuǎn)變是對(duì)現(xiàn)實(shí)生活創(chuàng)造價(jià)值和產(chǎn)生影響的關(guān)鍵,因此這個(gè)過(guò)程也存在很高的風(fēng)險(xiǎn)。

在模型交付過(guò)程中,軟件工程師可能會(huì)說(shuō)這些模型不符合他們的工程標(biāo)準(zhǔn),商業(yè)部門(mén)的同事可能會(huì)說(shuō)你的想法很有趣,但他們不會(huì)有所行動(dòng)。這些這樣那樣的“借口”經(jīng)常會(huì)丟給數(shù)據(jù)科學(xué)家們讓他們很難取得成績(jī)。這比數(shù)據(jù)科學(xué)領(lǐng)域其他挑戰(zhàn)更令人擔(dān)憂(yōu),因?yàn)槲覀儫o(wú)法左右數(shù)據(jù)分析成果在被轉(zhuǎn)交后的命運(yùn)。

盡管我們能做的非常有限,但我們應(yīng)該采取一些行動(dòng)來(lái)避免這兩種結(jié)果。

模型部署在不同的機(jī)構(gòu)中會(huì)有不同的效果,但是編寫(xiě)應(yīng)用級(jí)代碼可以幫助數(shù)據(jù)科學(xué)家進(jìn)行更好的部署。

Trey Causey在他的博客中為數(shù)據(jù)科學(xué)家列出了編寫(xiě)應(yīng)用級(jí)代碼”所要做的一些事”

網(wǎng)址:http://treycausey.com/software_dev_skills.html

簡(jiǎn)而言之就是,使代碼模塊化,創(chuàng)建文檔,使用版本控制(包含但不限于詳細(xì)記錄和建立測(cè)試)。

許多數(shù)據(jù)科學(xué)家習(xí)慣使用自上而下的命令式編碼; 這種風(fēng)格對(duì)與軟件工程師合作制造了障礙。要使部署工作順利進(jìn)行,編寫(xiě)應(yīng)用級(jí)代碼很重要。

將想法轉(zhuǎn)換為實(shí)際行動(dòng)就像將“思維代碼”部署到“社會(huì)機(jī)器”中一樣。

如果數(shù)據(jù)科學(xué)家可以通過(guò)編寫(xiě)應(yīng)用級(jí)代碼來(lái)改進(jìn)模型部署,那么數(shù)據(jù)科學(xué)家可以做些什么來(lái)改進(jìn)商業(yè)戰(zhàn)略落實(shí)呢?

用數(shù)據(jù)講故事的能力是解決問(wèn)題的關(guān)鍵。

數(shù)據(jù)背后引人入勝的故事可以給觀(guān)眾留下深刻印象并激勵(lì)大家的行動(dòng)力。用數(shù)據(jù)講故事聽(tīng)起來(lái)很棒,但“講故事”本身卻是一個(gè)模糊的概念。為了真正深入了解數(shù)據(jù)故事,最近我回顧了Cole Knaflic撰寫(xiě)的《Storytelling with Data》和Nathan Yau編寫(xiě)的《Visualization that Means Something》。這兩本書(shū)讓我重新認(rèn)識(shí)了用數(shù)據(jù)說(shuō)話(huà)(講故事)。

基于這兩本書(shū)和我的經(jīng)驗(yàn),我想向你介紹優(yōu)化結(jié)論向行動(dòng)轉(zhuǎn)換的策略。

概述:

• 一開(kāi)始就將想法觀(guān)點(diǎn)亮出來(lái)

• 在視覺(jué)層次上強(qiáng)調(diào)你的突破性結(jié)論

• 提升結(jié)論到行動(dòng)的轉(zhuǎn)化率

把觀(guān)點(diǎn)性結(jié)論放在展示最開(kāi)始的部分

幾個(gè)月前,我學(xué)會(huì)了一種呈現(xiàn)數(shù)據(jù)科學(xué)結(jié)果的方法。我認(rèn)為這種方法很有效,我看到很多科學(xué)論文都采用了這種方法。

所以我的展示流程是,我從背景開(kāi)始,討論數(shù)據(jù)源,使用圖形和表格來(lái)突出數(shù)據(jù)屬性,討論模型構(gòu)建,討論建模結(jié)果,最后總結(jié)觀(guān)點(diǎn)(適當(dāng)時(shí)要求采取行動(dòng))。

在這個(gè)流程中,想法見(jiàn)解是放在最后的,因?yàn)閷?duì)數(shù)據(jù)和模型的基本解釋會(huì)讓觀(guān)眾真正理解觀(guān)點(diǎn)做適當(dāng)鋪墊。

這個(gè)流程對(duì)我很有用,然而對(duì)于我的商業(yè)合作伙伴卻不是這樣——這些合作伙伴是商業(yè)實(shí)操的資深人士,但卻是數(shù)據(jù)科學(xué)領(lǐng)域的門(mén)外漢(如今大多數(shù)決策者還是沒(méi)有受過(guò)數(shù)據(jù)科學(xué)的專(zhuān)業(yè)培訓(xùn))。

他們對(duì)我的數(shù)據(jù)探索過(guò)程不好奇,對(duì)建模細(xì)節(jié)也不感興趣。他們只對(duì)這些見(jiàn)解感興趣,因此建議我將數(shù)據(jù)細(xì)節(jié)移到附錄中。

盡管我驚訝于他們對(duì)科學(xué)推理過(guò)程的不重視,但在我采納他們的建議后,發(fā)現(xiàn)我的數(shù)據(jù)講故事能夠更快地與他們產(chǎn)生共鳴。

看來(lái)隱去數(shù)理推理過(guò)程的確更受歡迎。

為了做得更好,我回過(guò)頭重新審視那些與我觀(guān)點(diǎn)不直接相關(guān)的內(nèi)容,F(xiàn)在,我講的故事更多地圍繞著結(jié)論而不是數(shù)據(jù)建模建立的過(guò)程。

喬什·伯諾夫(Josh Bernoff)在《Writing Without Bullshit》這本書(shū)中的一段很好地概括了上述的這種現(xiàn)象:

你必須顛倒你在學(xué)校學(xué)到的關(guān)于推理和寫(xiě)作的知識(shí)。在學(xué)校里,你學(xué)會(huì)先熱身,再?gòu)牡谝辉黹_(kāi)始慢慢推導(dǎo)出結(jié)論。但商業(yè)背景的讀者沒(méi)有熱身時(shí)間,對(duì)推理過(guò)程缺乏耐心,除非他們提前知道目的是什么,回報(bào)是什么。所以從鮮明的觀(guān)點(diǎn)陳述和結(jié)論開(kāi)始,然后配上你的依據(jù)和理由。這樣,讀者不必閱讀整篇文檔就可以有所收獲。

我仍然和我的技術(shù)同事用行話(huà)交流,然而,打交道的決策層次越高,我就越需要像Josh所說(shuō)的那樣先說(shuō)結(jié)論再說(shuō)依據(jù)。

另一個(gè)職業(yè)——咨詢(xún)顧問(wèn),一直以來(lái)支撐著企業(yè)高管作出決策。

好像咨詢(xún)顧問(wèn)早就意識(shí)到需要先把觀(guān)點(diǎn)擺在前面的重要性。

我找到了咨詢(xún)顧問(wèn)寫(xiě)的一篇關(guān)于家庭語(yǔ)音銀行的研究論文。

本文采用的流程就是久經(jīng)考驗(yàn)的講故事方式。

 

 

來(lái)自咨詢(xún)公司的研究論文中的目錄

正如在上面的目錄中可以看到的,顧問(wèn)在“執(zhí)行摘要”之后需立即提出“建議”,而將研究方法放在最后一個(gè)章節(jié)。

其中在一開(kāi)始就有大膽的結(jié)論和建議,也包含了決策可能產(chǎn)生的后果。

在本文中,市場(chǎng)對(duì)智能語(yǔ)音銀行業(yè)務(wù)的需求很低,因此顧問(wèn)建議銀行對(duì)此持謹(jǐn)慎態(tài)度。對(duì)于顧問(wèn)而言這是是常見(jiàn)的方法。無(wú)論是寫(xiě)作還是演講,在最顯眼的位置需要展示最重要的內(nèi)容。

為了實(shí)現(xiàn)見(jiàn)解與行動(dòng)的轉(zhuǎn)化,應(yīng)該把觀(guān)點(diǎn)放在最開(kāi)始的地方。

在視覺(jué)層次上強(qiáng)調(diào)突出你的結(jié)論傾向

數(shù)據(jù)可視化效果直接決定數(shù)據(jù)故事的好壞。數(shù)據(jù)可視化有表格和圖形,包括視覺(jué)線(xiàn)索,坐標(biāo)系統(tǒng),比例尺,周?chē)谋镜刃问健?/p>

數(shù)據(jù)可視化既是一種很好的信息交流方式,所謂“一圖勝千言”;同時(shí)也是一種很好的分析方式,正如John Tukey在《探索性數(shù)據(jù)分析(Exploratory Data Analysis)》中所說(shuō)的“圖片的最大價(jià)值在于它使我們注意到我們之前從未注意過(guò)的東西”。

鑒于數(shù)據(jù)可視化的有用性,我們可以通過(guò)更好地使用數(shù)據(jù)可視化來(lái)顯著提高數(shù)據(jù)的“故事性”。

以前我的數(shù)據(jù)可視化優(yōu)化策略是把圖表做得更好看。我會(huì)瀏覽我起草的表格和圖表,選擇最有趣的表格,添加缺失的標(biāo)題、圖例和顏色,最后將它們放入我的演示文稿中。

這種方法一直效果不錯(cuò),直到最近,當(dāng)信息就呈現(xiàn)在我的同事面前,但他們還在問(wèn)我信息在哪兒的時(shí)候。我這才意識(shí)到,我的圖表雖然展示了信息但并沒(méi)有傳達(dá)出該關(guān)注圖表哪個(gè)區(qū)域的信號(hào)。

在《Storytelling with Data and Visualization that Means Something》一書(shū)中,借助潛意識(shí)屬性來(lái)創(chuàng)建有層次的視覺(jué)結(jié)構(gòu)這一概念可以幫助我們體驗(yàn)到數(shù)據(jù)可視化真正的力量。

數(shù)據(jù)可視化不僅僅是使用正確的格式展示數(shù)據(jù),更是用暗示性的視覺(jué)指示來(lái)引導(dǎo)觀(guān)眾更好地理解圖片給出的信息,在視覺(jué)結(jié)構(gòu)的最頂層給出觀(guān)點(diǎn)。

我將使用兩個(gè)案例進(jìn)行說(shuō)明。

以下是Cole Knaflic的案例研究。下面的第一張圖是典型的線(xiàn)性圖。線(xiàn)形圖多用于在時(shí)間序列上的研究、重復(fù)測(cè)量研究等。

下面的圖表有正確的標(biāo)題、坐標(biāo)軸和圖例。從技術(shù)標(biāo)準(zhǔn)來(lái)看這是一個(gè)還不錯(cuò)的圖表。但是,讀者幾乎不知道它想說(shuō)什么。

 

 

數(shù)據(jù)是由投資者提供的,百分比之和大于100是因?yàn)檎{(diào)查者可以作出多個(gè)選擇

改進(jìn)之后的版本則是使用了潛意識(shí)屬性。下面的圖表中使用加粗的藍(lán)色折線(xiàn)突出了最大的增長(zhǎng)趨勢(shì),而其它所有的趨勢(shì)則是采用了灰色,使其和背景融為一體。經(jīng)由更好的視覺(jué)層次的結(jié)構(gòu),讀者可以更加輕松的理解這張數(shù)據(jù)可視化圖表。

 

 

在我采取這種方法之后,每當(dāng)我采用前注意的特性來(lái)突出我想表達(dá)的內(nèi)容的時(shí)候,我可以立刻注意到觀(guān)眾的反饋來(lái)得更快,更加強(qiáng)烈而且更加積極。這證明了在視覺(jué)層次的強(qiáng)調(diào)的確有效果。

在另外一個(gè)案例研究中,Cole Knaflic闡述了標(biāo)題的強(qiáng)大之處。在下面的圖表中,標(biāo)題不是典型的“請(qǐng)求數(shù)量的時(shí)間趨勢(shì)圖”,這樣的標(biāo)題是描述性的,但不夠直接。而這里給出的標(biāo)題是“請(qǐng)批準(zhǔn)雇傭兩名全職員工”,給出了一個(gè)明確可采取的措施。這個(gè)建議幫助讀者從趨勢(shì)線(xiàn)中找到了因?yàn)閮擅麊T工的離職所導(dǎo)致的績(jī)效差距。

 

 

我總是使用描述性的標(biāo)題:“X隨Y變化的趨勢(shì)”,“A隨B的分布”等等,F(xiàn)在我的標(biāo)題是一個(gè)建議,問(wèn)題或者真知灼見(jiàn)。標(biāo)題是數(shù)據(jù)可視化中最重要的一個(gè)部分,一個(gè)充滿(mǎn)張力的標(biāo)題將極大提升信息輸出效率。

我強(qiáng)烈推薦Cole和Nathan的圖書(shū)《Storytelling with Data: A Data Visualization Guide for Business Professionals》 ,書(shū)中還有很多其它的技巧會(huì)對(duì)你產(chǎn)生幫助。

鏈接:

http://flowingdata.com

http:/www.storytellingwithdata.com/

提高洞察到行動(dòng)的轉(zhuǎn)化率

利用數(shù)據(jù)講故事不是一個(gè)一次性的展示。你會(huì)被要求一遍又一遍的對(duì)不同利益相關(guān)者講述同一個(gè)故事,特別是當(dāng)你的真知灼見(jiàn)成功地與初始受眾產(chǎn)生共鳴的時(shí)候。整個(gè)過(guò)程就像一個(gè)路演,你可以利用你的數(shù)據(jù)故事來(lái)活得盡可能多的支持。

有了足夠多的支持之后,人們就會(huì)開(kāi)始采取行動(dòng):利用不同的方式定位消費(fèi)潛力,調(diào)整目前的戰(zhàn)略從而提高運(yùn)營(yíng)效率,關(guān)閉不必要的產(chǎn)品功能,推出新流程來(lái)防范風(fēng)險(xiǎn)等等。

正如中國(guó)的一句諺語(yǔ):牽一發(fā)而動(dòng)全身。把你得出的建議轉(zhuǎn)化為行動(dòng)時(shí),會(huì)對(duì)組織的各個(gè)部分產(chǎn)生連鎖反應(yīng),而每個(gè)部門(mén)自然會(huì)從多個(gè)方向進(jìn)行審查,而這些審查對(duì)于你的分析來(lái)說(shuō)相當(dāng)于一次壓力測(cè)試。

本著一種懷疑的態(tài)度,人們可以對(duì)你的數(shù)據(jù)質(zhì)量,假設(shè)和建模方法提出質(zhì)疑。如果人們?cè)谀愕脑紨?shù)據(jù)中發(fā)現(xiàn)了錯(cuò)誤,那么你故事的說(shuō)服力會(huì)降低。

從不同的角度來(lái)看,人們可能會(huì)在你的關(guān)注點(diǎn)之外提出各種問(wèn)題,這可能會(huì)導(dǎo)致額外的分析迭代過(guò)程。即使你基于數(shù)據(jù)的故事被別人完全接受,人們也可能會(huì)要求你提供數(shù)據(jù),圖表和數(shù)據(jù)模型從而進(jìn)行進(jìn)一步的分析。

人們還可能會(huì)要求你為了其它會(huì)議提供不同的圖表。這些需求將促使你將分析的工作文檔記錄在案,使其可訪(fǎng)問(wèn),模塊化和可交互。如果你通過(guò)了這些壓力測(cè)試并不斷改進(jìn)你的故事,你的故事會(huì)變得更加精巧,并且與實(shí)際行動(dòng)更加接近。

路演有可能會(huì)成功,失敗,或者介乎二者之間。A型數(shù)據(jù)科學(xué)家需要對(duì)預(yù)期和實(shí)際行動(dòng)之間的轉(zhuǎn)化情況有合理的預(yù)估。時(shí)至今日,每個(gè)商業(yè)領(lǐng)袖都高度重視由數(shù)據(jù)驅(qū)動(dòng)的決策,而給出數(shù)據(jù)解決方案成為商業(yè)世界中最重要的環(huán)節(jié)。

但是這種趨勢(shì)并不意味著決策僅僅將由數(shù)據(jù)驅(qū)動(dòng)。決策本身仍然是科學(xué)與藝術(shù)的復(fù)雜調(diào)和,是數(shù)據(jù)邏輯和業(yè)務(wù)邏輯的混合體。在現(xiàn)實(shí)世界中,高管利用群策群力,定性和定量地來(lái)做出決策。

數(shù)據(jù)科學(xué)分析能夠完全決定一項(xiàng)主要商業(yè)活動(dòng)這句話(huà)并沒(méi)有錯(cuò)誤,但是也可能會(huì)起到誤導(dǎo)作用。在過(guò)去,我認(rèn)為如果一個(gè)數(shù)據(jù)分析的結(jié)果最終導(dǎo)致一個(gè)商業(yè)行動(dòng),那么這個(gè)數(shù)據(jù)分析本身是成功的。但是我現(xiàn)在看到了更多的商業(yè)案例,在這些案例中我們獲得了一些真知灼見(jiàn),但并沒(méi)有轉(zhuǎn)化為行動(dòng)。

通過(guò)研究復(fù)雜的商業(yè)世界,我現(xiàn)在得出的結(jié)論是:將商業(yè)洞察轉(zhuǎn)化為行動(dòng)還取決于你的洞察有多大的影響力。而且A型數(shù)據(jù)科學(xué)家的成功不應(yīng)該由它們的分析所帶來(lái)的商業(yè)行動(dòng)(和業(yè)務(wù)成果)來(lái)判斷。放下對(duì)于數(shù)據(jù)科學(xué)可以化腐朽為神奇的幻想,并且承認(rèn)洞察力的實(shí)際局限性有助于讓我更好地專(zhuān)注打磨技巧,而不是被許多無(wú)法控制的事情分散注意力。

最后想說(shuō)的話(huà)

商業(yè)洞察是數(shù)據(jù)科學(xué)工作的重要輸出。我們尋找數(shù)據(jù)洞察力,因?yàn)槲覀冃枰床炝?lái)幫助我們讓這個(gè)世界變得更美好。將洞察力轉(zhuǎn)化為行動(dòng)是將有價(jià)值的洞察力變?yōu)楝F(xiàn)實(shí)的方式。

由于數(shù)據(jù)科學(xué)家通常會(huì)將分析結(jié)果交給其他專(zhuān)業(yè)人士作決策,數(shù)據(jù)科學(xué)家應(yīng)該更好地講述數(shù)據(jù)背后的故事,從而能夠更好地將洞察力轉(zhuǎn)化為行動(dòng)。通過(guò)把將商業(yè)建議放到演講最開(kāi)始的部分,并且在視覺(jué)上著重強(qiáng)調(diào),數(shù)據(jù)科學(xué)家可以講述更加打動(dòng)人的數(shù)據(jù)故事,從而保持一個(gè)合理的從洞察到行動(dòng)的轉(zhuǎn)化率。

標(biāo)簽: 代碼 數(shù)據(jù)分析

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀(guān)點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:工業(yè)數(shù)據(jù):黑客盯上的又一塊“肥肉”

下一篇:19個(gè)超贊的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工具(附資料)