中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

總結(jié):數(shù)據(jù)可視化基本套路

2018-08-06    來源:raincent

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用
本文總結(jié)了多種數(shù)據(jù)可視化圖形,并簡要介紹了各種圖形的作用,能為數(shù)據(jù)科研工作者在數(shù)據(jù)可視化階段提供新的思路,在此分享給大家。

原文如下 :

首先從維基百科上搬出數(shù)據(jù)可視化的概念:

• 數(shù)據(jù)可視化是關(guān)于數(shù)據(jù)之視覺表現(xiàn)形式的研究;其中,這種數(shù)據(jù)的視覺表現(xiàn)形式被定義為一種以某種概要形式抽提出來的信息,包括相應(yīng)信息單位的各種屬性和變量。

用人話簡單來說,數(shù)據(jù)可視化就是用圖形的方式來表征數(shù)據(jù)的規(guī)律。

首先要明確幾點:

• 數(shù)據(jù)可視化從來只是表層的東西,數(shù)據(jù)分析才是核心。就像一個人,不一定長得漂亮人格就高尚,也不一定長得不好看人格就低下。而應(yīng)該反過來,只只有數(shù)據(jù)分析內(nèi)涵豐富、價值高,數(shù)據(jù)可視化才能內(nèi)容豐富、有價值。

• 可是這是個看臉的世界,大部分人對于數(shù)據(jù)也都是外行的,只有把數(shù)據(jù)可視化做得漂亮才能吸引他們的注意;只有把數(shù)據(jù)可視化做得簡單易懂,他們才能理解數(shù)據(jù)分析的內(nèi)涵。

• 對于數(shù)據(jù)可視化,最重要的東西從來不是圖形、工具、配色這些套路性的東西,而在于創(chuàng)意和靈感。可你又不是參加比賽,并不需要那么多的創(chuàng)意靈感。在日常工作中,還是以實用為主,所以掌握套路還是很必要的。

本文旨在總結(jié)數(shù)據(jù)可視化基本套路,理解了本文的內(nèi)容,就算不能在數(shù)據(jù)可視化比賽中拿獎,應(yīng)付日常工作應(yīng)該也夠了。熟悉了套路怎么看,再結(jié)合專業(yè)知識,就可以解釋可視化結(jié)果了。

常用圖形

散點圖

 

 

散點圖用來表征兩個(如果多個就分面,如上圖)數(shù)值型變量間的關(guān)系,每個點的位置(即x軸和y軸坐標(biāo))映射著兩個變量的值。當(dāng)然對于三個數(shù)值型變量,也有三維散點圖,不過用得不多。

氣泡圖

 

在散點圖的基礎(chǔ)上加一個維度,把各個點的面積大小映射一個新的變量,這樣不僅點的位置還有大小表示數(shù)據(jù)特征。

折線圖

 

把散點圖各個散點用折線連接起來就成了折線圖,當(dāng)然不僅僅只是為了好看,當(dāng)散點越多,折線就越平滑地趨近于曲線,能更加貼切地反映連續(xù)型變量的規(guī)律。

面積圖

 

把折線圖進(jìn)一步往坐標(biāo)軸投影就成了面積圖,本質(zhì)其實跟折線圖沒區(qū)別,只是看起來更加飽滿一點。

柱狀圖

 

柱狀圖是一種用得很廣泛的圖形,它表征分類型變量 vs 數(shù)值型變量的關(guān)系。如果分類型變量的每一個取值還能繼續(xù)分類,那么簡單的柱狀圖就變成了復(fù)雜的柱狀圖,每一個類別僅由一根柱變成多根柱,多根柱可以串列,也可以并列。

值得一提的是,柱狀圖一般需要排序:如果分類型變量是有序的,按照它本身的順序排列即可;如果分類型變量無序,那么則根據(jù)數(shù)值型變量的大小進(jìn)行排序,使柱狀圖的高度單調(diào)變化。(排序的宗旨是直觀的表達(dá)出想展示的規(guī)律)

條形圖

 

只不過把柱狀圖坐標(biāo)旋轉(zhuǎn)一下,豎著的變成橫著的,這個可根據(jù)版面自由選擇。上圖示例就是串列的堆疊條形圖。

南丁格爾玫瑰圖

 

本質(zhì)還是柱狀圖,只不過把直角坐標(biāo)系映射成極坐標(biāo)系。看起來比柱狀圖更美觀。

瀑布圖

 

瀑布圖是柱狀圖的一種延伸,它一般表示某個指標(biāo)隨時間的漲跌規(guī)律,每一個柱狀也不都是從0開始的,而是從前一個柱狀的終點位置開始,這樣既反映了每一個時刻的漲跌情況,也反映了數(shù)值指標(biāo)在每一個時刻的值。

餅圖

 

餅圖的本質(zhì)仍是柱狀圖,只不過餅圖一般用來表示各個類別的比例,而不是絕對的數(shù)值,用角度來映射大小。

值得一提的是,因為一個圓餅只有360度,如果類別太多了,這個餅會被切割得非常細(xì),不利于閱讀;這種情況下老老實實地用柱狀圖。

圓環(huán)圖

 

本質(zhì)就是餅圖,只不過把實心圓換成了空心的圓環(huán);如果清一色的餅圖太過單調(diào),可以考慮換個環(huán)形圖。

sunburst chart

 

sunburst chart看起來跟餅圖比較像,但比餅圖更復(fù)雜得多。它從中心向外輻射,每輻射一層就細(xì)分一層,用來表示多個變量多層之間的比例關(guān)系。

馬賽克圖

 

馬賽克圖比較復(fù)雜,與柱狀圖相比,它的分類變量就多了幾個,而且還能實現(xiàn)交叉映射,所以比柱狀圖更抽象,更細(xì)化。

馬賽克圖隱含著大量的數(shù)據(jù)信息。例如:(1)從船員到頭等艙,存活率陡然提高;(2)大部分孩子都處在三等艙和二等艙中;(3)在頭等艙中的大部分女性都存活了下來,而三等艙中僅有一半女性存活;(4)船員中女性很少,導(dǎo)致該組的Survived標(biāo)簽重疊(圖底部的No和Yes)。繼續(xù)觀察,你將發(fā)現(xiàn)更多有趣的信息。關(guān)注矩形的相對寬度和高度,你還能發(fā)現(xiàn)那晚其他什么秘密嗎?擴(kuò)展的馬賽克圖添加了顏色和陰影來表示擬合模型的殘差值。在本例中,藍(lán)色陰影表明,在假定生存率與船艙等級、性別和年齡層無關(guān)的條件下,該類別下的生存率通常超過預(yù)期值。紅色陰影則含義相反。一定要運行該例子的代碼,這樣你可以真實感受下著色圖形的效果。圖形表明,在模型的獨立條件下,頭等艙女性存活數(shù)和男性船員死亡數(shù)超過模型預(yù)期值。如果存活數(shù)與船艙等級、性別和年齡層獨立,三等艙男性的存活數(shù)比模型預(yù)期值低。嘗試運行example(mosaic),可以了解更多馬賽克圖的細(xì)節(jié)。

直方圖

 

直方圖看起來跟柱狀圖很像,但其實本質(zhì)并不一樣 (這一點需要注意)。直方圖用來表征一個數(shù)值型變量的分布,具體來說就是把這個連續(xù)型變量劃分成多個區(qū)間,然后統(tǒng)計各個區(qū)間的頻數(shù)。直方圖橫軸是數(shù)值型變量本身的值,縱軸是頻數(shù)。

概率密度曲線圖

 

概率密度曲線圖本質(zhì)與直方圖類似,不過縱軸不是頻數(shù)而是頻率。正如折線圖和面積圖一樣,概率密度曲線圖也可自由選擇要不要面積投影。這個圖太學(xué)術(shù)了,一般出現(xiàn)在數(shù)學(xué)教材中(比如正態(tài)分布……)。

雷達(dá)圖

 

很多游戲中的人物能力極向?qū)Ρ染褪且岳走_(dá)圖表示的。柱狀圖一般是一個分類型變量不同類別間的比較,雷達(dá)圖可以是多個數(shù)值不在同一個scale之下;更具體地說,柱狀圖一般是橫向比較,雷達(dá)圖既可以多個觀測之間的縱向比較,也可以是一個觀測在不同變量間的橫向比較。

值得一提的是,雷達(dá)圖如果用來橫向比較,需先把各個數(shù)值變量作歸一化處理。

標(biāo)簽: b2c 代碼 數(shù)據(jù)分析

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:降溫!降溫!降溫!四家數(shù)據(jù)中心創(chuàng)業(yè)公司的液

下一篇:你的公司到底需不需要數(shù)據(jù)科學(xué)家?