中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

大數(shù)據(jù)處理是否一定需要Hadoop

2015-03-27    來源:

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

Google強大的搜尋引擎每天處理龐大的搜尋數(shù)據(jù),靠的是數(shù)十萬的伺服器同時作工。然而一般企業(yè)并無法使用Google所用的內(nèi)部搜尋引擎工具,所以,擁有處理大數(shù)據(jù)工具的分散式運算平臺Hadoop應(yīng)運而生。


但問題是Hadoop使用上有難度,數(shù)據(jù)處理公司Cloudera決心要解決這個問題。


過去的公司企業(yè)仰賴傳統(tǒng)的關(guān)聯(lián)式資料庫和數(shù)據(jù)倉儲就可應(yīng)付所需,然而,今日電子商務(wù)、社交媒體和行動運算不斷成長使得資料量暴增,許多企業(yè)便開始使用Hadoop等的工具處理數(shù)據(jù),F(xiàn)在,Cloudera現(xiàn)在更針對Hadoop平臺推出類Google的搜尋引擎:Cloudera Search。


搜尋引擎讓Hadoop更平易近人


Cloudera希望客戶能在Hadoop壯大之前就將資料儲存進(jìn)去,并將之整合入平臺。但使用Hadoop平臺與資料互動必須要懂得MapReduce運算技術(shù),也就是說你得會寫Java語言,這對許多使用者來說并不方便。


雖然Hadoop已經(jīng)推出許多工具讓使用上更便利,但Cloudera希望更進(jìn)一步建立一個Hadoop的搜尋引擎。產(chǎn)品經(jīng)理澤德勒維斯基(Charles Zedlewski)說:數(shù)萬開發(fā)者可能知道怎么用MapReduce,執(zhí)行SQL指令,但會使用搜尋引擎的人有數(shù)十億人。


Cloudera Search能夠與Hadoop分散式檔案系統(tǒng)(HDFS)或資料庫系統(tǒng)Hbase整合,使用者可以輸入搜尋字串后就找到一串搜尋結(jié)果。這項搜尋工具是以Apache Solr搜尋器為基礎(chǔ)。


市場研究公司RedMonk分析師歐葛瑞迪(Stephen O’Grady)表示:每多一項數(shù)據(jù)處理工具對Hadoop都有好處……從寫MapReduce程式到支援SQL語法的Hive或Pig等套件,每項工具都讓數(shù)據(jù)處理更有效率。


所有大數(shù)據(jù)都該放入Hadoop嗎?


這對改善Hadoop可用性的確幫助不少,但問題是:客戶是否真的有需要將它們所有的數(shù)據(jù)都放入Hadoop?微軟今年稍早發(fā)表一份報告,主張大多數(shù)的公司只需要增加叢集伺服器的使用數(shù)量,不須嘗試用單臺伺服器處理數(shù)據(jù),報告指出,甚至雅虎和臉書兩家最需要數(shù)據(jù)處理效能的公司,也是透過增加伺服器叢集解決效能問題。


但許多公司正面臨數(shù)據(jù)不斷增長的問題,一開始就加入Hadoop是不錯的選擇,RedMonk過去也是Hadoop的使用者,但最近轉(zhuǎn)用BigQuery等其他的Google資料庫工具,原因是他們的數(shù)據(jù)在量上本質(zhì)就比較小,而且成長的速度也沒有分析師原本預(yù)測得快。


但歐葛瑞迪說:如果我們能夠更快速地獲得數(shù)據(jù),就一定會使用Hadoop!


標(biāo)簽: Google 處理大數(shù)據(jù) 大數(shù)據(jù) 電子商務(wù) 開發(fā)者 媒體 企業(yè) 問題 選擇

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:云服務(wù)器多少錢

下一篇:云服務(wù)器如何選擇操作系統(tǒng)