中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

Platform MapReduce照亮“大數(shù)據(jù)”時代

2018-06-11    來源:

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

  在日趨激烈的市場競爭環(huán)境中,企業(yè)越來越依賴于從對數(shù)據(jù)的分析中揭示未來發(fā)展的方向。在傳統(tǒng)的企業(yè)應(yīng)用中,結(jié)構(gòu)化數(shù)據(jù)是最為普遍的數(shù)據(jù)類型。然而,隨著社交媒體、移動計算等新技術(shù)的演進,企業(yè)不得不面對文本、圖像、電子郵件、音視頻、網(wǎng)上交易數(shù)據(jù)等海量新型數(shù)據(jù)。與傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)不同,這些數(shù)據(jù)都是非結(jié)構(gòu)化的。
  如今,非結(jié)構(gòu)化數(shù)據(jù)的爆炸性增長,正在深刻影響著整個數(shù)據(jù)存儲和分析領(lǐng)域。為了滿足新興的業(yè)務(wù)需求,企業(yè)開始逐漸摒棄傳統(tǒng)的數(shù)據(jù)處理方式,轉(zhuǎn)而嘗試新的模式對包括非結(jié)構(gòu)化數(shù)據(jù)在內(nèi)的各種類型數(shù)據(jù)進行訪問、處理和分析——這便是“大數(shù)據(jù)”問題。

MapReduce:下一代數(shù)據(jù)處理編程模式
  “大數(shù)據(jù)”的問題,正促使企業(yè)中傳統(tǒng)的存儲和計算解決方案開始邁向變革之路。從現(xiàn)狀來看,當前存儲模型大多數(shù)能夠支持企業(yè)級需求。因此,“大數(shù)據(jù)”的焦點問題開始轉(zhuǎn)向新型編程框架領(lǐng)域。而在這一領(lǐng)域,MapReduce無疑是最受關(guān)注的新一代技術(shù)。它提供了在計算集群下分布處理大數(shù)據(jù)的軟件框架,利用MapReduce編程框架,開發(fā)人員可以開發(fā)出跨處理器分布式集群或獨立計算機的、能夠并行處理海量非結(jié)構(gòu)化數(shù)據(jù)的程序。從目前來看,市場上主要有三種方式能夠?qū)崿F(xiàn)對海量數(shù)據(jù)的MapReduce操作。
  1.開源Apache Hadoop項目。當前,新型編程框架領(lǐng)域被寄予厚望的一項技術(shù)是開源Apache Hadoop軟件及其相關(guān)的MapReduce編程模型。Apache Hadoop是支持數(shù)據(jù)密集型分布式應(yīng)用的軟件框架,采用免費許可證方式,能夠讓應(yīng)用能夠使用Hadoop分布式文件系統(tǒng)內(nèi)的數(shù)千個節(jié)點和數(shù)PB數(shù)據(jù)。然而,開源Hadoop MapReduce解決方案并非盡善盡美,由于其計算部分(即數(shù)據(jù)的抽取、處理和分析歸納)最初只是為了滿足基本的功能需求而非企業(yè)級的實施進行設(shè)計的,因此發(fā)展到現(xiàn)在已經(jīng)無法更好地滿足企業(yè)級的需求。面對日益苛刻的業(yè)務(wù)需求,Hadoop MapReduce目前面臨五大挑戰(zhàn)。
  第一,缺乏高性能和擴展性,F(xiàn)有的Hadoop MapReduce編程模型實現(xiàn)并不提供快速、可擴展的分布式資源基礎(chǔ)架構(gòu)解決方案;第二,缺乏靈活的資源管理,F(xiàn)有的Hadoop MapReduce編程模型實現(xiàn)無法迅速響應(yīng)來自應(yīng)用程序及/或用戶的需求變化;第三;缺少應(yīng)用部署支持,F(xiàn)有的Hadoop  MapReduce編程模型實現(xiàn)并沒有使用自動化應(yīng)用服務(wù)部署功能,因此無法簡化管理生產(chǎn)型分布式系統(tǒng)上的多應(yīng)用集成;第四,無法保證服務(wù)質(zhì)量。現(xiàn)有的Hadoop MapReduce編程模型實現(xiàn)并沒有經(jīng)過優(yōu)化,無法充分利用這個優(yōu)點:通過提高多核服務(wù)器的利用率,加快運行速度、降低成本;第五,缺少多數(shù)據(jù)源支持。現(xiàn)有的Hadoop MapReduce編程模型實現(xiàn)只支持一種分布式文件系統(tǒng),通常是HDFS。而一個完整的MapReduce編程模型實現(xiàn)應(yīng)該足夠靈活,能同時支持多種分布式文件系統(tǒng)的數(shù)據(jù)存取。
  2.商用開源解決方案。Cloudera是一家新興公司,提供自己的Hadoop軟件發(fā)行版,采用與其他開源軟件公司(如紅帽)同樣的商業(yè)模式。它既提供軟件服務(wù),又對整個開源軟件做貢獻——從終端用戶應(yīng)用程序、MapReduce處理到Hadoop文件系統(tǒng)。然而,其解決方案需要處理流程與文件系統(tǒng)緊密集成,這迫使客戶被其數(shù)據(jù)存儲方法牢牢鎖定。此外,它仍是一款未經(jīng)驗證的大規(guī)模企業(yè)軟件解決方案——包括負載管理功能、高度依賴開源社區(qū)、服務(wù)質(zhì)量和性能無法得到保障。
  3.數(shù)據(jù)倉庫分析。一些數(shù)據(jù)倉庫廠商在自己的數(shù)據(jù)倉庫上實施了MapReduce編程模型,包括EMC/Greenplum和Aster Data等公司。雖然MapReduce與數(shù)據(jù)倉庫緊密集成對客戶來說是個誘人、可靠的解決方案,但是該解決方案只與各廠商自己的數(shù)據(jù)倉庫協(xié)同運行,而且不支持其他非結(jié)構(gòu)化的數(shù)據(jù)系統(tǒng),如HDFS、Appistry以及其他許多數(shù)據(jù)系統(tǒng)。

企業(yè)級MapReduce分布式運行引擎
  由于普遍缺乏擴展或管理大型分布式環(huán)境和工作負載并且保持服務(wù)水平或避免廠商鎖定的能力,眾多開源MapReduce解決方案難以滿足企業(yè)的需求。因此,很多企業(yè)機構(gòu)并不愿意為企業(yè)應(yīng)用程序部署開源的分布式運行引擎。然而,面對不斷激增的數(shù)據(jù),如果企業(yè)希望通過MapReduce編程框架對那些龐大的異構(gòu)數(shù)據(jù)集執(zhí)行分布式計算的話,就勢必需要一種具有高擴展性、高可用性又易于管理的企業(yè)級解決方案。
  為了滿足將MapReduce應(yīng)用遷移至生產(chǎn)環(huán)境的挑戰(zhàn),全球領(lǐng)先的集群、網(wǎng)格、云中間件和云管理平臺提供商——Platform公司已經(jīng)將其企業(yè)級的工作負載管理功能引入到“大數(shù)據(jù)”領(lǐng)域。Platform公司在工作負載管理和分布式計算環(huán)境領(lǐng)域的專長,如同專為MapReduce編程模式和擴展支持大型數(shù)據(jù)而量身定制。
  Platform公司最新交付的業(yè)界首款針對MapReduce應(yīng)用程序的企業(yè)級分布式運行引擎——Platform MapReduce,是基于該公司近二十年來在分布式架構(gòu)管理領(lǐng)域積累的豐富經(jīng)驗以及Platform Symphony核心技術(shù)而構(gòu)建的,能夠幫助組織機構(gòu)克服將應(yīng)用程序轉(zhuǎn)移至生產(chǎn)環(huán)境的一切障礙,非常適用于跨分布式文件系統(tǒng)的企業(yè)級運行服務(wù)。
  與市場上開源和商用MapReduce分布式工作負載引擎不同,Platform MapReduce提供了企業(yè)級的MapReduce應(yīng)用程序分布式運行引擎,可以實現(xiàn)對跨整個分布式文件系統(tǒng)的集群中的MapReduce應(yīng)用程序進行調(diào)度和管理。它提供了企業(yè)級的可管理性和可伸縮性、高資源利用率和可用性、操作便利性、多應(yīng)用支持以及一個開放分布式系統(tǒng)架構(gòu),其中還包括了對于Hadoop分布式文件系統(tǒng)(HDFS)和Appistry Cloud IQ的支持,這將確保企業(yè)更加關(guān)注將MapReduce應(yīng)用程序轉(zhuǎn)移至生產(chǎn)環(huán)境中。Platform MapReduce提供的關(guān)鍵價值包括:
  • 企業(yè)級可管理性和伸縮性——包括策略驅(qū)動的工作負載調(diào)度、調(diào)整、監(jiān)測和自動管理功能;擴展多達20000臺服務(wù)器、40000個處理器,支持10000個并發(fā)作業(yè)和30000個并發(fā)任務(wù),這超過了其他所有MapReduce分布式運行引擎。
  • 高資源利用率和共享功能——包括策略驅(qū)動的工作負載調(diào)度,使組織機構(gòu)能夠少付出、多受益。它還提供了多達10000個優(yōu)先級別以確保高資源利用,使更多應(yīng)用程序能夠訪問共享數(shù)據(jù)。
  • 高可靠性——保證分布式運行引擎內(nèi)部的正常運行時間。通過為Map任務(wù)、Reduce任務(wù)和節(jié)點名稱(Name node)提供自動的故障轉(zhuǎn)移功能,有效避免了單點故障的出現(xiàn),而這些功能是其他替代解決方案無法具備的。
  • 易管理性——支持不同版本的應(yīng)用在同一個集群運行,IT部門無需針對各種版本重新配置或升級資源。
  • 多應(yīng)用支持——在一個共享集群上運行多個MapReduce應(yīng)用,支持不同版本的應(yīng)用在同一個集群運行。
  • 開放分布式文件系統(tǒng)架構(gòu)——支持包括Hadoop分布式文件系統(tǒng)(HDFS)和Appistry Cloud IQ等多個文件系統(tǒng),稍后還將支持更多的文件系統(tǒng)和平臺。
  目前,Platform公司提供的MapReduce企業(yè)級解決方案目前已經(jīng)在多個關(guān)鍵的市場廣泛采用,用戶廣泛涉及金融服務(wù)、電信、政府機構(gòu)、生命科學和零售等領(lǐng)域。Platform MapReduce已經(jīng)成為企業(yè)面對“大數(shù)據(jù)”挑戰(zhàn)最值得信賴的基石。

標簽: 處理大數(shù)據(jù) 大數(shù)據(jù) 電子郵件 服務(wù)器 金融 媒體 企業(yè) 問題 用戶

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:ZDNet云計算應(yīng)用"云寶典"登陸iPad 轉(zhuǎn)型云計算第一門戶

下一篇:飛魚星助力中小企業(yè)上網(wǎng)行為可管理