久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長(zhǎng)資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      XSKY打造Hadoop HDFS高性能客戶端,構(gòu)筑數(shù)據(jù)湖理想底座

        隨著全球數(shù)據(jù)呈爆發(fā)式增長(zhǎng),基于海量數(shù)據(jù)的挖掘和分析,為用戶帶來了巨大的商業(yè)價(jià)值。源于開源平臺(tái)的Apache Hadoop,允許使用簡(jiǎn)單的編程模型跨計(jì)算機(jī)集群分布式處理大型數(shù)據(jù)集,成為大數(shù)據(jù)時(shí)代最受歡迎的技術(shù)之一。

        01性能瓶頸

        HDFS分布式文件系統(tǒng)作為Hadoop的三大組件之一,是分布式計(jì)算中數(shù)據(jù)存儲(chǔ)管理的基礎(chǔ)。但是在HDFS傳統(tǒng)架構(gòu)下,Hadoop擴(kuò)展性受到了一定限制,容易出現(xiàn)性能瓶頸等問題。

      XSKY打造Hadoop HDFS高性能客戶端,構(gòu)筑數(shù)據(jù)湖理想底座

      圖片來源:Hadoop官方文檔

        例如,由于HDFS中每個(gè)文件、目錄和數(shù)據(jù)塊的元數(shù)據(jù)信息(大約150字節(jié))必須存儲(chǔ)在NameNode的內(nèi)存中,這也就意味著對(duì)于一個(gè)擁有大量文件的超大集群來說,內(nèi)存將成為限制系統(tǒng)橫向擴(kuò)展的瓶頸。

        同時(shí),作為一個(gè)可擴(kuò)展的文件系統(tǒng),單個(gè)集群中支持?jǐn)?shù)千個(gè)節(jié)點(diǎn)。在單個(gè)命名空間中DataNode可以擴(kuò)展的很好,但是NameNode并不能在單個(gè)命名空間進(jìn)行橫向擴(kuò)展。通常情況下,HDFS集群的性能瓶頸出現(xiàn)在單個(gè)NameNode上。

        雖然,在Hadoop 2.x發(fā)行版中引入了聯(lián)邦HDFS功能,允許系統(tǒng)通過添加多個(gè)NameNode來實(shí)現(xiàn)擴(kuò)展。但是,系統(tǒng)管理員需要維護(hù)多個(gè)NameNodes和負(fù)載均衡服務(wù),這又無形中增加了管理成本。

        此外,大數(shù)據(jù)平臺(tái)建設(shè)和應(yīng)用中還亟待解決以下問題:

        ▪ 在傳統(tǒng)的Apache Hadoop集群系統(tǒng)中,計(jì)算和存儲(chǔ)資源緊密耦合。當(dāng)存儲(chǔ)空間或計(jì)算資源不足時(shí),只能同時(shí)對(duì)兩者進(jìn)行擴(kuò)容,不僅擴(kuò)容不方便,且經(jīng)濟(jì)效率較低;

        ▪ Hadoop的數(shù)據(jù)備份方案昂貴,且難以實(shí)現(xiàn);

        ▪ 不同部門、平臺(tái)各自建大數(shù)據(jù)系統(tǒng),數(shù)據(jù)不共享,導(dǎo)致大數(shù)據(jù)計(jì)算平臺(tái)碎片化,逐漸形成大數(shù)據(jù)煙囪。

        02XSKY HDFS Client

        為了解決上述問題,業(yè)界一般采用對(duì)象存儲(chǔ)來作為Hadoop的后端存儲(chǔ),解決上面HDFS的各種問題,構(gòu)建數(shù)據(jù)湖解決方案。

        Hadoop社區(qū)也開發(fā)了S3A連接器,用來對(duì)接標(biāo)準(zhǔn)的S3對(duì)象存儲(chǔ)。但是,標(biāo)準(zhǔn)的S3A連接器的性能一般比HDFS要差很多,而且不支持追加寫,因此只能支持部分對(duì)性能不高的業(yè)務(wù),或者作為Hadoop分層存儲(chǔ)使用。

        為此,XSKY開發(fā)了基于對(duì)象存儲(chǔ)XEOS的專用Hadoop HDFS高性能客戶端XSKY HDFS Client。

      XSKY打造Hadoop HDFS高性能客戶端,構(gòu)筑數(shù)據(jù)湖理想底座

      XSKY HDFS Client和S3A架構(gòu)對(duì)比

        通過XSKY HDFS Client,Hadoop應(yīng)用可以訪問存儲(chǔ)在XEOS中的所有數(shù)據(jù),這就避免了傳統(tǒng)的Hadoop應(yīng)用在進(jìn)行數(shù)據(jù)分析前,還要將數(shù)據(jù)由業(yè)務(wù)存儲(chǔ)移動(dòng)到分析存儲(chǔ)HDFS中。

        XSKY HDFS Client為Hadoop應(yīng)用提供了標(biāo)準(zhǔn)的 Hadoop 文件系統(tǒng)操作接口。在每個(gè)計(jì)算節(jié)點(diǎn)上,Hadoop應(yīng)用都將使用XSKY HDFS Client (JAR) 執(zhí)行 Hadoop文件系統(tǒng)的操作,XSKY HDFS Client屏蔽了Hadoop應(yīng)用與XEOS集群交互的復(fù)雜性。

        相比于原生Hadoop S3A對(duì)接對(duì)象存儲(chǔ)的方式,XSKY HDFS Client可以直接訪問存儲(chǔ)集群的OSD,IO路徑更短;同時(shí),XSKY HDFS Client具有追加寫的功能,可以匹配Hadoop文件系統(tǒng)對(duì)追加寫的需求。

        XSKY內(nèi)部對(duì)在業(yè)界最廣泛應(yīng)用的Hadoop商業(yè)發(fā)行版本之一Cloudera CDH的TestDFSIO測(cè)試中顯示,部署了XSKY HDFS Client的 XEOS集群寫性能超過采用Remote HDFS系統(tǒng)的94%,讀性能超過77%(兩種測(cè)試硬件配置一樣,節(jié)點(diǎn)數(shù)都是8節(jié)點(diǎn),其中存儲(chǔ)和Datanode都是3節(jié)點(diǎn))。

      XSKY打造Hadoop HDFS高性能客戶端,構(gòu)筑數(shù)據(jù)湖理想底座
      XSKY打造Hadoop HDFS高性能客戶端,構(gòu)筑數(shù)據(jù)湖理想底座

        WordCount測(cè)試中,性能瓶頸主要在CDH計(jì)算集群的CPU使用率,兩組測(cè)試環(huán)境計(jì)算集群的CPU均達(dá)到了100%。HDFS對(duì)1TB數(shù)據(jù)進(jìn)行WordCount計(jì)算的時(shí)間消耗為46分22秒,而XEOS的時(shí)間消耗為47分20秒,相差不大。

      XSKY打造Hadoop HDFS高性能客戶端,構(gòu)筑數(shù)據(jù)湖理想底座

        HBase寫測(cè)試中,HDFS對(duì)30,000,000條數(shù)據(jù)進(jìn)行寫入時(shí)間消耗為2分23秒,而XEOS的時(shí)間消耗為2分55秒,與HDFS比相差30秒左右。但是從HBase統(tǒng)計(jì)的IOPS來看,HDFS和XEOS相差不大。

      XSKY打造Hadoop HDFS高性能客戶端,構(gòu)筑數(shù)據(jù)湖理想底座
      XSKY打造Hadoop HDFS高性能客戶端,構(gòu)筑數(shù)據(jù)湖理想底座

        HBase讀測(cè)試,HDFS對(duì)30,000,000條數(shù)據(jù)進(jìn)行讀取時(shí)間消耗為47秒,而XEOS的時(shí)間消耗為46秒,幾乎沒有差別。但是從HBase統(tǒng)計(jì)的IOPS來看, XEOS明顯高于HDFS。

      XSKY打造Hadoop HDFS高性能客戶端,構(gòu)筑數(shù)據(jù)湖理想底座
      XSKY打造Hadoop HDFS高性能客戶端,構(gòu)筑數(shù)據(jù)湖理想底座

        03客戶收益

        ▪ 計(jì)算存儲(chǔ)分離部署,按需擴(kuò)容,大幅降低TCO;

        ▪ 更加優(yōu)化的性能,以及企業(yè)級(jí)存儲(chǔ)特性;

        ▪ 適用于大數(shù)據(jù)平臺(tái)的容災(zāi)備份;

        ▪ 同時(shí)支持生產(chǎn)業(yè)務(wù)、Hadoop、MPP、AI等計(jì)算業(yè)務(wù),解決數(shù)據(jù)孤島問題;

        ▪ 一套存儲(chǔ)系統(tǒng),承載多個(gè)異構(gòu)平臺(tái)的數(shù)據(jù)整合,加速數(shù)據(jù)流動(dòng);

        ▪ NFS、HDFS、S3三種協(xié)議互通,三種協(xié)議來源的數(shù)據(jù)都可以統(tǒng)一進(jìn)行in-place分析,分析結(jié)果可以通過S3實(shí)時(shí)發(fā)布。

        XSKY目前已經(jīng)實(shí)現(xiàn)塊、文件、對(duì)象、HDFS支持,為企業(yè)用戶構(gòu)建了真正統(tǒng)一的數(shù)據(jù)存儲(chǔ)平臺(tái),可實(shí)現(xiàn)用戶從核心生產(chǎn)到海量數(shù)據(jù)分析的最大化數(shù)據(jù)整合,助力構(gòu)筑企業(yè)數(shù)據(jù)湖理想底座!

      特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)