久久乐一本色道久久综合一,欧美日韩国产精品自在自线,中文国产精品久久久,欧美日韩亚洲精品

<label id="5ntg5"><strong id="5ntg5"><font id="5ntg5"></font></strong></label>
  • <th id="5ntg5"></th>
  • <td id="5ntg5"></td>
    <td id="5ntg5"></td>
  • <small id="5ntg5"></small>
  •  中國簡單快捷的免費行業(yè)信息發(fā)布平臺
    ·手機版 ·注冊 ·登錄 ·會員中心 ·忘了密碼 ·導航 ·幫助
    名站在線LOGO
    ·設 為 首 頁
    ·收 藏 本 站
    ·新 站 登 錄
    網(wǎng)站首頁
    |
    行業(yè)供求
    |
    行業(yè)產(chǎn)品
    |
    行業(yè)公司
    |
    站內(nèi)檢索
    |
    行業(yè)資訊
    |
    網(wǎng)站導航
    |
    鏈接交換
    |
    流量交換
    |
    網(wǎng)友收藏
    您當前的位置: 首頁 > 行業(yè)貼吧 > 話題


    行業(yè)貼吧

    (注意:網(wǎng)友的發(fā)布表不代表本站立場。)
    回復話題
    發(fā)新話題
    返回列表
    話題: 大數(shù)據(jù)的核心有哪些
    183.17.230.*
    2020-06-01 11:01:50
      對于大數(shù)據(jù)和云計算之間的關系,人們常常存在誤解。而且也會把它們混起來說,分別做一句話直白解釋就是:云計算就是硬件資源的虛擬化;大數(shù)據(jù)是對海量數(shù)據(jù)的**處理。如果有一個更生動的解釋,云計算就相當于我們的計算機和操作系統(tǒng),將大量的硬件資源虛擬化之后再進行分配使用;大數(shù)據(jù)則相當于海量數(shù)據(jù)的“數(shù)據(jù)庫”。





      整體來看,未來的趨勢是,云計算作為計算資源的底層,支撐著上層的大數(shù)據(jù)處理,而大數(shù)據(jù)的發(fā)展趨勢是,實時交互式的查詢效率和分析能力,當前的大數(shù)據(jù)處理一直在向著近似于傳統(tǒng)數(shù)據(jù)庫體驗的方向發(fā)展。



      大數(shù)據(jù)的4V特性,即類型復雜、海量、快速和價值,其總體架構(gòu)包括三層,數(shù)據(jù)存儲、數(shù)據(jù)處理和數(shù)據(jù)分析。類型復雜和海量由數(shù)據(jù)存儲層解決,快速和時效性要求由數(shù)據(jù)處理層解決,價值由數(shù)據(jù)分析層解決。數(shù)據(jù)先要通過存儲層存儲下來,然后根據(jù)數(shù)據(jù)需求和目標來建立相應的數(shù)據(jù)模型和數(shù)據(jù)分析指標體系對數(shù)據(jù)進行分析產(chǎn)生價值。而中間的時效性又通過中間數(shù)據(jù)處理層提供的強大的并行計算和分布式計算能力來完成。三層相互配合,讓大數(shù)據(jù)最終產(chǎn)生價值。



      數(shù)據(jù)存儲層



      數(shù)據(jù)有很多分法,有結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化;也有元數(shù)據(jù)、主數(shù)據(jù)、業(yè)務數(shù)據(jù);還可以分為GIS、視頻、文件、語音、業(yè)務交易類各種數(shù)據(jù)。傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)庫已經(jīng)無法滿足數(shù)據(jù)多樣性的存儲要求,因此在RDBMS基礎上增加了兩種類型,一種是hdfs可以直接應用于非結(jié)構(gòu)化文件存儲,一種是nosql類數(shù)據(jù)庫,可以應用于結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)存儲。



      從存儲層的搭建來說,關系型數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫和hdfs分布式文件系統(tǒng)三種存儲方式都需要。業(yè)務應用根據(jù)實際的情況選擇不同的存儲模式,但是為了業(yè)務的存儲和讀取方便性,我們可以對存儲層進一步的封裝,形成一個統(tǒng)一的共享存儲服務層,簡化這種操作。從用戶來講并不關心底層存儲細節(jié),只關心數(shù)據(jù)的存儲和讀取的方便性,通過共享數(shù)據(jù)存儲層可以實現(xiàn)在存儲上的應用和存儲基礎設置的徹底解耦。



      數(shù)據(jù)處理層



      數(shù)據(jù)處理層核心解決問題在于數(shù)據(jù)存儲出現(xiàn)分布式后帶來的數(shù)據(jù)處理上的復雜度,海量存儲后帶來了數(shù)據(jù)處理上的時效性要求,這些都是數(shù)據(jù)處理層要解決的問題。



      在傳統(tǒng)的云相關技術(shù)架構(gòu)上,可以將hive,pig和hadoop-mapreduce框架相關的技術(shù)內(nèi)容全部劃入到數(shù)據(jù)處理層的能力。原來我思考的是將hive劃入到數(shù)據(jù)分析層能力不合適,因為hive重點還是在真正處理下的復雜查詢的拆分、查詢結(jié)果的重新聚合,而mapreduce本身又實現(xiàn)真正的分布式處理能力。



      mapreduce只是實現(xiàn)了一個分布式計算的框架和邏輯,而真正的分析需求的拆分、分析結(jié)果的匯總和合并還是需要hive層的能力整合。最終的目的很簡單,即支持分布式架構(gòu)下的時效性要求。



      數(shù)據(jù)分析層



      **回到分析層,分析層重點是真正挖掘大數(shù)據(jù)的價值所在,而價值的挖掘核心又在于數(shù)據(jù)分析和挖掘。那么數(shù)據(jù)分析層核心仍然在于傳統(tǒng)的BI分析的內(nèi)容。包括數(shù)據(jù)的維度分析、數(shù)據(jù)的切片、數(shù)據(jù)的上鉆和下鉆、cube等。



      數(shù)據(jù)分析我只關注兩個內(nèi)容,一個就是傳統(tǒng)數(shù)據(jù)倉庫下的數(shù)據(jù)建模,在該數(shù)據(jù)模型下需要支持上面各種分析方法和分析策略;其次是根據(jù)業(yè)務目標和業(yè)務需求建立的KPI指標體系,對應指標體系的分析模型和分析方法。解決這兩個問題基本解決數(shù)據(jù)分析的問題。



      傳統(tǒng)的BI分析通過大量的ETL數(shù)據(jù)抽取和集中化,形成一個完整的數(shù)據(jù)倉庫,而基于大數(shù)據(jù)的BI分析,可能并沒有一個集中化的數(shù)據(jù)倉庫,或者將數(shù)據(jù)倉庫本身也是分布式的了,BI分析的基本方法和思路并沒有變化,但是落地到執(zhí)行的數(shù)據(jù)存儲和數(shù)據(jù)處理方法卻發(fā)生了大變化。



      大數(shù)據(jù)的核心有哪些.中琛魔方大數(shù)據(jù)分析平臺(www.zcmorefun.com)表示大數(shù)據(jù)的兩個核心技術(shù)是云技術(shù)和BI,離開云技術(shù)大數(shù)據(jù)沒有根基和落地可能,離開BI和價值,大數(shù)據(jù)又變化為舍本逐末,丟棄關鍵目標。簡單的總結(jié)是:大數(shù)據(jù)的目標驅(qū)動是BI,大數(shù)據(jù)實施落地是云技術(shù)。
    共0個回復
    回復話題
    發(fā)新話題
    返回列表



    新站登錄--網(wǎng)站簡介--流量交換--名站收藏夾--廣告服務--友情鏈接--免責聲明--聯(lián)系我們--意見建議--違法舉報--侵權(quán)舉報
    Copyright 2005-2025 名站在線[zgdjkds.com]版權(quán)所有 經(jīng)營許可證:粵ICP備17047754號