成大欧美久久韩一|在线五月天 日韩|超碰97点播放。|久草手机在线看片|久久国产精品99久久久久久老狼|日本天堂一区二区|欧克亚洲美女噜一噜|欧美成人性爱电影|一本大道无码视频|婷婷国产一区二区三区四区

推廣 熱搜: ISO9001  音樂版權  知識產權貫標  CMMI  ISO20000  質量管理體系  科技服務  知識產權  測試標準  電池 

數(shù)據(jù)治理的內容及實施步驟

   日期:2025-09-23 22:26:15     來源:認證     作者:中企檢測認證網     瀏覽:127    評論:0
核心提示:從技術實施角度看,數(shù)據(jù)治理包含理采存管用這五個步驟,即業(yè)務和數(shù)據(jù)資源梳理、數(shù)據(jù)采集清洗、數(shù)據(jù)庫設計和

從技術實施角度看,數(shù)據(jù)治理包含“理”“采”“存”“管”“用”這五個步驟,即業(yè)務和數(shù)據(jù)資源梳理、數(shù)據(jù)采集清洗、數(shù)據(jù)庫設計和存儲、數(shù)據(jù)管理、數(shù)據(jù)使用。

數(shù)據(jù)資源梳理:數(shù)據(jù)治理的第一個步驟是從業(yè)務的視角厘清組織的數(shù)據(jù)資源環(huán)境和數(shù)據(jù)資源清單,包含組織機構、業(yè)務事項、信息系統(tǒng),以及以數(shù)據(jù)庫、網頁、文件和 API 接口形式存在的數(shù)據(jù)項資源,本步驟的輸出物為分門別類的數(shù)據(jù)資源清單。

數(shù)據(jù)采集清洗:通過可視化的 ETL 工具(例如阿里的 DataX,Pentaho Data Integration)將數(shù)據(jù)從來源端經過抽取 (extract)、轉換 (transform)、加載 (load) 至目的端的過程,目的是將散落和零亂的數(shù)據(jù)集中存儲起來。

基礎庫主題庫建設:一般情況下,可以將數(shù)據(jù)分為基礎數(shù)據(jù)、業(yè)務主題數(shù)據(jù)和分析數(shù)據(jù)?;A數(shù)據(jù)一般指的是核心實體數(shù)據(jù),或稱主數(shù)據(jù),例如智慧城市中的人口、法人、地理信息、信用、電子證照等數(shù)據(jù)。主題數(shù)據(jù)一般指的是某個業(yè)務主題數(shù)據(jù),例如市場監(jiān)督管理局的食品監(jiān)管、質量監(jiān)督檢查、企業(yè)綜合監(jiān)管等數(shù)據(jù)。而分析數(shù)據(jù)指的是基于業(yè)務主題數(shù)據(jù)綜合分析而得的分析結果數(shù)據(jù),例如市場監(jiān)督管理局的企業(yè)綜合評價、產業(yè)區(qū)域分布、高危企業(yè)分布等。那么基礎庫和主題庫的建設就是在對業(yè)務理解的基礎上,基于易存儲、易管理、易使用的原則抽像數(shù)據(jù)存儲結構,說白了,就是基于一定的原則設計數(shù)據(jù)庫表結構,然后再根據(jù)數(shù)據(jù)資源清單設計數(shù)據(jù)采集清洗流程,將整潔干凈的數(shù)據(jù)存儲到數(shù)據(jù)庫或數(shù)據(jù)倉庫中。

元數(shù)據(jù)管理:元數(shù)據(jù)管理是對基礎庫和主題庫中的數(shù)據(jù)項屬性的管理,同時,將數(shù)據(jù)項的業(yè)務含義與數(shù)據(jù)項進行了關聯(lián),便于業(yè)務人員也能夠理解數(shù)據(jù)庫中的數(shù)據(jù)字段含義,并且,元數(shù)據(jù)是后面提到的自動化數(shù)據(jù)共享、數(shù)據(jù)交換和商業(yè)智能(BI)的基礎。需要注意的是,元數(shù)據(jù)管理一般是對基礎庫和主題庫中(即核心數(shù)據(jù)資產)的數(shù)據(jù)項屬性的管理,而數(shù)據(jù)資源清單是對各類數(shù)據(jù)來源的數(shù)據(jù)項的管理。

血緣追蹤:數(shù)據(jù)被業(yè)務場景使用時,發(fā)現(xiàn)數(shù)據(jù)錯誤,數(shù)據(jù)治理團隊需要快速定位數(shù)據(jù)來源,修復數(shù)據(jù)錯誤。那么數(shù)據(jù)治理團隊需要知道業(yè)務團隊的數(shù)據(jù)來自于哪個核心庫,核心庫的數(shù)據(jù)又來自于哪個數(shù)據(jù)源頭。我們的實踐是在元數(shù)據(jù)和數(shù)據(jù)資源清單之間建立關聯(lián)關系,且業(yè)務團隊使用的數(shù)據(jù)項由元數(shù)據(jù)組合配置而來,這樣,就建立了數(shù)據(jù)使用場景與數(shù)據(jù)源頭之間的血緣關系。 數(shù)據(jù)資源目錄:數(shù)據(jù)資源目錄一般應用于數(shù)據(jù)共享的場景,例如政府部門之間的數(shù)據(jù)共享,數(shù)據(jù)資源目錄是基于業(yè)務場景和行業(yè)規(guī)范而創(chuàng)建,同時依托于元數(shù)據(jù)和基礎庫主題而實現(xiàn)自動化的數(shù)據(jù)申請和使用。

質量管理:數(shù)據(jù)價值的成功發(fā)掘必須依托于高質量的數(shù)據(jù),唯有準確、完整、一致的數(shù)據(jù)才有使用價值。因此,需要從多維度來分析數(shù)據(jù)的質量,例如:偏移量、非空檢查、值域檢查、規(guī)范性檢查、重復性檢查、關聯(lián)關系檢查、離群值檢查、波動檢查等等。需要注意的是,優(yōu)秀的數(shù)據(jù)質量模型的設計必須依賴于對業(yè)務的深刻理解,在技術上也推薦使用大數(shù)據(jù)相關技術來保障檢測性能和降低對業(yè)務系統(tǒng)的性能影響,例如 Hadoop,MapReduce,Hbase 等。

商業(yè)智能(BI):數(shù)據(jù)治理的目的是使用,對于一個大型的數(shù)據(jù)倉庫來說,數(shù)據(jù)使用的場景和需求是多變的,那么可以使用 BI 類的產品快速獲取需要的數(shù)據(jù),并分析形成報表,比較知名的產品有 Microsoft Power BI,QlikView,Tableau,帆軟等。

數(shù)據(jù)共享交換:數(shù)據(jù)共享包括組織內部和組織之間的數(shù)據(jù)共享,共享方式也分為庫表、文件和 API 接口三種共享方式,庫表共享比較直接粗暴,文件共享方式通過 ETL 工具做一個反向的數(shù)據(jù)交換也就可以實現(xiàn)。我們比較推薦的是 API 接口共享方式,在這種方式下,能夠讓中心數(shù)據(jù)倉庫保留數(shù)據(jù)所有權,把數(shù)據(jù)使用權通過 API 接口的形式進行了轉移。API 接口共享可以使用 API 網關實現(xiàn),常見的功能是自動化的接口生成、申請審核、限流、限并發(fā)、多用戶隔離、調用統(tǒng)計、調用審計、黑白名單、調用監(jiān)控、質量監(jiān)控等等。

中企檢測認證網提供iso體系認證機構查詢,檢驗檢測、認證認可、資質資格、計量校準、知識產權貫標一站式行業(yè)企業(yè)服務平臺。中企檢測認證網為檢測行業(yè)相關檢驗、檢測、認證、計量、校準機構,儀器設備、耗材、配件、試劑、標準品供應商,法規(guī)咨詢、標準服務、實驗室軟件提供商提供包括品牌宣傳、產品展示、技術交流、新品推薦等全方位推廣服務。這個問題就給大家解答到這里了,如還需要了解更多專業(yè)性問題可以撥打中企檢測認證網在線客服13550333441。為您提供全面檢測、認證、商標、專利、知識產權、版權法律法規(guī)知識資訊,包括商標注冊、食品檢測、第三方檢測機構、網絡信息技術檢測環(huán)境檢測、管理體系認證服務體系認證、產品認證版權登記、專利申請、知識產權、檢測法認證標準等信息,中企檢測認證網為檢測認證商標專利從業(yè)者提供多種檢測、認證、知識產權、版權、商標、專利的轉讓代理查詢法律法規(guī),咨詢輔導等知識。

本文內容整合網站:百度百科、搜狗百科、360百科、知乎市場監(jiān)督總局 、國家認證認可監(jiān)督管理委員會、質量認證中心

免責聲明:本文部分內容根據(jù)網絡信息整理,文章版權歸原作者所有。向原作者致敬!發(fā)布旨在積善利他,如涉及作品內容、版權和其它問題,請跟我們聯(lián)系刪除并致歉!

本文來源: http://m.1cjaei.cn/zs/202008/ccaa_5918.html

 
打賞
 
更多>同類認證知識
0相關評論

認證推薦服務
認證推薦圖文
認證推薦知識
認證點擊排行
ISO體系認證  |  關于我們  |  聯(lián)系方式  |  使用協(xié)議  |  版權隱私  |  網站地圖  |  排名推廣  |  廣告服務  |  積分換禮  |  網站留言  |  RSS訂閱  |  違規(guī)舉報  |  蜀ICP備07504973號