(1)數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)及特點(diǎn)
隨著信息處理技術(shù)的發(fā)展,使得各類(lèi)數(shù)據(jù)、信息急劇增長(zhǎng),給數(shù)據(jù)的傳輸、存儲(chǔ)都帶來(lái)了許多新的問(wèn)題。人們希望能夠看到所有數(shù)據(jù)和信息的綜合情況,而這些數(shù)據(jù)與事務(wù)處理有許多不能被原有數(shù)據(jù)結(jié)構(gòu)描述,不能被現(xiàn)有應(yīng)用系統(tǒng)綜合使用。針對(duì)這一問(wèn)題,人們?cè)O(shè)想專(zhuān)門(mén)為業(yè)務(wù)的統(tǒng)計(jì)分析建立一個(gè)數(shù)據(jù)中心,它的數(shù)據(jù)來(lái)自聯(lián)機(jī)的事務(wù)處理系統(tǒng)、異構(gòu)的外部數(shù)據(jù)源、脫機(jī)的歷史業(yè)務(wù)數(shù)據(jù)等,這個(gè)數(shù)據(jù)中心就叫數(shù)據(jù)倉(cāng)庫(kù)。
被譽(yù)為數(shù)據(jù)倉(cāng)庫(kù)之父的W.H.Inmon將數(shù)據(jù)倉(cāng)庫(kù)定義為:“數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、相對(duì)穩(wěn)定的和隨時(shí)間的數(shù)據(jù)集合,用于支持管理決策和商務(wù)智能。”數(shù)據(jù)倉(cāng)庫(kù)技術(shù),簡(jiǎn)單的說(shuō),就是將企業(yè)內(nèi)外部的數(shù)據(jù)進(jìn)行全面的集成、清洗和整理,去除一些純事務(wù)性的數(shù)據(jù),將企業(yè)數(shù)據(jù)按主題放置到一個(gè)“倉(cāng)庫(kù)”中,然后在次基礎(chǔ)上建立各種決策支持的數(shù)據(jù)為企業(yè)服務(wù)。基本結(jié)構(gòu)如圖1所示:
圖1 數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)
對(duì)于數(shù)據(jù)倉(cāng)庫(kù)的概念我們可以從兩個(gè)層次予以理解,首先,數(shù)據(jù)倉(cāng)庫(kù)用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫(kù);其次,數(shù)據(jù)倉(cāng)庫(kù)是對(duì)多個(gè)異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進(jìn)行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)一般不再修改。數(shù)據(jù)倉(cāng)庫(kù)擁有以下四個(gè)特點(diǎn):
①面向主題。操作型數(shù)據(jù)庫(kù)的數(shù)據(jù)組織面向事務(wù)處理任務(wù),各個(gè)業(yè)務(wù)系統(tǒng)之間各自分離,而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是按照一定的主題域進(jìn)行組織,它與傳統(tǒng)數(shù)據(jù)庫(kù)中的面向應(yīng)用相對(duì)應(yīng)。主題是一個(gè)抽象的概念,是指用戶(hù)使用數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行決策時(shí)所關(guān)心的重點(diǎn)方面,一個(gè)主題通常與多個(gè)操作型信息系統(tǒng)相關(guān)。
②集成的。面向事務(wù)處理的操作型數(shù)據(jù)庫(kù)通常與某些特定的應(yīng)用相關(guān),數(shù)據(jù)庫(kù)之間相互獨(dú)立,并且往往是異構(gòu)的。而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是在對(duì)原有分散的數(shù)據(jù)庫(kù)數(shù)據(jù)抽取、清理的基礎(chǔ)上經(jīng)過(guò)系統(tǒng)加工、匯總和整理得到的,必須消除源數(shù)據(jù)中的不一致性,以保證數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的信息是關(guān)于整個(gè)企業(yè)的一致的全局信息。數(shù)據(jù)倉(cāng)庫(kù)的集成特性是指在數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前,必須經(jīng)過(guò)數(shù)據(jù)加工和集成,這是建立數(shù)據(jù)倉(cāng)庫(kù)的關(guān)鍵步驟。它能夠統(tǒng)一原始數(shù)據(jù)中的矛盾之處,還能夠?qū)⒃紨?shù)據(jù)結(jié)構(gòu)從面向應(yīng)用向面向主題轉(zhuǎn)變。
③相對(duì)穩(wěn)定的。操作型數(shù)據(jù)庫(kù)中的數(shù)據(jù)通常實(shí)時(shí)更新,數(shù)據(jù)根據(jù)需要及時(shí)發(fā)生變化。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢(xún),一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下將被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢(xún)操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。
④反映歷史變化。操作型數(shù)據(jù)庫(kù)主要關(guān)心當(dāng)前某一個(gè)時(shí)間段內(nèi)的數(shù)據(jù),而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過(guò)去某一時(shí)點(diǎn)(如開(kāi)始應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)的時(shí)點(diǎn))到目前的各個(gè)階段的信息,通過(guò)這些信息,可以對(duì)企業(yè)的發(fā)展歷程和未來(lái)趨勢(shì)做出定量分析和預(yù)測(cè)。
圖2 導(dǎo)出數(shù)據(jù)過(guò)程
根據(jù)以上的特點(diǎn),在數(shù)據(jù)倉(cāng)庫(kù)里,數(shù)據(jù)是在對(duì)不同來(lái)源的數(shù)據(jù)抽取、清理的基礎(chǔ)上經(jīng)過(guò)系統(tǒng)加上、匯總和整理得到的一個(gè)緊密的整體;數(shù)據(jù)所提供的信息是關(guān)于某一特別的主題而不是關(guān)于一個(gè)公司的日常運(yùn)營(yíng),數(shù)據(jù)倉(cāng)庫(kù)在構(gòu)建之初就明確其主題,即確定決策涉及的范圍和所要解決的問(wèn)題。數(shù)據(jù)倉(cāng)庫(kù)中的所有數(shù)據(jù)都由某一個(gè)特別的時(shí)間段來(lái)識(shí)別,數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是相對(duì)穩(wěn)定的,數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)主要供企業(yè)決策分拆之用,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)一般被長(zhǎng)期保留,修改和刪除操作很少,通常只需要定期的加載、刷新,這使得管理人員能獲得一幅關(guān)于商務(wù)的一致的畫(huà)面。
數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)重要作用是為決策者提供必要的智能,促進(jìn)決策者更好的理解商務(wù)危機(jī)、商務(wù)機(jī)會(huì)和運(yùn)營(yíng)狀況。在決策支持過(guò)程中,數(shù)據(jù)倉(cāng)庫(kù)主要有四個(gè)流程:整合、執(zhí)行、智能和創(chuàng)新,如圖3所示。
圖3 數(shù)據(jù)倉(cāng)庫(kù)的四個(gè)流程
(2)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市
數(shù)據(jù)集市(Data Marts)是為了特定的應(yīng)用目的或應(yīng)用范圍,從數(shù)據(jù)倉(cāng)庫(kù)中獨(dú)立出來(lái)的一部分?jǐn)?shù)據(jù),也可稱(chēng)為部門(mén)數(shù)據(jù)或主題數(shù)據(jù),通常服務(wù)于單個(gè)部門(mén)或企業(yè)中的部分用戶(hù)。按照業(yè)務(wù)的不同可以分為財(cái)務(wù)、銷(xiāo)售、市場(chǎng)等多個(gè)數(shù)據(jù)集市,每個(gè)數(shù)據(jù)集市只包含特定領(lǐng)域內(nèi)的數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市的比較如表1所示。
表1 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集市比較
關(guān)于構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市先后順序,有兩種截然不同的學(xué)術(shù)觀點(diǎn),Ralph Kimball認(rèn)為“數(shù)據(jù)倉(cāng)庫(kù)僅僅是構(gòu)成它的數(shù)據(jù)集市的聯(lián)合”,而Inmon認(rèn)為只有在構(gòu)建幾個(gè)單主題區(qū)域之后,集中式的數(shù)據(jù)倉(cāng)庫(kù)才能創(chuàng)建數(shù)據(jù)集市。實(shí)際上,方法的選擇取決于項(xiàng)目的主要商業(yè)驅(qū)動(dòng)。如果該組織正忍受糟糕的數(shù)據(jù)管理和不一致的數(shù)據(jù),或者希望為今后打下良好的基礎(chǔ),那么Inmon的方法就更好一些。
如果該組織迫切需要給用戶(hù)提供信息,那么Kimball的方法將滿(mǎn)足該需求。而一旦滿(mǎn)足了迫切的信息需求后,就應(yīng)該考慮包含獨(dú)立數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)體系結(jié)構(gòu)的轉(zhuǎn)換計(jì)劃。特別需要注意的是個(gè)別部門(mén)要防止濫用Kimball的方法而脫離集中控制。
(3)數(shù)據(jù)抽取、轉(zhuǎn)換、裝載數(shù)據(jù)抽取、轉(zhuǎn)換、裝載上具(Extract Transform.Load.ETL)是數(shù)據(jù)倉(cāng)庫(kù)的重要組成之一,它是把數(shù)據(jù)從不同的操作型數(shù)據(jù)庫(kù)、業(yè)務(wù)部門(mén)和企業(yè)外部數(shù)據(jù)庫(kù)中拿出來(lái),進(jìn)行必要的轉(zhuǎn)化、整理,再以統(tǒng)一定義的格式存放到數(shù)據(jù)倉(cāng)庫(kù)內(nèi)。它首先對(duì)數(shù)據(jù)進(jìn)行篩選,去掉對(duì)決策沒(méi)有意義的數(shù)據(jù)段,然后將數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的數(shù)據(jù)名稱(chēng)和定義,計(jì)算統(tǒng)計(jì)和衍生數(shù)據(jù):估計(jì)遺失數(shù)據(jù)的缺省值。數(shù)據(jù)抽取、轉(zhuǎn)換與裝載過(guò)程的目的在于把來(lái)自各個(gè)不同平臺(tái)的數(shù)據(jù)合并到?jīng)Q策支持環(huán)境下的商務(wù)智能目標(biāo)的數(shù)據(jù)倉(cāng)庫(kù)的標(biāo)準(zhǔn)格式中去。數(shù)據(jù)抽取工具能對(duì)各種不同存儲(chǔ)方式的數(shù)據(jù)訪問(wèn),應(yīng)能生成不同程序、作業(yè)控制語(yǔ)言、腳本和語(yǔ)句等,以訪問(wèn)不同的數(shù)據(jù)。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://m.guhuozai8.cn/
本文標(biāo)題:商務(wù)智能體系介紹——數(shù)據(jù)倉(cāng)庫(kù)相關(guān)理論
本文網(wǎng)址:http://m.guhuozai8.cn/html/consultation/1083932971.html