商業(yè)智能(BI)大家可能早已耳熟能詳。從早期的報(bào)表自動(dòng)化,到現(xiàn)在的復(fù)雜靈活分析,多平臺(tái)支持,優(yōu)秀的人機(jī)互動(dòng),多數(shù)據(jù)抽取,大數(shù)據(jù)整合,甚至和當(dāng)下最火的人工智能都有結(jié)合點(diǎn)。可能一提到BI,大家都會(huì)自然而然地把這個(gè)話題丟給IT。但是由IT主導(dǎo)的BI項(xiàng)目最終是否能夠落地?
為什么以技術(shù)為主導(dǎo)的IT部門(mén)做不好BI項(xiàng)目?
首先我認(rèn)為BI是最直接,最重要地服務(wù)于商業(yè)決策者的,尤其是管理層。BI應(yīng)用是否符合用戶習(xí)慣,數(shù)據(jù)是否準(zhǔn)確及時(shí),是BI能否活下來(lái)的關(guān)鍵之關(guān)鍵。試想一個(gè)難以操作,擠滿了圖表,而且錯(cuò)誤百出的BI應(yīng)用,哪個(gè)經(jīng)理會(huì)有興趣去使用它?一旦失去存在的價(jià)值(credibility),被拋棄就成了自然而然的事情。
其次國(guó)內(nèi)的IT人員普遍熱衷于技術(shù)而忽略業(yè)務(wù),對(duì)于很多開(kāi)發(fā)人員來(lái)說(shuō),看InfoQ的興趣要遠(yuǎn)大于CEO年終總結(jié)里的數(shù)字。由于業(yè)務(wù)知識(shí)和經(jīng)驗(yàn)的缺失,很多時(shí)候IT閉門(mén)造車(chē)搞出來(lái)的BI應(yīng)用根本不是業(yè)務(wù)人員需要的。慢慢地雙方的激情消退,抵觸情緒滋長(zhǎng),失敗是早晚的事。
另外很多IT部門(mén)現(xiàn)在還停留在維護(hù)傳統(tǒng)大型項(xiàng)目的框架里。當(dāng)今的商業(yè)瞬息萬(wàn)變,與之配對(duì)的決策系統(tǒng)也應(yīng)該具備靈活變化的能力。我相信很多商業(yè)決策者經(jīng)歷過(guò)類(lèi)似的痛苦,例如從提出某個(gè)報(bào)表的修改意見(jiàn)到正式上線往往要等很長(zhǎng)時(shí)間。但這不能完全怪IT,因?yàn)樗麄冃枰獙徟@取權(quán)限,收集數(shù)據(jù),測(cè)試,寫(xiě)文檔...。所以一個(gè)小的修改可能要在6個(gè)月后release里才能實(shí)現(xiàn)。轉(zhuǎn)型需要時(shí)間,但作為重要的決策者,您會(huì)等嗎?
站在商業(yè)和IT之間,BI主要包含了什么?
國(guó)外很多大牛都定義過(guò)BI的框架。在此,我只是根據(jù)前人的經(jīng)驗(yàn)和一些國(guó)內(nèi)項(xiàng)目的經(jīng)歷總結(jié)出自己的內(nèi)容。從下往上,我的BI各元素框架(BI Component Framework)主要分為3個(gè)部分:基礎(chǔ)部分(Foundation),實(shí)現(xiàn)部分(Enablement),和輔助部分:
圖1 BI元素框架
BI框架之基礎(chǔ)部分(Foundation)
從業(yè)務(wù)層面來(lái)講整個(gè)框架的根基應(yīng)該是商業(yè)或者管理層的“覺(jué)醒”和授權(quán)。很多公司現(xiàn)在還依賴于excel報(bào)表。業(yè)務(wù)部門(mén)習(xí)慣于從excel中生成圖表,粘貼到PPT里,然后把周報(bào),月報(bào),或者年報(bào)呈現(xiàn)給管理層。這樣做會(huì)面臨幾個(gè)主要的問(wèn)題:首先是數(shù)據(jù)的準(zhǔn)確性。Excel報(bào)表肯定難以避免手工錯(cuò)誤,而且在充滿大量的 vLookup 或者公式的excel里找出錯(cuò)誤是十分痛苦和低效的。其次是資源壓力。越復(fù)雜的報(bào)告所需要的數(shù)據(jù)和人力越多。期限前集體趕報(bào)告的經(jīng)歷很多人應(yīng)該都有吧。再次是時(shí)效性。商業(yè)決策講究的是快速靈活。有些報(bào)告,例如公司年報(bào)確實(shí)不要求實(shí)時(shí),但是很多底層的業(yè)務(wù)決策是不能等到周末或者月末才能開(kāi)始制定的。最后是安全性。數(shù)據(jù)和分析結(jié)果全都在excel或PPT里。IT部門(mén)可以限制email,封鎖網(wǎng)盤(pán),但是直接考取那?面對(duì)這些問(wèn)題,管理層必須思考是否需要一個(gè)完備的BI系統(tǒng)。
BI應(yīng)用的靈魂來(lái)自于數(shù)據(jù)。數(shù)據(jù)就好似血液一樣支撐著整個(gè)BI系統(tǒng)。但很多時(shí)候公司的數(shù)據(jù)是最為敏感的,例如供應(yīng)商數(shù)據(jù)或財(cái)務(wù)數(shù)據(jù)。此外一些部門(mén)會(huì)把數(shù)據(jù)當(dāng)成“私有財(cái)產(chǎn)”而拒絕或者有限度地與其他部門(mén)分享。單純的BI實(shí)施團(tuán)隊(duì)(不管是IT主導(dǎo)還是業(yè)務(wù)主導(dǎo)),在沒(méi)有高層甚至頂層授權(quán)的情況下很難持續(xù)地推動(dòng)BI項(xiàng)目。因此管理層的“覺(jué)醒”和授權(quán)是我認(rèn)為完成一個(gè)BI項(xiàng)目最優(yōu)先,最重要的基礎(chǔ)。
接下來(lái)是了解公司業(yè)務(wù)。前面已經(jīng)說(shuō)過(guò)了,IT部門(mén)通常精于前沿的技術(shù)而忽略業(yè)務(wù),但是BI作為業(yè)務(wù)部門(mén)最直接的決策工具,失去了業(yè)務(wù)的支撐就好比給一個(gè)厭食癥患者做了一桌子滿漢全席。業(yè)務(wù)的構(gòu)成有很多,例如公司有哪些KPI,各個(gè)部門(mén)的核心業(yè)務(wù)是什么,報(bào)告流程是什么,瓶頸在哪里,業(yè)務(wù)流程都需要哪些職能,是否需要內(nèi)外合作等等。對(duì)于業(yè)務(wù)的理解,IT技術(shù)人員容易習(xí)慣性地用用例圖(use case)或者系統(tǒng)架構(gòu)圖(system architecture)來(lái)表達(dá)。但是問(wèn)一下哪一個(gè)經(jīng)理或者業(yè)務(wù)員能一下子看懂那些圓圓圈圈代表的意思?在這里我的經(jīng)驗(yàn)是用最傳統(tǒng)的流程圖和excel列表,因?yàn)榇蟛糠址荌T人員基本不需要工程培訓(xùn)就可以輕松的理解你要表達(dá)的意思。
了解公司的系統(tǒng)和數(shù)據(jù)是重點(diǎn)。現(xiàn)在只有極罕見(jiàn)的公司還僅使用office或者手工作業(yè),基本上大家都多多少少有些系統(tǒng),一些大的公司甚至?xí)像R全套的ERP,sales force,CRM等。對(duì)BI團(tuán)隊(duì)來(lái)說(shuō),系統(tǒng)本身的迭代,之間的接口,承載能力,權(quán)限設(shè)置,技術(shù)特點(diǎn)等都是需要了解的。數(shù)據(jù)分析則需要更多的精力。從范圍來(lái)說(shuō)除了分析系統(tǒng)內(nèi)已有的數(shù)據(jù),BI團(tuán)隊(duì)還要了解手工生成的數(shù)據(jù),例如excel報(bào)表。從屬性來(lái)說(shuō)要分析數(shù)據(jù)的歷史情況,數(shù)據(jù)的完整性,數(shù)據(jù)質(zhì)量,數(shù)據(jù)層級(jí)(hierarchy),數(shù)據(jù)從屬,維度變化(包含緩慢變化維的情況)等等。根據(jù)目前的經(jīng)驗(yàn),我遇到的數(shù)據(jù)分析最大的痛點(diǎn):一是數(shù)據(jù)質(zhì)量,尤其是歷史數(shù)據(jù)。很多業(yè)務(wù)部門(mén),尤其是缺乏控制的部門(mén),其數(shù)據(jù)都是五花八門(mén)的。在清洗的時(shí)候會(huì)遇到各種問(wèn)題。二是數(shù)據(jù)定義。很多公司沒(méi)有主數(shù)據(jù)系統(tǒng),或者根本不遵循主數(shù)據(jù)。同樣一個(gè)主體,這個(gè)部門(mén)或系統(tǒng)定義這個(gè)code,另一個(gè)部門(mén)或系統(tǒng)使用別的code。在數(shù)據(jù)需要聯(lián)通的時(shí)候我們需要耗費(fèi)大量的時(shí)間去協(xié)調(diào)和校對(duì)。
分析完公司的業(yè)務(wù),系統(tǒng)和數(shù)據(jù)之后真正的難點(diǎn)來(lái)了:整合。之前的分析都可以是獨(dú)立的,但是在這里我們必須在熟知公司業(yè)務(wù)和數(shù)據(jù)的情況下把所有信息整合在一起。例如我們要知道在每一個(gè)流程里數(shù)據(jù)進(jìn)口在哪里,出口在哪里,誰(shuí)生成數(shù)據(jù),誰(shuí)更新數(shù)據(jù),誰(shuí)使用數(shù)據(jù),怎么使用的,同樣的數(shù)據(jù)是否被重復(fù)定義或多次使用,主數(shù)據(jù)是什么,數(shù)據(jù)屬性又是什么等。我認(rèn)為這個(gè)時(shí)候BI團(tuán)隊(duì)還是要更多的和業(yè)務(wù)部門(mén)坐在一起,交流的方式還是以流程圖為主,只不過(guò)更加復(fù)雜,例如加入數(shù)據(jù)流和不同的人物信息。描述數(shù)據(jù)情況的時(shí)候則不拘于形式,但要把現(xiàn)狀和問(wèn)題說(shuō)明白,千萬(wàn)不可以隱藏,否則將來(lái)的BI系統(tǒng)一定是垃圾進(jìn),垃圾出(rubbish in,rubbish out)。
在以上元素都介紹完之后,我們終于可以和IT坐下來(lái)談?wù)劯星椋槺懔囊幌聰?shù)據(jù)存儲(chǔ),建模以及BI工具的實(shí)施了。
數(shù)據(jù)不會(huì)像水一樣從源頭直接流進(jìn)BI系統(tǒng)。通常我們需要通過(guò)一個(gè)叫做ETL(技術(shù)術(shù)語(yǔ),全拼是Extraction,Transformation,Loading)的流程來(lái)把數(shù)據(jù)從源頭抓取到BI的數(shù)據(jù)倉(cāng)庫(kù)(data warehouse)。除了業(yè)務(wù)部門(mén)的終端系統(tǒng)和數(shù)據(jù)之外還有各種介于“中間層”的輔助數(shù)據(jù),例如主數(shù)據(jù),也要通過(guò)ETL流程把它們保存到BI倉(cāng)庫(kù)里。不同的IT部門(mén)會(huì)使用不同的技術(shù)來(lái)實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù),例如MySQL,微軟的SQL,或者云端的數(shù)據(jù)庫(kù)技術(shù)等等。
BI建模和普通的數(shù)據(jù)庫(kù)建模有很大區(qū)別。一般系統(tǒng)數(shù)據(jù)庫(kù)建模更多的是考慮數(shù)據(jù)存儲(chǔ),而B(niǎo)I本身只消費(fèi)數(shù)據(jù),其模型主要是為了服務(wù)將來(lái)的報(bào)表和分析。因此負(fù)責(zé)BI建模的架構(gòu)師除了能夠駕馭兩種數(shù)據(jù)庫(kù)的思維之外,還要有很強(qiáng)的技術(shù)能力和業(yè)務(wù)理解力。好的模型除了能針對(duì)不同的業(yè)務(wù)需求做出快速反應(yīng)之外,還要有足夠的拓展性以防備未來(lái)的業(yè)務(wù)變更或者新需求。因此好的數(shù)據(jù)建模師特別值錢(qián)。
有了BI所依賴的數(shù)據(jù)倉(cāng)庫(kù)和模型之后,我們可以開(kāi)始用BI工具來(lái)開(kāi)發(fā)對(duì)業(yè)務(wù)用戶有意義的信息和應(yīng)用。別忘了到目前為止大多數(shù)業(yè)務(wù)部門(mén)和管理層是不知道或者看不懂BI團(tuán)隊(duì)在干什么的,直到我們?cè)谄聊簧习驯砀窕蛘邎D形做出來(lái)。BI工具有很多種,例如傳統(tǒng)的SAP,IBM,Oracle等提供的重型BI工具,也包括時(shí)下流行的新型工具,例如QlikView,Tableau,PowerBI還有帆軟公司的FineBI等等。當(dāng)然一些大公司也可以使用自己開(kāi)發(fā)的BI工具。
當(dāng)數(shù)據(jù)、模型和工具都敲定之后,之后就可以開(kāi)始真正的BI實(shí)施了。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://m.guhuozai8.cn/
本文標(biāo)題:一文讀懂商業(yè)智能(BI):企業(yè)數(shù)據(jù)分析的中樞