在大數據森林里能找到黃金,但是大多數公司沒有地圖和隊伍。
TDWI的一個新研究報告,題為《科學數據和大數據,企業的成功路徑》概述了大數據和數據科學的狀況。簡而言之,它變得更大、更困難了。從1到5評分,5表示對當前的數據管理策略“完全滿意”,只有3%的受訪者給出了“5”分。
約43%的人給了中間分,近40%的人給出了1分或2分。
不滿的一部分因為可能僅僅是被收集的數據量。20%的受訪者正試圖處理10-100TB的數據,而17%的人要處理100TB數據甚至超過一個PB的數據。現在大部分的數據是結構化數據,但企業明白需要整合更多不可預測的新輸入數據到可用數據中。Hadoop是大數據平臺的一種選擇,大約30%的受訪者現在企業內使用Hadoop,但是對于那些管理超過10TB數據的公司,有50%的人在使用。
管理的數據類型中,有些比其它增長更迅速。電子郵件中的文本內容、客服中心的記錄,據說增長極其迅速,還有外部社交媒體的文本數據。
雖然大部分的受訪者使用數據科學做出傳統的報表和分析查詢,有穩定的53%的人也使用它做出視覺分析。隨著收集電子郵件中的文本/內容數據、客服中心、和社交媒體的迅速增長,預測分析在迅速上升,可能會創建必要的基礎去更好地了解客戶對新產品的反應或對客戶服務的響應。
公民數據科學家
數據科學家已經存在很長時間了,但是這個角色最近變得更加復雜,因為企業正試圖將大數據資產轉化為真正的價值。在過去,數據科學家曾經是預測建模專業人士,一部分是計算機科學家,一部分是統計學家,一部分是數學家,一部分是業務分析師。
這個角色變化的原因很多,其中之一是“公民數據科學家”時代的到來,這一說法來自TDWI高級分析副總裁和高級研究主任。這些人是“統計探險者”的新一代,他們一般都是自學成才,希望用自助服務工具和數據訪問做出他們需要的決定。做為業務用戶,他們往往沒有正式的統計培訓,但得益于容易使用的分析平臺。
最大的問題:發現大數據價值
大多數公司使用數據科學產生更精確的業務洞察力,然后更好地了解客戶,預測行為,改善業務實踐/流程。即使想要的結果多樣,并沒有一個單一的,可預測的路徑成功使用大數據和數據的科學。根據這份報告,企業需要努力解決一些最大的問題才能看到積極的回報。
根據TDWI稱,最可怕的是培訓缺口。簡單地說,數據科學技能是很難獲得的,現在的需求遠遠大于供給。企業希望得到競爭優勢,就可能會需要將注意力集中在接受內部培訓和自學,以及派遣員工去企業外接受認證講師的培訓。(特別是物聯網,我們報告的另一個挑戰是設備和數據集成)。
幫助員工了解更多關于數據科學的實踐是很重要的,但同樣重要的是教育整個組織,尤其是管理者,知道數據科學是什么。沒有自上而下的對實踐價值的理解和興趣,企業將受困于收集必要的資源,投入那些訓練時間,新的基礎設施,或投資新的分析工具。
為此,許多受訪者報告了成功打造概念的小證據。這些證明使用業務正面臨的實際問題展示數據科學的價值。如果他們能快速回報利益,就更好了。
最佳實踐
報告最后提供了12個提煉數據科學和大數據的最佳實踐。首先是讓數據有序,對那些深入實踐的人來說并不奇怪。建議分階段實現新系統的方法,確保關鍵人員經過必要的培訓才開始一個新的進程。TDWI建議企業使用多個分析方法,預測分析和文本挖掘或圖形分析,利用云計算和新開源技術。
另一個被提到的趨勢是,使用數據平臺和大數據即服務減輕分析大數據的繁重工作。這個話題將在數據平臺2017會議上討論。
鑒于分析大數據固有的挑戰,以及其他的擔心,如害怕他們的工作將被機器學習算法所淘汰,2017年對數據科學來說不會是平凡的一年。但是,對于做法正確的公司,通過教育,合作和敏捷性,他們能迅速拿出概念的證據支持真正的ROI。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.guhuozai8.cn/
本文標題:大數據分析為何如此具有挑戰性?
本文網址:http://m.guhuozai8.cn/html/consultation/10839721441.html