20 世紀末,席卷全球的以互聯網為核心的計算機網絡信息技術迅猛發展,電子商務成為新經濟形式的代表,給企業的經營管理帶來了巨大的沖擊和變化。這意味著又一次產業革命的來臨,人類社會的發展從工業經濟時代進入到電子商務時代。隨著網絡技術的成熟,電子商務大潮正在全球范圍內急速變革著傳統的商業模式,各類電子商務網站風起云涌,不僅提供了一種商家與客戶進行交流的全新的方式,同時為商家提供了豐富的數據資源。21 世紀作為“商務時代”,其特殊性在于“客戶經濟”。企業要在新時代里生存,就要具備吸引和保持客戶的能力。
商務智能是指基于互聯網環境下的商品交易及以商品交易相關的商務活動,同時與人工智能技術,數據挖掘等方面的技術相結合的活動,涉及的領域非常廣泛,其中包括電子支付、安全、信任、法律、廣告、在線購物等。當前,商務智能的真正價值在于企業應用。企業的成本控制是有限的,在生產過剩、市場不足的情況下,企業只有加大市場營銷、銷售和服務等與客戶相關的部門的管理,才能開源。客戶參與及互動合作的新的營銷理念及其運作,要求不論是虛擬型的純電子商務,還是由具備強大基礎結構的傳統商務企業延伸出來的電子商務,都必須能將焦點移回到客戶身上。只有提供客戶個性化且立即解決問題的支持,才能在電子商務時代中創造壓倒性的競爭優勢。企業要想生存,必須盡快抓住這一中心。
那么,如何了解顧客的興趣,掌握客戶需求,以達到增加收入降低成本使企業處于更有利的競爭位置呢? 客戶行為預測和潛在客戶挖掘已成為商務營銷者必須面對和解決的問題。有效地利用數據挖掘技術,從商務網站潛在的海量商業數據中發現商機,提高商家對市場的響應速度和競爭力勢在必行。
1 數據挖掘在商務智能應用中的研究現狀
數據挖掘能帶來顯著的經濟效益,因此在電子商務中應用也越來越廣泛。客戶的行為、消費習慣對于電子商務來說非常重要。在生活中采用數據挖掘的成功的例子很多,例如著名的“尿布與啤酒”的故事。早在 2007 年,Google、Amazon、Yahoo、MSN 等一些公司都要求員工運用挖掘技術來了解客戶行為,并根據挖掘出的信息數據及模式設計更加符合客戶需求的服務和產品。也就是說利用挖掘可以了解客戶行為,其分析的數據結果可提供給企業參考,做出合適的調整策略。目前,國外對于數據挖掘的研究重點逐漸從發現方法轉向系統應用,注重多種發現策略和技術的集成,以及多種學科之間的相互滲透。當前,世界上比較有影響的典型數據挖掘系統有 Cover Story,EXPLORA,Knowledge Discovery,Workbench,DB Miner,Quest 等。在應用方面包括:KDD 商業軟件工具不斷產生和完善,注重建立解決問題的整體系統,而不是孤立的過程。用戶主要集中在大型銀行、保險公司、電信公司和銷售業。國外很多計算機公司非常注重數據挖掘的開發應用,比如 IBM 和微軟成立了相應的研究中心進行這方面的工作。
國內從事數據挖掘研究的人員主要在大學,也有研究所和公司在從事這方面的研究,這些工作一般集中于學習算法和有關數據挖掘理論方面的研究。在具體應用方面,中科院計算所智能處理開放實驗室的史忠植等人設計了一個數據挖掘工具 MSMiner,使用決策樹算法為廣東地稅提供納稅人異常情況檢測; 復旦德門公司開發的“天眼”數據挖掘工具集 D miner 集成了多種數據挖掘算法,取得了較好的挖掘效果。
2 數據挖掘技術在商務智能中的應用
2.1 數據挖掘在商務智能 CRM 中的應用
CRM( Customer Relationship Management) ,即客戶關系管理。這個概念最初由 Gartner Group 提出來,而在最近開始在企業電子商務中流行。CRM 的主要含義就是通過對客戶詳細資料的深入分析,來提高客戶滿意程度,從而提高企業的競爭力的一種手段,它主要包含以下 7 個主要方面( 簡稱 7P) : 客戶概分析( Profiling) 、客戶忠誠度分析( Persistency) 、客戶利潤分析 ( Profitability ) 、客戶性能分析( Performance) 、客戶未來分析( Prospecting) 、客戶產品分析( Product) 、客戶促銷分析( Promotion) 。
目前在 CRM 中進行有效數據挖掘的應用及研究主要集中在以下幾個方面:
1) 通用且合理的 CRM 系統體系結構的研究。主要考慮應用對象、應用目標、企業規模等等實際問題;
2) 數據挖掘與數據庫、數據倉庫的有機結合;
3) CPJI 中的復雜數據挖掘模型的研究。這方面主要集中在挖掘的知識類型、多個抽象層的交互知識挖掘算法的研究;
4) 數據的研究。這方面主要包括數據庫類型的多樣性問題、復雜數據類型的處理、噪聲數據和缺失數據的處理,以及異種數據庫和 Web 上的數據挖掘等;
5) 與用戶交互的研究。這方面主要研究數據挖掘結果的可視化和可理解性,領域知識的運用等。數據挖掘是從海量數據中挖掘出有用的信息和知識的過程,它在 CRM 中的應用主要表現在對客戶信息的分析和處理上,它能從表層數據中挖掘出蘊含的深層的知識。正是基于這一點,許多 CRM 的解決方案中越來越重視數據挖掘在其中的應用。
2.2 需要數據挖掘處理的客戶行為數據源
電子商務網站客戶進行數據挖掘時,所需要的數據主要來自于兩個方面: 一方面是客戶的資料,包括客戶的背景信息和客戶以往的交易數據,這部分信息主要來源于客戶的登記信息; 另外一部分數據主要來自于客戶瀏覽時的點擊流,這部分數據主要用于考查客戶的行為表現,主要來源于服務器數據。
2.2.1 服務器數據
服務器數據可以分為 Web 日志文件和查詢數據。
1) Web 日志文件。登陸電子商務網站的客戶只要他們鏈接到網站的服務器上,提供 Web 服務的服務器會自動生成訪問日志信息�?蛻粼L問任意一個頁面,Web 服務器的日志記錄中就會增加一條相關信息。隨著網絡技術的高速發展和時間積累,Web 服務器中所記錄的日志文件必將越來越大,所包含的網站客戶訪問信息也會越來越多。
2) 查詢數據。電子商務網站的查詢數據是指客戶在商務網站上查詢自己想要查詢的信息時在Web 服務器端產生的數據。例如,客戶會搜索一些自己喜歡的商品或某些關注的廣告,這些查詢信息就會通過商品或者廣告的登記信息連接到服務器的訪問日志上。
2.2.2 客戶登記信息
在數據挖掘中,客戶登記信息必須和訪問日志集成,才能提高數據挖掘的準確度,更進一步地了解客戶特征。通常我們要求在電子商務網站的訪問者成為客戶之前就開始跟蹤他們。通過網絡站點就能實現這一點,每當第一次看到一個訪客就發送一個cookie 和啟動一個匿名簡檔以記住訪客作了什么,當該訪客回來( 使用同一瀏覽器) 的時候,該 cookie被識別,簡檔被更新。當該訪客最終變成客戶或者是成為注冊用戶時,將導致轉變得那些活動加入該客戶的歷史行為記錄。
2.3 數據挖掘客戶行為的過程
電子商務客戶行為數據挖掘過程可以細分為確定業務對象、數據的搜集和抽取、數據預處理、挖掘模型的構建、數據挖掘、結果分析、使用結果。
2.3.1 定義問題
數據挖掘的結果往往是不可預測的,但是要探索的問題應該是有預見性的、有明確目標的。為了數據挖掘而挖掘數據帶有盲目性,往往是不會成功的。在確定業務對象時,要確定這樣一些問題: 從何處入手,需要挖掘什么數據,要用多少數據,數據挖掘要進行到什么程度。
2.3.2 數據的搜集和抽取
一旦問題定義完畢,就要進行相關數據的搜集。對于電子商務客戶數據挖掘,數據的主要來源是服務器數據和客戶的登記信息。電子商務網站每天都可能有上百萬次的在線交易,生成海量的日志文件和登記表。這些海量的數據就構成了電子商務數據挖掘的數據源。數據抽取的目的是辨別出需要分析的數據集和,縮小處理范圍,提高數據挖掘的質量。
2.3.3 數據的預處理
數據預處理是對數據進行清洗,解決數據中的缺值、冗余、數據值的不一致性等問題,以供數據挖掘階段使用。這是電子商務數據挖掘最關鍵的階段。數據預處理的一個主要任務就是要將客戶訪問網站留下的原始日志整理成事物數據庫,以供數據挖掘階段使用。
2.3.4 挖掘模型的構建
將數據轉化成一個分析模型,這個分析模型時針對挖掘算法建立的。建立一個真正的適合挖掘算法的分析模型,是數據挖掘成功的關鍵了。所建模型的目標就是要反應客戶群中各個年齡段對某種商品的反應的各種相關因素。模型建立后,需要從模型的準確性、可理解性和性能方面進行考察。
2.3.5 數據挖掘
選擇合適的算法進行數據挖掘,從而從海量的數據中得出有效的、新穎的、潛在的、有用的及最終可以理解的信息和知識。電子商務數據挖掘常用關聯規則、序列模式、分類和聚類等技術。
2.3.6 結果分析
當數據挖掘出結果后,要對挖掘結果進行解釋并且評估。數據的可視化問題是數據挖掘中一個重要的組成部分,他把挖掘到的信息組成和提供成為易于作決策的表達方式�?梢哉f,沒有提供良好的數據可視化的數據挖掘系統,不是一個完善的系統。用戶對數據挖掘結果進行評估,如果滿意則挖掘過程結束,否則,則可以重新提出挖掘要求,再重新進行挖掘。
2.3.7 使用結果
一旦當達到了數據挖掘的最后一步,就可以應用基于所發現的模式決策了�?梢岳猛诰虻玫降闹R在管理決策分析中得到應用,提高企業的競爭力。
3 商務智能中的數據挖掘技術
數據挖掘的技術基礎是人工智能。但它僅僅利用了人工智能中一些已經成熟的算法和技術,如: 人工神經網絡、遺傳算法、決策數、鄰近搜索方法; 規則
準理、模糊邏輯等,其問題的復雜性和難度比人工智能要低很多。進行電子商務的數據挖掘,主要是針對客戶訪問信息、客戶交易信息等客戶行為信息進行挖掘,得到客戶的訪問模式和行為模式,從而找到有用的市場信息,提供有針對性、個性化的服務。數據挖掘系統利用的技術越多,精確度就高。但無論采用哪幾種技術來完成任務,從功能上包括以下 4種。
3.1 關聯分析
關聯分析的目的就是為了挖掘出隱藏在數據間的關聯規則。在電子商務中關聯分析也就是找到客戶對網站上各種文件之間訪問的相互聯系,找出客戶購買行為的各種關聯。進行Web上的數據挖掘,構建關聯模型,可以更好的組織站點,減少用戶過濾信息的負擔,可以根據客戶當前的購買行為給客戶提供推薦。
3.2 序列模式分析
序列模式分析的側重點在于分析數據間的前后或者因果關系。就是在實踐有序的事物集中,找到哪些“一些項跟隨另一些項”的內部事務模式。對電子商務數據挖掘而言,序列模式分析是很重要的分析方法,因為 Web 日志數據是根據用戶的訪問時間來記錄的,經過數據凈化和處理后,使一個間斷的時間序列; 而且,商品交易數據也是時間序列數據。關聯分析中采用的 Apriori 特性也可以用于序列模式的挖掘,因為若長度為 K 的序列模式是非頻繁的,其超集( 長度為 k +1) 不可能是頻繁。因此,即使參數設和約束條件有所不同,序列模式分析的大部分算法仍然是類 Apriori 算法的變形算法。
3.3 分類分析
分類分析可以挖掘默寫共同的特性。這個特點可以用來對新添加到數據庫里的數據項進行分類。在數據挖掘中,分類計數可以根據訪問這些用戶而得到的個人信息或共同的訪問模式得出訪問某一服務器文件的用戶特征。另外,通過用戶的注冊表、在線調查表也可以得到用戶的一些特性。按照各種算法的技術特點,可以將分類分析分成決策樹類分類、貝葉斯類分類、基于關聯規則分類以及利用數據庫技術分類等幾類算法。
在電子商務中通過分類分析,得到客戶分類模式后,知道各類客戶的特點、愛好,那么就可以針對不同類客戶的特點展開不同的商務活動,提供有針對性地人性化的信息服務; 得到客戶的分類模式后,可以對新的客戶進行分析,發現新的客戶屬于那一個類別,從而有針對性地開展商務活動。
3.4 聚類分析
聚類分析用于把有相似特性的用戶、數據項集合到一起,并用顯式或者隱式的方法描述不同的類別。電子商務數據挖掘用聚類技術可以把具有相似瀏覽模式的用戶集中起來。
1) 利用數據挖掘技術,通過挖掘 Web 服務器中用戶的訪問日志,對網絡用戶進行聚類,發掘出具有相似的訪問興趣的網絡用戶,網站的設計者根據聚類的結果,可以更好的理解用戶的需求,重新調整網站的頁面結構,從而為用戶提供方便、優質的服務。還可以利用聚類分析進行網頁聚類,調整網頁結構。
2) 利用數據挖掘技術挖掘客戶資料,將具有相似愛好的客戶分配到相同的族中,聚類產生以后,根據族中其他客戶對某商品的評價就可以得到該客戶對該商品的評價,就可以同客戶推薦他可能感興趣的商品。
3) 分類分析和聚類分析的綜合應用。分類分析法和聚類分析法是互逆的過程。例如在最初的分析中,分析人員根據以往的經驗要分析的數據進行鑒定、劃分類別,然后,該分析人員用分類分析法分析該數據集合,得到每個類別的描述,接著把這些描述作為新的分類規則重新對這個集合( 拋棄原來的劃分結果) 進行劃分,一次獲得更好的分類結果。這樣分析人員可以循環使用這兩種分析法直到得到滿意的結果。在電子商務中,由于客戶登記的資料往往不完整,不可能正確劃分客戶的類型,綜合運用兩種方法更有實際的意義。
4 結束語
目前,對商務智能系統的研究主要集中于對Web 日志的挖掘,比較成功的技術是協同過濾技術,而將關聯規則、聚類、分類等數據挖掘技術用于商務推薦系統才剛剛開始。分析客戶訪問電子商務網站的瀏覽和購買等行為,從行為數據的采集與儲存,數據挖掘算法的改進及復合補充挖掘三個方面來找到一個適合小型電子商務網站的適時挖掘系統,從而實現掌握客戶行為規律,為推薦等工作提供依據。
在以后的研究工作中,對目前比較先進的大型數據庫進行研究,數據的集成、清洗還有待進一步研究,數據的建立模型還有待進一步完善,目前各種數據理還較為繁瑣,適應性較低。研究解決大型商務網站的海量客戶行為數據的采集和存儲問題的方案。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.guhuozai8.cn/
本文標題:商務智能系統中客戶行為數據挖掘研究綜述
本文網址:http://m.guhuozai8.cn/html/consultation/10839315720.html