CRM(客戶關系管理)是一個包括知識挖掘、市場規劃、客戶互動、分析與修正而循環不已的過程,其中,知識挖掘過程包括市場確認、客戶區分以及客戶預測。與能帶來利潤的客戶建立持久的合作關系是CRM的核心,在建立這種持久的合作關系中,預測起著舉足輕重的作用。預測方法的選擇不僅與預測對象和目標的性質有關,與可能收集到的數據狀況有關,也與預測的要求和條件有關。選擇合適的挖掘技術和工具,對于未來系統的性能和可靠性有重大影響,不同的技術方案產生的結果模型有很大不同,模型結果的可理解性也存在很大差異。
1 預測模型的選擇因素
在選擇一個預測模型的時候,要考慮許多因素。這些因素包括數據模式、預測目的、預測精度、預測的最遠期限、采用此預測模型所要的費用,以及應用這個預測模型的難易程度等。
1.1 數據模式(即數據的特征)
在選擇一個預測模型的時候,數據模式是一個最主要的因素。對同一種數據模式可以應用幾個不同的預測方法,而不同的預測方法都有各自適應的數據特征。
1.2 預測目的
預測的目的,也就是預測的結果做什么用。
1.3 預測精度
預測精度要考慮3個問題:在確定的環境下,使用某一種典型的預測模型能夠達到多高的精確度;在這個環境下,采用什么樣的方法能夠提高預測精度;如果存在若干種提高預測精度的方法,如何選擇一個適當的方法。
1.4 預測的最遠期限
預測的最遠期限和數據模式有著密切的關系,不同計劃期限的制定,包括不同的數據模式特征。對于不同期限的預測,各種因素的重要程度也是不一樣的。任何一種預測方法的適用性依賴于預測的最遠期限,而且還和預測精度、費用以及其他因素有關。
1.5 預測費用
包括研究和開發模型的費用、數據的收集和儲存費用,及反復應用這個模型的費用。
2 預測模型的數據特點
常用于CRM的預測模型有:回歸預測、決策樹、神經網絡、聚類和最近鄰技術及規則推理,其他的預測模型(方法)還有時間序列分析、遺傳算法、粗糙集理論、模糊理論等,而數據模式是選擇一個預測模型時最主要的因素,因此,下面按定量數據(指用定距或定比尺度來衡量的數據)和非定量數據(用定類或定序尺度來衡量的數據)來進行對模型數據的基本分類,分別對一些預測模型的數據特點進行分析:
2.1 回歸預測
回歸分析的數據是區間尺度(又稱定距尺度),它的預測值是連續的。
2.2 決策樹
決策樹很適合處理非數值型數據,它可以很容易的用于種類字段,但當種類的值較多的時候,效果可能會比較差,如果限制分枝的個數。決策樹的效果還是不錯的。決策樹預測連續屬性值時性能較差;不能分析和時間有關的屬性變量。若用決策樹來進行分類,需要保證數據具有互斥性和完整性。
2.3 神經網絡
可用于分類、預測、估值和聚類,一般適用于結構化數據。當輸入為數值字段時,神經元網絡將所有輸入轉化到0~1之間;當輸入是種類字段時,神經元網絡可以將種類字段轉化成數值字段,但這樣就給種類字段強加了一個先后次序;而當記錄中的字段很多肘。神經元網絡也會受其影響;當有多個依賴變量時神經元網絡是最佳的選擇;同時,神經元網絡對時間順序的數據的處理能力比較好。對非線性、有噪音的復雜數據分析效果良好;能處理規模較大的數據庫;能預測連續數據,分類或聚類離散數據;能處理有噪音或屬性值有缺失的數據。神經網絡特別適合那些模糊、不嚴密、不完整的知識(數據)為特征的,或那些缺少清晰的分析數據的數學算法的問題。
2.4 聚類分析
使用聚類分析時變量可以是連續或分類變量,對每個調查對象的數據應當是完整的。在可能的情況下,盡量避免用替代值填補缺失值,即使這無法避免,也應當意識到這會影響結果,因為這樣所做的實際上是在編造數據。聚類分析中數據結構為數據矩陣和差異度矩陣,數據類型包括區間標度變量(Interval—scaled variables)、二元變量(Binary variables)、標稱型,序數型和比例型變量(Nominal ordinal,,and ratio variables)以及混合類型變量(Variables of mixed types)4種。
2.5 最近鄰技術
適用于非定量數據,能處理分類型數據,數字型數據和字符型數據。
2.6 規則推理
非定量數據,適于處理大型數據。
2.7 時間序列分析
時間序列分析在處理和時間具有相關性的情況時有獨特的優勢,用于處理有序隨機變量或者有序數據,并且觀測值之間不獨立。
2.8 遺傳算法
可用于分類和預測,可以解決非線性、多變量、非連續、非可導空間上的優化問題。在所求問題為非連續、多峰以及有噪音的情況下,遺傳算法的優勢更加明顯,它能以很大的概率收斂到最優解或滿意解,具有較好的全局收斂性。
2.9 模糊集
當精確輸入不可能或太昂貴時,模糊系統就可以作為一種強有力的模型方法。
2.10 粗糙集理論
粗糙集理論是一種研究不完整數據、不確定知識的表達、學習及歸納的數學方法。它為分析不精確數據、推理和挖掘數據問的關系、發現潛在的知識提供了行之有效的工具。它以各種更接近人們對事物的描述方式的定性、定疑或混合信息為輸入,輸入空間和輸出空間是通過簡單的決策表簡化得到的。
3 預測模型的評價
不同的模型有其各自適用的場合,因此在不同的預測問題中要根據具體的情況和模型的特點來選擇預測模型。
如果預測的結果是用于編制計劃或做綜合決策,理論上說,比較理想的辦法是采用多變量預測模型。如果要預測的對象很多,采用單變量的預測方法比較切合實際。
一般情況下。指數平滑方法和自回歸——移動平均方法的預測精度都比較高,指數平滑方法用于短期預測能夠得到良好的效果,能夠達到最大的精確度。自回歸——移動平均方法的算法比較復雜,它的優點是可以從模型中加以選擇,而不必局限于一個特定的模型,缺點是在選擇模型時需要具有比較豐富的經驗和精通這種方法的人。
單變量回歸和多變毯回歸模型的預測期限比指數平滑方法更遠一些,可用于中期預測。它的另一個優點是能夠反映兩個或兩個以上變量之間的相互關系,能夠通過對一個變量的預測立即得到另一個變量的預測值。在建立多變量回歸模型時,采用逐步回歸方法具有良好的結果,它能剔除不重要的因素,從而使回歸模型盡可能地簡單。
計量經濟模型通常用作綜合性預測,它的優點是對任何單一方程的自變量之間的相互關系,可以包括在其他方程式中,它們的數值可以同時確定。根據以上的分析,可以利用層次分析法來進行對預測模型的選擇。層次結構模型見圖1。
圖1 層次結構模型
在實踐中,有時模型間的差別很小,選擇最好的模型,是在模擬條件下對候選模型進行驗證,模擬效果最好的就是最優的模型;在方法上,有時需同時應用幾種方法,如因子分析往往和回歸分析或聚類分析一起使用,聚類分析和判別分析結合使用等。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.guhuozai8.cn/
本文標題:CRM預測模型的評價與選擇