0 引言
隨著企業(yè)信息化建設(shè)的加強(qiáng),MES在企業(yè)生產(chǎn)信息化建設(shè)中的作用越來越重要.MES系統(tǒng)中的數(shù)據(jù)挖掘主要針對于過程監(jiān)控中的大量生產(chǎn)的日志數(shù)據(jù).通過這些數(shù)據(jù)分析,對生產(chǎn)過程中的數(shù)據(jù)變化進(jìn)行實時監(jiān)測,以此來得到生產(chǎn)狀態(tài)而進(jìn)行結(jié)果判別.
國際MES協(xié)會對MES定義為“一個提供信息的系統(tǒng),以優(yōu)化從定單到成品的生產(chǎn)活動.使用當(dāng)前的和精確的實時數(shù)據(jù),MES指導(dǎo)廠級活動,并對發(fā)生的活動進(jìn)行響應(yīng)和匯報,形成對變化條件的迅速響應(yīng),并專注于減少無價值的活動,從而驅(qū)動有效的廠級操作和過程”.
生產(chǎn)過程是一個復(fù)雜的而且具有周期的多樣性的過程,采用傳統(tǒng)的數(shù)據(jù)分析方法,很難進(jìn)行建模和處理.粗糙集(RoughSet,RS)就是一種新型的數(shù)據(jù)處理的軟計算方法,它甚至不需要數(shù)據(jù)的任何檢驗或者附加的信息(比如數(shù)學(xué)統(tǒng)計上的概率分布,模糊集理論中的模糊度劃分,神經(jīng)網(wǎng)絡(luò)中一定數(shù)量的訓(xùn)練樣本等),而是直接從已知數(shù)據(jù)的初始狀態(tài)系統(tǒng)出發(fā),通過不可分辨關(guān)系和不可分辨類確定給定問題的近似解,從而有效地進(jìn)行分析和處理不精確、不完整的信息,并有效地進(jìn)行屬性約簡并進(jìn)行正確的動態(tài)調(diào)度.
1 基于粗糙集的數(shù)據(jù)挖掘算法
粗糙集的方法和模型建立在一種直觀的二維表的基礎(chǔ)上,所以可以采用知識表示系統(tǒng)和決策系統(tǒng)對問題進(jìn)行描述.由于互信息方法在精度等方面的有可能表現(xiàn)不足,我們可以通過引入粗糙集,得出一種基于關(guān)系積理論和知識表示的屬性約簡算法,從而提出一個適用于海量文本數(shù)據(jù)集的特征選擇方式.利用此方法來進(jìn)行互信息特征初選,利用屬性約簡算法來消除冗余,獲得具有代表性的特征詞.結(jié)果表明,該性約簡算法方法能獲得冗余度小且具有代表性的特征子集.使用關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中一種重要的方法,最開始是由R.Agrawal等人在1993年提出的,主要用于發(fā)現(xiàn)事務(wù)數(shù)據(jù)庫中不同商品之間的聯(lián)系,從而找出顧客購買行為模式等行為.此算法的核心就是Apriori算法,即基于兩階段大項集思想的方法,將關(guān)聯(lián)規(guī)則用于數(shù)據(jù)挖掘算法的設(shè)計可以分解為兩個子問題:
(1)找出所有支持度中大于最小支持度的項集(Itemset),并把這些項集稱為大項集(Large Itemset).
(2)使用第1步找到的大項集產(chǎn)生相應(yīng)的關(guān)聯(lián)規(guī)則.
從關(guān)聯(lián)規(guī)則的支持度和置信度出發(fā),那么在事務(wù)數(shù)據(jù)庫中就存在無窮多的關(guān)聯(lián)規(guī)則和置信度.人們一般只對滿足一定的支持度和置信度的關(guān)聯(lián)規(guī)則非常關(guān)注.科學(xué)論文中,一般稱滿足一定要求的(如大的支持度和置信度)的關(guān)聯(lián)規(guī)則為強(qiáng)規(guī)則.所以,為了找到有意義的關(guān)聯(lián)規(guī)則,需要給定兩個數(shù)據(jù):最小支持度和最小置信度.前者稱為用戶規(guī)定的關(guān)聯(lián)規(guī)則必須滿足的最小支持度,它表示了一組物品集在統(tǒng)計意義上的最低程度;后者即用戶規(guī)定的關(guān)聯(lián)規(guī)則必須要滿足的最小置信度,它直接反應(yīng)了關(guān)聯(lián)規(guī)則的最低可靠度.
2 數(shù)據(jù)挖掘算法在MES系統(tǒng)中研究與應(yīng)用
生產(chǎn)執(zhí)行過程中的數(shù)據(jù)挖掘算法是一種新技術(shù),新方法,所以還沒有形成完整的理論體系,它的應(yīng)用都是針對具體問題展開研究,其廣度和深度需要進(jìn)一步拓展.
在生產(chǎn)過程中,計算機(jī)系統(tǒng)記錄和保存的數(shù)據(jù)是時間上連續(xù)變化的數(shù)據(jù)經(jīng)采樣、量化得到.它在本質(zhì)上是連續(xù)的,變化過程受生產(chǎn)狀態(tài)約束;其次,生產(chǎn)過程中的行為、特性等元素是由許多過程變量共同決定的,而且任何一個變量的變化都影響其它變量以及生產(chǎn)狀態(tài)的變化,所以在空間上,生產(chǎn)過程數(shù)據(jù)和變量具有高維數(shù)、強(qiáng)關(guān)聯(lián)和非線性等特點.但是與一般商業(yè)上的數(shù)據(jù)不同存在區(qū)別,比如零售業(yè)數(shù)據(jù)庫中的的數(shù)據(jù)是關(guān)于商品的名稱和數(shù)量的數(shù)據(jù),這些數(shù)據(jù)在本質(zhì)上是分散的,而且在時間域無約束,在空間域的特點也不同于生產(chǎn)過程數(shù)據(jù),所以數(shù)據(jù)特點不同,采用的挖掘算法不同,特征提取的方法也不同.
預(yù)測在數(shù)據(jù)挖掘算法中具有重要應(yīng)用領(lǐng)域,對生產(chǎn)過程有著重要的指導(dǎo)意義.在預(yù)測研究方法中,確定關(guān)鍵因子是非常重要的一環(huán),以前的預(yù)測方法所涉及因子比較少,所以它的結(jié)論具有一定的局限性.?dāng)?shù)據(jù)挖掘算法的優(yōu)點就是從海量數(shù)據(jù)中找到潛在有用且有關(guān)聯(lián)的信息.
由于各種干擾,生產(chǎn)過程數(shù)據(jù)中含有大量的噪聲和雜質(zhì);生產(chǎn)過程中存在大量的不確定性和機(jī)動性,造成生產(chǎn)數(shù)據(jù)也存在大量的不確定性.因為數(shù)據(jù)中的噪聲影響算法的有效性和結(jié)論的可靠性,所以給數(shù)據(jù)中的不確定性給知識提取帶來了困難.生產(chǎn)過程不同的部分其特性不同,要求也不一樣,因此對不同部分變量的采樣使用不同的采樣頻率,這使得過程變量具有多標(biāo)度特點.
本文根據(jù)生產(chǎn)執(zhí)行的全過程,結(jié)合粗糙集的屬性約簡改進(jìn)了Apriori算法,從而使它適合生產(chǎn)過程中的知識發(fā)現(xiàn)和數(shù)據(jù)挖掘.算法Apriori-MES的詳細(xì)流程如圖1所示.
圖1 Apriori MES流程圖
3 結(jié)束語
本文針對MES系統(tǒng)的特點,運用先前提出的一套Apriori—MES算法,并且將此算法在實際的數(shù)據(jù)挖掘系統(tǒng)中得到了實現(xiàn),但是MES系統(tǒng)中尚待研究的問題還有很多,主要有:
(1)從尋求數(shù)據(jù)挖掘過程中的可視化方法出發(fā),使知識發(fā)現(xiàn)的過程能夠被用戶認(rèn)識,也便于在知識發(fā)現(xiàn)的過程中進(jìn)行人機(jī)交互和應(yīng)用,以及能夠反應(yīng)不同生產(chǎn)工序之間關(guān)系的圖形顯示.
(2)生產(chǎn)過程中不同的過程造成不同的特性,要求也會一樣,因此對不同部分變量的采樣使用了不同的采樣頻率,這使得過程變量具有多標(biāo)度的特點,目前的數(shù)據(jù)挖掘算法還不能處理這類數(shù)據(jù).
(3)將KDD技術(shù)與在線分析處理(OLAP)技術(shù)、數(shù)據(jù)查詢有機(jī)的相結(jié)合,因為用戶使用數(shù)據(jù)挖掘系統(tǒng)時,他們的要求具有不確定性,數(shù)據(jù)查詢可以提供給用戶一個簡單的,靈活多變的分析數(shù)據(jù)庫結(jié)構(gòu)和數(shù)據(jù)簡單特征的工具.
(4)在實際應(yīng)用中,許多算法不能有效的工作是因為巨大的數(shù)據(jù)量.一個有效的算法必須能存儲這樣巨大的數(shù)據(jù),算法運算的時間必須是合理的。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://m.guhuozai8.cn/
本文標(biāo)題:基于粗糙集的數(shù)據(jù)挖掘算法在MES/ERP系統(tǒng)的研究與應(yīng)用
本文網(wǎng)址:http://m.guhuozai8.cn/html/consultation/10820211554.html