最近和幾位朋友談到同一個問題:從數據中獲得知識。有人談起,他們準備做工業大腦,大量應用機器學習。對這種做法的成效,我表示了擔憂。
人們很早就知道,可以從工業數據中獲得知識。但是,現實卻往往并不理想。一個重要的原因是:與數據分析師相比,工業人往往并不缺乏專業知識。所以,數據分析師看到的相關性,或者是假象、或者是工業人老早就了解的知識,很少增加新知識。所以,數據分析的實際作用,往往定位在比經驗更準一點。其實,“更準一點”也不容易做到:因為工業現場數據的質量往往不理想,分析結果常常存在“有偏估計”。
從數據中難以得到新知識,還有一個原因:工業過程和工業對象都是人造的。在正常的情況下,往往反映的就是人類已知的知識。容易發現新知識的數據,往往是那些有點“異常”的數據。正常生產的數據雖然很多,卻不容易蘊含新知識。這有點像人的創新:善于創新的人,往往是那些想到“盒子之外”的人。
但是,異常數據也不一定產生知識。在多數情況下,異常數據往往是數據的采集或收集過程出了問題。對數據分析師來說,真正的“異常過程”往往是可遇不可求的、是難得的機會。因為管理好的企業,應該很少出現異常。而且,對數據分析師來說,“異?!焙芸赡苁菍I過程和對象的理解不到位導致的,屬于“少見多怪”。
根據筆者的經驗,發現知識的一種可能性是“知識的融合”。不同的產品、不同的設備狀態、不同的流程背后都有人類積累的知識。但這些知識往往是碎片化的,僅僅適合特定的場景。把這些知識融合在一起,形成廣泛適用的知識,是非常值得做的事情。這樣的知識一旦形成,對創新和優化的意義非常巨大,也有知識發現的空間。
數據分析有一個非常重大的意義,就是掌握現代化技術的抓手。
我國的許多先進技術都是從國外引進的。長期以來,我們并沒有把引進技術消化透。我們或許會用這些技術,卻不能很好地掌握這些技術。就像會開車的人不一定會修車、不一定會造車。這是個很大的麻煩,使得我們無法擺脫“引進落后,再引進再落后”的怪圈。
要擺脫這個怪圈,需要對引進技術深入理解。但如何才能深入理解呢?小平同志說:掌握新技術,要善于學習更要善于創新。實踐證明,只有在創新中才能學習到位。但這里又遇到一個困境:學都沒學好,如何創新呢?
答案是從改進型的“微創新”開始。員工小改小革發揮的作用或許不大,但通過小改小革,卻能深入地了解引進技術。小改小革的次數多了,也就容易掌握引進技術了。所以,小改小革是培養人、培養能力的抓手。
怎樣小改小革?我曾經給某公司領導建議抓兩件事:“不犯二次錯、做得更好點”。產品質量或設備出現問題是難免的,要努力做到不犯第二次錯誤;每次生產都涉及到質量、成本、效率等問題,希望每次都有進步或者保持最好。這兩件事看起來很小,但卻能把數字化相關的技術拉動起來。這個道理我在過去的文章中講過,這里就不多說了。
做這兩件事的時候,幾乎一定會遇到數據分析:為什么出問題了?如何做得更好一點?所以,數據分析往往是支持“微創新”的必要手段。在數據分析過程中,我們可以從微觀角度深入地理解技術的本質。對高度自動化的企業,更是如此。因為生產技術都寫入了計算機,都由數據表現出來了。當年寶鋼第一批技術業務專家,搞計算機的比例很大,總體上與此有關。
我們知道:在許多傳統制造行業,美國原本是領頭羊,但日本制造卻不斷超越美國。這一點,很少國家能夠做到。在我看來,日本人做到這一點的重要原因,是有著精益求精的精神。在求精的過程中,真正認識、掌握新技術,從而超越了美國。我們的企業往往缺乏精益求精的精神,也就難以實現從跟隨到超越的轉變。
數字化時代的到來,給我們提供了新的機會。數據分析,幫助我們抓住機會。但我認為:對機器學習的作用不要過于迷信。智能化我往往是“用人明白的道理,讓機器做得更好”。我們做數據分析,往往首先是變成“人明白的道理”,然后再寫入計算機中。如果跨越了人的這一步,工廠敢讓機器去決策嗎?簡單決策可以,復雜就不行了。
作者:郭朝暉(工學博士,教授級高工。企業研發一線工作20年;優也科技信息公司首席科學家;東北大學、上海交大等多所院校兼職教授。國內知名智庫、走向智能研究院的發起人之一。原寶鋼研究院首席研究員)
共有訪客發表了評論
網友評論