工業大數據是工業領域相關數據集的總稱,是工業互聯網的核心,是智能制造的關鍵。工業大數據分析技術作為工業大數據的核心技術之一,是工業智能化發展的重要基礎和關鍵支撐。為此,在工業互聯網產業聯盟的指導下,工業大數據特設組主持編寫了這本《工業大數據分析指南》。
本書旨在對通用的工業大數據分析方法和分析流程進行歸納總結,對其關鍵共性進行辨識、抽象和提升,而非針對某一特定行業、企業或產品進行闡述。本書更加關注于方法論而非某些具體的技術,因此具有更加廣泛的通用性和相對普遍的指導意義。
本書共分為9章,第1章首先論述了工業大數據分析的概念、特殊性以及常見的問題;第2章提出了工業大數據分析框架,簡要介紹了CRISP-DM模型,并針對模型落地的難點和模型使用的指導思想展開討論;從第3章到第8章,依次對業務理解、數據理解、數據準備、數據建模、模型驗證與評估、模型部署這6個CRISP-DM模型的基本步驟進行了詳細的闡述,從需求分析到目標評估,從數據來源到數據分類,從數據預處理到建模過程,從模型驗證到部署問題處理,對每一個步驟中的原理方法、分析過程、處理方式、問題排除等都一一進行了講解和說明;最后,第9章對工業大數據分析的未來發展進行了展望。
本書由工業大數據特設組組長單位清華大學牽頭編寫,在編寫過程中得到了工信部領導的悉心指導和相關單位的有力支撐。特別感謝清華大學孫家廣院士、工信部信軟司謝少鋒司長等給予的全面指導。同時,北京工業大數據創新中心的李三華、田春華,清華大學的任艮全、徐哲、強逍等在本書的編寫階段也給予了無私的幫助,在此表示誠摯的謝意。
工業大數據作為新興概念,其數據分析的原則、手段、方法和流程還很模糊,對海量數據的挖掘、分析和處理等技術仍在不斷的發展和進步,由于作者自身的能力和水平有限,本書不可避免的存在諸多的缺點和不足,期待各位讀者能夠積極發現問題,并予以批評指正。