知識庫是工業領域知識的集合,為使用分析引擎的工程師或業務人員提供知識的支撐,為業務編織方案提供知識保障支持專業領域知識庫查看、知識列表查看、知識分類索引、基于關鍵詞的全文搜索、知識增加、知識編輯、知識刪除、知識信息關聯、知識文檔上傳、知識版本查看、知識分享、知識收藏、知識訂閱等功能,其專業領域知識庫中知識來源于行業知識、工藝流程知識、設備說明書、行業資訊知識、工業控制系統知識等領域,可對其知識類型進行擴充。
模型庫管理是整個模型的后臺管理,通過用戶的可視化建模工具和算法編輯器,用戶可以選擇系統模型進行訓練,轉化成適合自己設備或產線的模型; 系統中預置了多種已訓練好的網絡模型,包括系統仿真模型、系統優化模型、生產預測模型、工藝流程模型、專家系統模型等多種模型,支持用戶擴展。本服務還提供模型可視化管理,支持模型增加、檢索、分類、列表查看、模型修改、模型刪除、模型按版本進行狀態管理。用戶無需編寫代碼,只需上傳業務數據,即可實現模型訓練操作。
工業算法庫包含了工業領域內的上百種算法,同時用戶可以根據已知算法進行改進,變成自己的特有算法; 提供一站式機器學習算法庫管理、模型訓練、評估與預測服務,支持可視化拖拽工作流、算法查看、基于全文的算法搜索、算法分類、算法編輯、算法刪除等基本功能,其算法庫中內置大量優化的機器學習算法,包括神經網絡算法、決策樹算法、貝葉斯算法等,支持算法擴展,支持對數據進行數據探查得到數據類型及各種統計值,對邏輯回歸和線性回歸可自動化參數調優。
語料庫是大數據分析系統的燃料,模型調整參數的依據,語料庫本質為一個高質量的數據庫。提供算法生成模型所需要的合適的基礎語料。支持對語料資源擴充,保證系統語料庫具有全方位的樣本空間和多維度的語料資源,提供多種常用自然語言類的算法模型、語音去噪、多維度分析、語料列表查看、基于關鍵詞語料搜索、語料標識和分類、語料編輯和刪除、生成詞表、關鍵詞提取、查詢結果存儲等功能。
模型訓練引擎系統使用了Apache Hadoop和Spark提供性能驅動且強大的大數據框架。用戶可以在非結構化或結構化數據上使用Spark接口和機器學習算法,業務分析師可以針對大數據啟動交互式查詢,支持可視化部署、系統狀況的實時監控、通過web端的遠程管理。優勢:管理數據和運行作業,無需擔心容量,配置和調整集群大小以實現最佳性能和成本管理;基于Apache Hadoop,Spark,Hive和Pig以及第三方應用程序,穩定、可靠、高效。
工業模型市場提供了模型訓練的基礎環境,構成了多用戶集成的訓練池。訓練池提供模型的分類展示、模型描述、訓練標準、適用范圍、用戶評價等信息。模型列表提供智能的分類和排序,供用戶進行個性化選擇; 訓練池提供可視化模型生命周期管理,可以在管理界面對模型服務的生命周期進行可視化管理。支持業界模型標準:支持業界標準的模型PMML的導入導出,與其他機器學習軟件進行無縫集成,能夠提供模型列表查看、模型介紹、模型的使用。