04.13 / 2022
“ AI助力數(shù)據(jù)中心智能化和數(shù)字化轉(zhuǎn)型”
01—數(shù)據(jù)中心運(yùn)維的“離散雛形”陷進(jìn)
隨著信息技術(shù)的發(fā)展,數(shù)據(jù)中心運(yùn)維的理念也在從人工運(yùn)維、被動(dòng)運(yùn)維、主動(dòng)運(yùn)維、服務(wù)導(dǎo)向、業(yè)務(wù)價(jià)值導(dǎo)向進(jìn)行演進(jìn),但運(yùn)維體系建設(shè)過程中往往存在以建設(shè)任務(wù)為導(dǎo)向邊建設(shè)邊改造,運(yùn)維體系建設(shè)缺乏長(zhǎng)遠(yuǎn)規(guī)劃、頭痛醫(yī)頭腳痛醫(yī)腳,造成數(shù)據(jù)中心運(yùn)維管理實(shí)質(zhì)處于離散雛形階段,在運(yùn)維工具繁雜的情形下,既無法做到運(yùn)維能力從應(yīng)用到基礎(chǔ)設(shè)施的上下穿透,也無法做到運(yùn)營(yíng)效果在客戶內(nèi)部的橫向延伸,對(duì)運(yùn)維的效果、運(yùn)維運(yùn)營(yíng)化及業(yè)務(wù)價(jià)值導(dǎo)向的發(fā)展形成嚴(yán)重制約,在數(shù)字化經(jīng)濟(jì)全面發(fā)展之時(shí),在應(yīng)用和基礎(chǔ)設(shè)施愈加松耦合之際,離散陷阱導(dǎo)致的問題將日趨嚴(yán)重。
02—三大核心,建設(shè)智能運(yùn)維體系
數(shù)字化—利用運(yùn)維數(shù)據(jù)破界
數(shù)據(jù)是運(yùn)維工作的源泉和基石,因此運(yùn)維要做好,首當(dāng)其沖的是將運(yùn)維數(shù)據(jù)治理好,而數(shù)據(jù)治理需要確定數(shù)據(jù)范圍,制定數(shù)據(jù)規(guī)范,規(guī)劃數(shù)據(jù)來源,建立數(shù)據(jù)調(diào)和和異常機(jī)制等,進(jìn)而形成運(yùn)維數(shù)據(jù)全覆蓋、運(yùn)維數(shù)據(jù)變化全掌控、運(yùn)維數(shù)據(jù)服務(wù)全鏈條的效果,以此實(shí)現(xiàn)對(duì)分散的IT運(yùn)維工具進(jìn)行數(shù)據(jù)(即專業(yè)能力)的融合,融合的重點(diǎn)在于數(shù)據(jù)查看、智能策略、變更流程、執(zhí)行和可視化的數(shù)據(jù)供給和聯(lián)動(dòng)。
智能化—利用AI能力賦能
通過運(yùn)維大數(shù)據(jù)庫中構(gòu)建的資產(chǎn)圖譜、知識(shí)圖譜、事件圖譜等海量數(shù)據(jù),即可基于算法工程平臺(tái)依次對(duì)單指標(biāo)、多指標(biāo)、立體化指標(biāo)進(jìn)行深層次數(shù)據(jù)挖掘和分析,實(shí)現(xiàn)基線分析、智能告警、趨勢(shì)預(yù)測(cè)、關(guān)聯(lián)影響分析、故障溯源等場(chǎng)景,促進(jìn)運(yùn)維工作的自動(dòng)化和智能化,大幅提升運(yùn)維的質(zhì)量和效率,甚至可以達(dá)到運(yùn)維數(shù)據(jù)業(yè)務(wù)化,推進(jìn)業(yè)務(wù)創(chuàng)新,提升用戶體驗(yàn),展現(xiàn)運(yùn)維成效等。
場(chǎng)景化—構(gòu)建運(yùn)維應(yīng)用體系
運(yùn)維體系包括人員、工具、制度、規(guī)范、流程等要素,每個(gè)行業(yè)、每個(gè)客戶會(huì)因?yàn)楸O(jiān)管要求和管理思路的差異,隨著時(shí)間及理念等因素的變化,具體客戶的場(chǎng)景也會(huì)隨之發(fā)生變化,因此根據(jù)客戶自身場(chǎng)景需要,構(gòu)建一個(gè)開放的、平滑擴(kuò)展的、甚至可以自主研發(fā)擴(kuò)展的運(yùn)維應(yīng)用體系至關(guān)重要。
03—重塑智能運(yùn)維-云層智能運(yùn)維平臺(tái)
平臺(tái)定位
云層智能運(yùn)維平臺(tái)將實(shí)現(xiàn)對(duì)全局資產(chǎn)及運(yùn)行數(shù)據(jù)的自動(dòng)采集及大數(shù)據(jù)存儲(chǔ),并通過資產(chǎn)管理、運(yùn)維管理、監(jiān)控管理三個(gè)技術(shù)中臺(tái)模塊,結(jié)合關(guān)聯(lián)關(guān)系圖譜分析和算法分析數(shù)據(jù)中臺(tái)模塊,為數(shù)據(jù)中心運(yùn)維管理提供自動(dòng)化、智能化、可配置的運(yùn)維場(chǎng)景應(yīng)用,切實(shí)提升數(shù)據(jù)中心在質(zhì)量保障、風(fēng)險(xiǎn)評(píng)估、效率提升和容量管理方面的能力。
產(chǎn)品架構(gòu)
平臺(tái)架構(gòu)分為業(yè)務(wù)中臺(tái)、數(shù)據(jù)算法中臺(tái)、管理中臺(tái)和上層應(yīng)用場(chǎng)景四個(gè)方面。
1. 業(yè)務(wù)管理中臺(tái):將運(yùn)維工作降維抽象為原子化對(duì)象、原子化狀態(tài)及原子化操作和原子化事件,基于四個(gè)原子的組合構(gòu)成所有的運(yùn)維場(chǎng)景,業(yè)務(wù)中臺(tái)是連接客戶現(xiàn)有系統(tǒng)的關(guān)鍵部分,主要實(shí)現(xiàn)兩個(gè)目標(biāo),一是實(shí)現(xiàn)運(yùn)維數(shù)據(jù)的實(shí)時(shí)采集存儲(chǔ),二是基于客戶現(xiàn)有系統(tǒng)的對(duì)接,并向上層應(yīng)用APP場(chǎng)景提供一致的北向API(屏蔽底層API差異)。客戶現(xiàn)有系統(tǒng)可包括資產(chǎn)類管理系統(tǒng)、監(jiān)控類系統(tǒng)(基礎(chǔ)設(shè)施監(jiān)控、日志監(jiān)控、應(yīng)用監(jiān)控)、操作類系統(tǒng)(虛擬化或云管、備份系統(tǒng)、安全掃描、設(shè)備遠(yuǎn)程管控系統(tǒng)等)。
2. 數(shù)據(jù)算法中臺(tái):實(shí)現(xiàn)運(yùn)維大數(shù)據(jù)的存儲(chǔ)、治理、學(xué)習(xí)和訓(xùn)練,在故障共現(xiàn)分析、關(guān)聯(lián)影響分析、故障自愈、容量規(guī)劃、趨勢(shì)分析、智能問答場(chǎng)景提供智能化功能。數(shù)據(jù)范圍包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),涵蓋資產(chǎn)屬性、資產(chǎn)圖譜、性能數(shù)據(jù)、日志數(shù)據(jù)、風(fēng)險(xiǎn)檢測(cè)數(shù)據(jù)、安全威脅數(shù)據(jù)、事件數(shù)據(jù)等。
3. 運(yùn)維應(yīng)用管理:為智能運(yùn)維平臺(tái)提供統(tǒng)一組織管理、統(tǒng)一用戶角色管理、統(tǒng)一流程管理、以及運(yùn)維APP的上傳、發(fā)布及授權(quán)管理(管理顆粒度細(xì)化到每個(gè)角色的APP可見范圍、APP中頁面可見范圍、操作按鈕可見范圍)
4. 上層應(yīng)用場(chǎng)景:依賴業(yè)務(wù)中臺(tái)、數(shù)據(jù)中臺(tái)和管理中臺(tái)的北向API,打造輕量級(jí)、可插拔的應(yīng)用場(chǎng)景APP。APP面向所有的運(yùn)維場(chǎng)景,可以根據(jù)客戶需求進(jìn)行進(jìn)行分解及組合等靈活處理,提升產(chǎn)品對(duì)客戶環(huán)境的廣泛適配性。