智能運維
-
1. 系統(tǒng)壓力大:
平均日交易量可達3000筆+;每分鐘系統(tǒng)性能指標數(shù)據(jù)達到GB級;運維數(shù)據(jù)只能保留月度數(shù)據(jù)甚至1~2周數(shù)據(jù)量。
2. 運維協(xié)作少:
運維條線僵硬,整合分析困難,出現(xiàn)運維死角;運維數(shù)據(jù)缺乏統(tǒng)一管理,造成根因甄別排錯困難;業(yè)務部門與運維部門協(xié)調(diào)困難,難以實現(xiàn)敏捷開發(fā),部署,上線快速業(yè)務創(chuàng)新。
3. 數(shù)據(jù)利用低:
大量的網(wǎng)絡流量與事務處理、日志文件、報警與事件、性能指標數(shù)據(jù)沒有有效利用;被動式IT運維方式,很少做到主動式/預測式IT運維,實現(xiàn)整體運維監(jiān)控趨勢把握。
價值
如右圖所示: -
單指標趨勢分析:
通過統(tǒng)計學理論/數(shù)學算法對歷史數(shù)據(jù)進行分析;按照不同日期特性,如:工作日/休息日/特殊運維日,進行單KPI預測;
按照不同的時段特性,如:交易高峰時段/交易平峰時段,進行單KPI上下限預測;
根據(jù)預測結(jié)果,結(jié)合實際值,制定不同的告警規(guī)則。
-
通過統(tǒng)計學理論,挖掘指標間的關(guān)聯(lián)關(guān)系;通過統(tǒng)計學理論/數(shù)學算法對具有關(guān)聯(lián)關(guān)系的KPI進行數(shù)據(jù)分析,找到各KPI之間的標準誤差;通過算法計算各關(guān)聯(lián)指標之間的標準誤差,當標準誤差超過算法范圍后進行預警。
多KPI關(guān)聯(lián)根因分析:
根據(jù)各KPI的影響度提出故障解決的推薦意見;當多個KPI之間的關(guān)系被打破,即發(fā)生異常時,通過對大量數(shù)據(jù)的挖掘和學習,在第一時間找到異常發(fā)生的原因。 -
我們提供了DCLive特權(quán)訪問管理方案:
對機房的服務器主機、網(wǎng)絡設備、軟件系統(tǒng)的網(wǎng)內(nèi)或帶外維護訪問必須先經(jīng)過DCLive 的認證
用戶不需要保管被訪問設備的特權(quán)帳號,通過密碼代填功能,直接打開會話窗口,提升了訪問效率,降低了安全風險
支持命令行的操作, 例如telnet 、SSH 、Console 等。支持圖形化的操作, 例如RDP、VNC、KVM 、IPMI等。支持第三方應用,例如電力調(diào)度專用的客戶端,數(shù)據(jù)庫客戶端等程序
提供完善的風險控制機制,用戶對IT設備的各類訪問操作,都會被記錄下來,用于后期審計