首頁-人工智能- 智能運維

  • 挑戰(zhàn) · 價值

    挑戰(zhàn)
    1. 系統(tǒng)壓力大:
    平均日交易量可達3000筆+;每分鐘系統(tǒng)性能指標數(shù)據(jù)達到GB級;運維數(shù)據(jù)只能保留月度數(shù)據(jù)甚至1~2周數(shù)據(jù)量。
    2. 運維協(xié)作少:
    運維條線僵硬,整合分析困難,出現(xiàn)運維死角;運維數(shù)據(jù)缺乏統(tǒng)一管理,造成根因甄別排錯困難;業(yè)務部門與運維部門協(xié)調(diào)困難,難以實現(xiàn)敏捷開發(fā),部署,上線快速業(yè)務創(chuàng)新。
    3. 數(shù)據(jù)利用低:
    大量的網(wǎng)絡流量與事務處理、日志文件、報警與事件、性能指標數(shù)據(jù)沒有有效利用;被動式IT運維方式,很少做到主動式/預測式IT運維,實現(xiàn)整體運維監(jiān)控趨勢把握。

    價值
    如右圖所示:
  • 架構(gòu)


    單指標趨勢分析:

    通過統(tǒng)計學理論/數(shù)學算法對歷史數(shù)據(jù)進行分析;按照不同日期特性,如:工作日/休息日/特殊運維日,進行單KPI預測;
    按照不同的時段特性,如:交易高峰時段/交易平峰時段,進行單KPI上下限預測;
    根據(jù)預測結(jié)果,結(jié)合實際值,制定不同的告警規(guī)則。
  • 多KPI關(guān)聯(lián)分析

    多KPI關(guān)聯(lián)分析:
    通過統(tǒng)計學理論,挖掘指標間的關(guān)聯(lián)關(guān)系;通過統(tǒng)計學理論/數(shù)學算法對具有關(guān)聯(lián)關(guān)系的KPI進行數(shù)據(jù)分析,找到各KPI之間的標準誤差;通過算法計算各關(guān)聯(lián)指標之間的標準誤差,當標準誤差超過算法范圍后進行預警。

    多KPI關(guān)聯(lián)根因分析:
    根據(jù)各KPI的影響度提出故障解決的推薦意見;當多個KPI之間的關(guān)系被打破,即發(fā)生異常時,通過對大量數(shù)據(jù)的挖掘和學習,在第一時間找到異常發(fā)生的原因。
  • 應用場景

    數(shù)據(jù)中心成為當代各個行業(yè)發(fā)展的核心業(yè)務支撐。隨著科技的進步, 傳統(tǒng)數(shù)據(jù)中心正逐步向智能、高效、綠色新一代數(shù)據(jù)中心與“云”中心發(fā)展, 其IT 基礎設備部署呈現(xiàn)“ 大規(guī)模、高密度、復雜化”等特點,金融行業(yè)數(shù)據(jù)中心運維管理面臨新的挑戰(zhàn)。

    我們提供了DCLive特權(quán)訪問管理方案:

    對機房的服務器主機、網(wǎng)絡設備、軟件系統(tǒng)的網(wǎng)內(nèi)或帶外維護訪問必須先經(jīng)過DCLive 的認證
    用戶不需要保管被訪問設備的特權(quán)帳號,通過密碼代填功能,直接打開會話窗口,提升了訪問效率,降低了安全風險
    支持命令行的操作, 例如telnet 、SSH 、Console 等。支持圖形化的操作, 例如RDP、VNC、KVM 、IPMI等。支持第三方應用,例如電力調(diào)度專用的客戶端,數(shù)據(jù)庫客戶端等程序
    提供完善的風險控制機制,用戶對IT設備的各類訪問操作,都會被記錄下來,用于后期審計