多場(chǎng)景落地智維運(yùn)維 新技術(shù)護(hù)航系統(tǒng)效率

來(lái)源:大京網(wǎng)

國(guó)內(nèi)某知名物流企業(yè)研發(fā)了先進(jìn)的快件運(yùn)營(yíng)信息管理系統(tǒng),并在全網(wǎng)絡(luò)快遞員中統(tǒng)一投入使用手持終端設(shè)備,實(shí)現(xiàn)了快件操作與信息采集的同步和快件運(yùn)營(yíng)信息的實(shí)時(shí)傳遞。運(yùn)營(yíng)信息系統(tǒng)的運(yùn)行依賴(lài)網(wǎng)絡(luò),因此,網(wǎng)絡(luò)的穩(wěn)定和可靠成為了支持該企業(yè)業(yè)務(wù)生命線(xiàn)的關(guān)鍵問(wèn)題。面對(duì)越來(lái)越復(fù)雜的網(wǎng)絡(luò)構(gòu)架和爆發(fā)式增長(zhǎng)的應(yīng)用上線(xiàn),運(yùn)維團(tuán)隊(duì)常常需要解決業(yè)務(wù)系統(tǒng)突然中斷、能下降、用戶(hù)訪(fǎng)問(wèn)異常等等問(wèn)題,因此需要建設(shè)一套新的網(wǎng)絡(luò)能監(jiān)測(cè)系統(tǒng),與現(xiàn)有的基礎(chǔ)監(jiān)控系統(tǒng)共同支撐,實(shí)時(shí)展示和分析應(yīng)用的能以及用戶(hù)體驗(yàn)等情況。

2020年,該企業(yè)上線(xiàn)了智維數(shù)據(jù)nCompass網(wǎng)絡(luò)流量監(jiān)控臺(tái),實(shí)現(xiàn)了多源數(shù)據(jù)采集以及業(yè)務(wù)能和網(wǎng)絡(luò)能可視化監(jiān)控,為業(yè)務(wù)系統(tǒng)與應(yīng)用能故障分析提供了可靠的數(shù)據(jù)支撐。本次案例分享將聚焦該物流企業(yè)通過(guò)網(wǎng)絡(luò)流量智能分析系統(tǒng),提升系統(tǒng)故障處置效率,支撐系統(tǒng)穩(wěn)定快速運(yùn)轉(zhuǎn)的背后故事。

“快”的保障

是強(qiáng)大穩(wěn)定的自動(dòng)化、數(shù)字化全流程

物流業(yè)的數(shù)據(jù)化運(yùn)營(yíng)是關(guān)聯(lián)到派單、收件、派件等一系列的復(fù)雜流程。舉個(gè)例子,消費(fèi)者在網(wǎng)上下單后,購(gòu)物臺(tái)會(huì)推送給物流企業(yè),此時(shí)快遞員就會(huì)收到收件工單。收件完成后,這個(gè)快遞會(huì)被送到相應(yīng)的營(yíng)業(yè)網(wǎng)點(diǎn),由營(yíng)業(yè)網(wǎng)點(diǎn)進(jìn)行分撥,分揀,訂單處理到收件網(wǎng)點(diǎn),最后送到消費(fèi)者手里。現(xiàn)在,國(guó)內(nèi)大的物流公司基本上整個(gè)過(guò)程都是全自動(dòng)的,這樣能保障快遞的送達(dá)效率是很高的。

因?yàn)閷?duì)效率要求很高,所以對(duì)于網(wǎng)絡(luò)效率和穩(wěn)定要求也特別高,物流的核心是效率,而物流的每個(gè)流程都是通過(guò)云端,網(wǎng)絡(luò)數(shù)字化去流轉(zhuǎn)的,要達(dá)到最優(yōu)轉(zhuǎn)化,網(wǎng)絡(luò)的穩(wěn)定和效率是重點(diǎn)。

自動(dòng)告警,智能分析

實(shí)現(xiàn)穩(wěn)定、連續(xù)的網(wǎng)絡(luò)支撐

那么如何保障物流網(wǎng)絡(luò)的穩(wěn)定,又有哪些難點(diǎn)問(wèn)題呢?以前有網(wǎng)絡(luò)故障發(fā)生,比如當(dāng)應(yīng)用能下降,運(yùn)維部門(mén)只能通過(guò)人工經(jīng)驗(yàn)逐個(gè)排查,如果不能及時(shí)解決就會(huì)影響到前端的業(yè)務(wù)流轉(zhuǎn)。另外還有一些合規(guī)和管理風(fēng)險(xiǎn)的問(wèn)題,比如符合等保2.0的要求,國(guó)家監(jiān)管部門(mén)的要求,以及出于數(shù)據(jù)安全防護(hù)的要求,需要做到運(yùn)營(yíng)的精細(xì)化管理。

而現(xiàn)在該物流企業(yè)采用的是智維數(shù)據(jù)的nCompass網(wǎng)絡(luò)流量監(jiān)控臺(tái),網(wǎng)絡(luò)上有故障發(fā)生,可以通過(guò)nCompass溯源找到問(wèn)題根源,有隱患發(fā)生也有自動(dòng)告警,網(wǎng)絡(luò)部門(mén)可以先把這個(gè)故障梳理掉,讓業(yè)務(wù)恢復(fù)。應(yīng)用層有問(wèn)題也能發(fā)出告警,應(yīng)用組可以通過(guò)排他的方式把問(wèn)題迅速解決。

以前看不到應(yīng)用之間訪(fǎng)問(wèn)鏈的情況,現(xiàn)在網(wǎng)絡(luò)部門(mén)可以通過(guò)nCompass對(duì)接負(fù)載均衡的API接口,這樣能看到整體網(wǎng)絡(luò)每個(gè)節(jié)點(diǎn)發(fā)生的問(wèn)題,加上該企業(yè)基礎(chǔ)監(jiān)控對(duì)物理設(shè)備的監(jiān)控能力,這樣結(jié)合就能實(shí)現(xiàn)整體的運(yùn)維監(jiān)控能力。

多場(chǎng)景落地智維運(yùn)維,新技術(shù)護(hù)航系統(tǒng)效率

以下是幾個(gè)nCompass流量監(jiān)控臺(tái)幫助解決運(yùn)維故障提升IT效率的例子。

場(chǎng)景1

訪(fǎng)問(wèn)流程突發(fā)故障

web頁(yè)面無(wú)法訪(fǎng)問(wèn)是該物流企業(yè)用戶(hù)經(jīng)常會(huì)遇到的問(wèn)題,有一種常見(jiàn)現(xiàn)象是證書(shū)切換問(wèn)題,應(yīng)用要實(shí)現(xiàn)滑的切換。當(dāng)遇到用戶(hù)反饋?lái)?yè)面打不開(kāi),網(wǎng)絡(luò)部門(mén)可以通過(guò)nCompass來(lái)分析一下這個(gè)應(yīng)用到底有沒(méi)有成功跳轉(zhuǎn),還是錯(cuò)誤跳轉(zhuǎn)到別的地方去了。

還有一些頁(yè)面打不開(kāi)是由于調(diào)用第三方接口失敗造成的。不通有很多種,一種是對(duì)方加了白名單,但是這邊的防火墻沒(méi)有放行。那么這個(gè)請(qǐng)求有沒(méi)有通過(guò),網(wǎng)絡(luò)部門(mén)同樣也可以通過(guò)nCompass去監(jiān)控它。

還有會(huì)出現(xiàn)運(yùn)營(yíng)商骨干網(wǎng)振蕩,導(dǎo)致頁(yè)面打不開(kāi)。此時(shí)通過(guò)nCompass去溯源,發(fā)現(xiàn)只有某個(gè)城市DNS有問(wèn)題,網(wǎng)絡(luò)部門(mén)就可以反饋給下面的快遞員或者反饋給第三方,是哪個(gè)地方現(xiàn)在不好,可以及時(shí)切換一下線(xiàn)路。

再比如有用戶(hù)反饋網(wǎng)站打不開(kāi),應(yīng)用組懷疑是DNS解析失敗,這時(shí)候通過(guò)nCompass去檢查,發(fā)現(xiàn)DNS解析率是99%,說(shuō)明DNS解析正常,那么網(wǎng)絡(luò)部門(mén)就可以反饋給應(yīng)用組,請(qǐng)他們?nèi)ヅ挪槠渌麊?wèn)題。

場(chǎng)景2

鏈路優(yōu)化管理與重大事件全局監(jiān)控

鏈路管理是各個(gè)物流企業(yè)運(yùn)維部門(mén)都特別重視的,鏈路管理指的是運(yùn)營(yíng)商帶寬的問(wèn)題,要保障網(wǎng)絡(luò)暢通的穩(wěn)定,網(wǎng)絡(luò)部門(mén)可以用nCompass看一下抖動(dòng)、延遲有沒(méi)有問(wèn)題,如果此時(shí)監(jiān)控主動(dòng)告警提示某個(gè)骨干有問(wèn)題,運(yùn)維人員可以將出口的負(fù)載均衡切換到另外的鏈路上,就能夠保證外部訪(fǎng)問(wèn)正常。

nCompass提供了企業(yè)全局的可視化監(jiān)控能力,可以把負(fù)載均衡、鏈路管理、業(yè)務(wù)監(jiān)控都統(tǒng)一到一個(gè)臺(tái)上來(lái)。比如物流行業(yè)在雙十一、雙十二這種業(yè)務(wù)量高峰期,就可以利用nCompass看到實(shí)時(shí)進(jìn)來(lái)的流量帶寬,包括應(yīng)用之間互訪(fǎng)的延遲,這樣在大型促銷(xiāo)或業(yè)務(wù)流量特別大的時(shí)候會(huì)有一個(gè)基礎(chǔ)保障。

通過(guò)nCompass主動(dòng)告警,網(wǎng)絡(luò)人員可以實(shí)時(shí)監(jiān)測(cè)流量是否穩(wěn)定,延遲的指標(biāo)高低,應(yīng)用負(fù)載率等等,有問(wèn)題可以提前處理掉。因?yàn)閺臉I(yè)務(wù)開(kāi)始報(bào)障到故障發(fā)生會(huì)間隔一些時(shí)間,這個(gè)時(shí)間里使用流量臺(tái)可以幫運(yùn)維人員做到先知先覺(jué),避免該物流企業(yè)出現(xiàn)大范圍的故障,保障前臺(tái)業(yè)務(wù)運(yùn)轉(zhuǎn)和整體網(wǎng)絡(luò)運(yùn)維的效率。

場(chǎng)景3

符合等保2.0合規(guī)要求

根據(jù)三級(jí)等保要求,物流企業(yè)的系統(tǒng)日志需要存半年。但是物流行業(yè)通常的訪(fǎng)問(wèn)量太大,所以該企業(yè)也通過(guò)與nCompasss合作,定制化表單,達(dá)到了等保的要求。而在數(shù)據(jù)安全方面,網(wǎng)絡(luò)部門(mén)也可以利用nCompasss將應(yīng)用日志與網(wǎng)絡(luò)日志結(jié)合,來(lái)溯源異常的IP地址。

展望

進(jìn)一步的數(shù)據(jù)整合,搭建完整的運(yùn)營(yíng)數(shù)據(jù)監(jiān)控,

是未來(lái)實(shí)現(xiàn)AIOps,提升全流程效率的最佳方案!

物流企業(yè)作為網(wǎng)絡(luò)型組織,面對(duì)成千上萬(wàn)的物流網(wǎng)點(diǎn),面對(duì)管控難度越來(lái)越大的情況,需要以AIOps等新技術(shù)為抓手,來(lái)幫助實(shí)現(xiàn)對(duì)越來(lái)越多網(wǎng)點(diǎn)的可視化管控。在信息系統(tǒng)中能夠第一時(shí)間看到所有的數(shù)據(jù),實(shí)時(shí)處理,才能實(shí)現(xiàn)實(shí)時(shí)決策、實(shí)時(shí)優(yōu)化,幫助管控和衡整個(gè)網(wǎng)絡(luò)。

目前該企業(yè)已經(jīng)通過(guò)nCompass實(shí)現(xiàn)了在網(wǎng)絡(luò)層的監(jiān)控,未來(lái)希望將所有的網(wǎng)絡(luò)層數(shù)據(jù)、應(yīng)用層數(shù)據(jù),包括虛擬機(jī)互訪(fǎng)、K8S集群互訪(fǎng)全部數(shù)據(jù)都整合到nCompass臺(tái)上來(lái),通過(guò)nCompass來(lái)排查故障,這樣解決問(wèn)題的方式會(huì)變得更加簡(jiǎn)單,人效會(huì)更高?,F(xiàn)在智維數(shù)據(jù)也在打造“場(chǎng)景化”的解決方案,那么在之后的合作中,雙方能將技術(shù)與場(chǎng)景結(jié)合得更緊密,進(jìn)一步提升IT運(yùn)營(yíng)效率。

標(biāo)簽: 物流行業(yè) 智維數(shù)據(jù) 基礎(chǔ)監(jiān)控 運(yùn)維團(tuán)隊(duì)

推薦

財(cái)富更多》

動(dòng)態(tài)更多》

熱點(diǎn)