歡迎光臨
每天分享高質量文章

上班第一天,一個合格的運維應該做什麼?


運維行業正在變革,推薦閱讀:30萬年薪Linux運維工程師成長魔法


作為一名運維工程師,如果你在春節放假期間沒有被報警電話和郵件吵醒過,那說明你在放假前的準備真的非常出色。如果你的準備不夠充分,下場請參考微博運維小哥:

儘管你取得了階段性的勝利度過了一個清凈的假期,但現在可還不是掉以輕心的時候!

上班第一天,不做這些事情的運維是不合格的哦~

1

對硬體設施進行全面體檢


不同的企業對IT裝置的運維有不同的標準,有些公司節假日期間可以部分停機,有一些公司必須7*24小時的執行。在假期裡勤勤懇懇工作的機器們有沒有出現什麼問題?首先讓我們對硬體設施進行全面體檢吧!


PC機的檢測及準備至少應該包括以下幾個方面:

(1)、對PC機的硬體進行檢查,包括電源、硬碟和網絡卡等。

(2)、要安裝作業系統的最新補丁包,還要對防毒軟體的病毒庫進行更新。

(3)、將最新的應用程式和資料做備份。


註意點一:UPS不間斷電源檢查

電源檢查往往是容易被忽視的一環。如今大部分企業的業務需要7*24小時不間斷執行,甭管是自動還是手動,反正不能停。那麼選用UPS電源習以為常。UPS的新舊或者老化程度如何,能否在伺服器出現異常情況時,實現正常關閉伺服器的效能。需要對其進行檢查,其出現故障的機率有多高,故障的自動應對舉措有哪些,都需要預先思考周全。


註意點二:電纜線路與佈線情況檢視

對連線伺服器的各條線路進行精細檢視,關鍵是檢查配線箱,看看插座是否對應插頭,不插頭與非適配插座亂串。電纜線路正常傳輸和佈線合理與否都將影響到伺服器正常執行情況,務必檢視清楚。若有異常,最好找電纜線路的承包商來進行修複或最佳化。

2

伺服器的檢測及其準備


(1)、在適當的時間對伺服器進行進行一次冷關機斷點,然後對其電源、硬碟、網絡卡、風扇等進行檢查,確保其效能良好。

(2)、如果伺服器做了RAID,一定要檢查RAID卡和熱插拔硬碟工作狀態是否正常。

(3)、清理檔案系統的歷史資料,要保持檔案系統有足夠的可用磁碟空間。

(4)、清理資料庫的歷史資料,保持資料庫有足夠的可用空間。

(5)、備份應用程式和相關配置引數。

(6)、檢測確保備份伺服器,確保其有足夠的磁碟空間。


註意點一:系統補丁是否安裝完備

補丁較容易配置而且是免費提供,但有些網管可能會覺得系統執行效果不錯,無需為其打補丁。然而伴隨補丁而來的大量漏洞修補卻是至關重要的,對伺服器安全有莫大助力。長假之後通常有許多補丁釋出,這個工作量可不小。


註意點二:資料備份忘不得

企業資料一旦丟失是“致命”的,防止資料丟失,對伺服器資料進行備份必不可省。別企圖在伺服器上某一區新建備份檔案夾或者建立一個備份區,如果僅僅只做此項工作,如此備份方法仍非常危險,一旦伺服器的硬碟區“失火”,那麼所有分割槽的資料就將統統“銷聲匿跡”,如此備份有後患。建議外接使用專門單獨時裝置對資料進行二次備份,可使用較普遍的交叉備份方法或者成本較高的磁帶。

此外,已備份的資料也有可能發生被盜,建議網管在備份時能夠透過密碼對備份介質進行保護。


註意點三:強化伺服器本地檔案格式安全級別

伺服器安全檢查有來自自身裝置問題,很大一部分來自防範外部攻擊。因此有必要在假期結束後確認檢查伺服器本地檔案格式級別是否夠高,別給駭客可乘之機。檢查伺服器作業系統是否已經對使用者訪問許可權進行限制,避免因使用者使用統一訪問伺服器的許可權而存在不安全因素。

同時,網管需檢查系統是否使用了相關的網路檢測軟體對企業網路執行情況進行全天候監視。

3

對於交換機/路由器的檢測及其準備


(1)、在情況容許的情況下對交換機/路由器進行重啟對其功能進行檢測,測試的專案諸如介面測試、效能測試、協議一致性測試和網管測試等,測試最好進行遠端測試。

(2)、對其進行衛生清潔是非常必要的,最好能夠開啟交換機/路由器,清除其主機板電路上及其外圍的灰塵,因灰塵導致的故障也是屢見不鮮。

(3)、備份也是必須的,諸如思科路由器的IOS備份和網路配置備份,最好將其備份到一個固定的地方,例如專門用於備份的某UNIX主機的某個目錄下或者某個專用的備份移動硬碟。

4

維護運維平臺


節日期間,因為無人值守,我們通常會選擇運維監控平臺來進行系統實時監控防止出現問題。在假期的使用過程中,你有沒有發現平臺的bug或者某些不盡如人意的地方?

為了下一個假期裡更加安心,大膽的整理你的需求然後提交吧。在節日期間,實時監控的運維平臺就是運維人員的“眼睛”。

以筆者的經驗,運維平臺要能監控全面,最好能在一個平臺裡對整個系統進行監控,把系統中所有可能出現故障的環節都進行監控,並且能設定相關預警,以便運維人員在系統出現異常訊號的時候及時處理,防止出現故障後進行補漏。

另外,對於運維平臺最少必須能支援實時告警,以簡訊方式實時將系統中的異常訊號傳送運維人員,以便運維人員及時準確的掌握系統執行狀況。

5

關閉遠端維護渠道


休假在家,常規的遠端維護還是必須的。當然,如果網路出現故障,遠端維護當然是最快捷、高效的手段了。因此,在假期裡一定要確保遠端維護渠道的暢通。

但是現在假期已經結束,為了安全還是將通道關閉吧。另外也別忘記查漏補缺,下一個長假裡我們還是很需要它的。

6

回顧假期工作


做完以上緊急事項後,是時候對自己的假期工作做個總結了。

先看一下自己在假期中的所有往來郵件及檔案,從中對自己假期的工作內容進行彙總、分析,並提煉出主要內容,分析假期成績、反思假期不足,給自己一個收穫滿滿的假日。

工作總結建議使用X-mind,有免費版可以使用。上班第一天,工作總結和思維導圖更配哦~

7

列個清單出來


做完工作回顧之後,你應該已經可以列出一個待辦事項清單了。

首先是對於任務中能立馬跟進的事情,比如之前已經發出對方還沒有回覆的郵件可以再發一封作為提醒。

對於比較複雜難以立馬解決的任務,分類彙總列出來。串列的時候要註意,如果一開始就進入到方案設計等複雜的工作中,可能會比較難開啟思路。優先處理溝通協調類的工作,例如資訊同步、郵件跟進之類。

這裡還有個小心機,一般工作的第一週都會有周會,做好以上幾件事情,就能做到未雨綢繆。

最後,希望筆者的經驗對大家有所幫助。





更多Linux好文請點選【閱讀原文】哦

↓↓↓

贊(0)

分享創造快樂