歡迎光臨
每天分享高質量文章

上班第一天,一個合格的運維應該做什麼?


運維行業正在變革,推薦閱讀:30萬年薪Linux運維工程師成長魔法


作為一名運維工程師,如果你在春節放假期間沒有被報警電話和郵件吵醒過,那說明你在放假前的準備真的非常出色。如果你的準備不夠充分,下場請參考微博運維小哥:

儘管你取得了階段性的勝利度過了一個清凈的假期,但現在可還不是掉以輕心的時候!

上班第一天,不做這些事情的運維是不合格的哦~

1

對硬體設施進行全面體檢


不同的企業對IT設備的運維有不同的標準,有些公司節假日期間可以部分停機,有一些公司必須7*24小時的運行。在假期里勤勤懇懇工作的機器們有沒有出現什麼問題?首先讓我們對硬體設施進行全面體檢吧!


PC機的檢測及準備至少應該包括以下幾個方面:

(1)、對PC機的硬體進行檢查,包括電源、硬碟和網卡等。

(2)、要安裝操作系統的最新補丁包,還要對殺毒軟體的病毒庫進行更新。

(3)、將最新的應用程式和資料做備份。


註意點一:UPS不間斷電源檢查

電源檢查往往是容易被忽視的一環。如今大部分企業的業務需要7*24小時不間斷運行,甭管是自動還是手動,反正不能停。那麼選用UPS電源習以為常。UPS的新舊或者老化程度如何,能否在服務器出現異常情況時,實現正常關閉服務器的效能。需要對其進行檢查,其出現故障的概率有多高,故障的自動應對舉措有哪些,都需要預先思考周全。


註意點二:電纜線路與佈線情況查看

對連接服務器的各條線路進行精細查看,關鍵是檢查配線箱,看看插座是否對應插頭,不插頭與非適配插座亂串。電纜線路正常傳輸和佈線合理與否都將影響到服務器正常運行情況,務必查看清楚。若有異常,最好找電纜線路的承包商來進行修複或優化。

2

服務器的檢測及其準備


(1)、在適當的時間對服務器進行進行一次冷關機斷點,然後對其電源、硬碟、網卡、風扇等進行檢查,確保其性能良好。

(2)、如果服務器做了RAID,一定要檢查RAID卡和熱插拔硬碟工作狀態是否正常。

(3)、清理檔案系統的歷史資料,要保持檔案系統有足夠的可用磁盤空間。

(4)、清理資料庫的歷史資料,保持資料庫有足夠的可用空間。

(5)、備份應用程式和相關配置引數。

(6)、檢測確保備份服務器,確保其有足夠的磁盤空間。


註意點一:系統補丁是否安裝完備

補丁較容易配置而且是免費提供,但有些網管可能會覺得系統運行效果不錯,無需為其打補丁。然而伴隨補丁而來的大量漏洞修補卻是至關重要的,對服務器安全有莫大助力。長假之後通常有許多補丁釋出,這個工作量可不小。


註意點二:資料備份忘不得

企業資料一旦丟失是“致命”的,防止資料丟失,對服務器資料進行備份必不可省。別企圖在服務器上某一區新建備份檔案夾或者建立一個備份區,如果僅僅只做此項工作,如此備份方法仍非常危險,一旦服務器的硬碟區“失火”,那麼所有分割槽的資料就將統統“銷聲匿跡”,如此備份有後患。建議外置使用專門單獨時設備對資料進行二次備份,可使用較普遍的交叉備份方法或者成本較高的磁帶。

此外,已備份的資料也有可能發生被盜,建議網管在備份時能夠通過密碼對備份介質進行保護。


註意點三:強化服務器本地檔案格式安全級別

服務器安全檢查有來自自身設備問題,很大一部分來自防範外部攻擊。因此有必要在假期結束後確認檢查服務器本地檔案格式級別是否夠高,別給黑客可乘之機。檢查服務器操作系統是否已經對用戶訪問權限進行限制,避免因用戶使用統一訪問服務器的權限而存在不安全因素。

同時,網管需檢查系統是否使用了相關的網絡檢測軟體對企業網絡運行情況進行全天候監視。

3

對於交換機/路由器的檢測及其準備


(1)、在情況容許的情況下對交換機/路由器進行重啟對其功能進行檢測,測試的專案諸如接口測試、性能測試、協議一致性測試和網管測試等,測試最好進行遠端測試。

(2)、對其進行衛生清潔是非常必要的,最好能夠打開交換機/路由器,清除其主板電路上及其外圍的灰塵,因灰塵導致的故障也是屢見不鮮。

(3)、備份也是必須的,諸如思科路由器的IOS備份和網絡配置備份,最好將其備份到一個固定的地方,例如專門用於備份的某UNIX主機的某個目錄下或者某個專用的備份移動硬碟。

4

維護運維平臺


節日期間,因為無人值守,我們通常會選擇運維監控平臺來進行系統實時監控防止出現問題。在假期的使用過程中,你有沒有發現平臺的bug或者某些不盡如人意的地方?

為了下一個假期里更加安心,大膽的整理你的需求然後提交吧。在節日期間,實時監控的運維平臺就是運維人員的“眼睛”。

以筆者的經驗,運維平臺要能監控全面,最好能在一個平臺里對整個系統進行監控,把系統中所有可能出現故障的環節都進行監控,並且能設置相關預警,以便運維人員在系統出現異常信號的時候及時處理,防止出現故障後進行補漏。

另外,對於運維平臺最少必須能支持實時告警,以短信方式實時將系統中的異常信號發送運維人員,以便運維人員及時準確的掌握系統運行狀況。

5

關閉遠程維護渠道


休假在家,常規的遠程維護還是必須的。當然,如果網絡出現故障,遠程維護當然是最快捷、高效的手段了。因此,在假期里一定要確保遠程維護渠道的暢通。

但是現在假期已經結束,為了安全還是將通道關閉吧。另外也別忘記查漏補缺,下一個長假里我們還是很需要它的。

6

回顧假期工作


做完以上緊急事項後,是時候對自己的假期工作做個總結了。

先看一下自己在假期中的所有往來郵件及文件,從中對自己假期的工作內容進行彙總、分析,並提煉出主要內容,分析假期成績、反思假期不足,給自己一個收穫滿滿的假日。

工作總結建議使用X-mind,有免費版可以使用。上班第一天,工作總結和思維導圖更配哦~

7

列個清單出來


做完工作回顧之後,你應該已經可以列出一個待辦事項清單了。

首先是對於任務中能立馬跟進的事情,比如之前已經發出對方還沒有回覆的郵件可以再發一封作為提醒。

對於比較複雜難以立馬解決的任務,分類彙總列出來。串列的時候要註意,如果一開始就進入到方案設計等複雜的工作中,可能會比較難打開思路。優先處理溝通協調類的工作,例如信息同步、郵件跟進之類。

這裡還有個小心機,一般工作的第一周都會有周會,做好以上幾件事情,就能做到未雨綢繆。

最後,希望筆者的經驗對大家有所幫助。





更多Linux好文請點擊【閱讀原文】哦

↓↓↓

赞(0)

分享創造快樂