導航:首頁 > IDC知識 > 伺服器自動化運維

伺服器自動化運維

發布時間:2021-02-23 14:19:51

1、怎樣構建基於SDN網路的自動化運維系統

運維包括告抄警監控、統計分析、運襲維自動化和運維系統的建設。SDN自動化運維系統,這個系統並不是一個平台、一個工具,而是一個體系、一個方法。平台是運維系統的一部分,運維自動化完全跟開發相關,它不在平台內,平台內更多的是監控告警、統計分析,做到運維系統的建設。運維自動化更多的與 DevOps 相關。
SDN自動化運維架構體系目前從SDN系統來講從最底層的資源,網路設備、轉發網元、設備、伺服器,採集部分開始,主要涵蓋 SNMP 的採集,對傳統設備 Netconf 命令下發,對新設備 Openflow 的協議,對CLI的管理。
中間的存儲是獨立分開的,中間有日誌、配置庫、知識庫,在存儲部分獨立分開。功能方麵包括監控告警和數據採集,數據分析和統計,流程管理和項目管理,有很大一部分是資源管理,資源管理包括文檔配置,這部分主要基於CMDB,功能非常強大,如何結合SDN系統用起來,要根據自己網路底層和控制器開發做制定。
內容來源於ITSS符合性評估落地工具-雲雀運維!!!

2、為什麼用python實現自動化運維

經常有人在群里問,運維人員需不需要學開發?需不需要學 PYTHON ? PYTHON 和 SHELL 有什麼區別?天天問這種好水的問題,我實在受不了,決定幫大家掃掃盲,求求新手們,以後別他媽瞎問了。

現階段,掌握一門開發語言已經成為高級運維工程師的必備計能,不會開發,你就不能充分理解你們系統的業務流程,你就不能幫助調試、優化開發人開發的程序, 開發人員有的時候很少關注性能的問題,這些問題就得運維人員來做,一個業務上線了,導致 CPU 使用過高,內存佔用過大,如果你不會開發,你可能只能查到進程級別,也就是哪個進程佔用這么多,然後呢?然後就交給開發人員處理了,這樣咋體現你的價值?

另外,大一點的公司,伺服器都上幾百,上千,甚至數萬台,這種情況下怎樣做自動化運維?用 SHELL 寫腳本 FOR 循環?呵呵,歇了吧, SHELL 也就適合簡單的系統管理工作。到復雜的自動化任務還得要用專門的開發語言。你可能說了,自動化管理有專門的開源軟體\監控也有,直接拿來用下就好了,但是現有的開源軟體如 puppet\saltstack\zabbix\nagio 多為通用的軟體,不可能完全適用你公司的所有需求,當你需要做定製、做二次開發的時候,你咋辦?找開發部門?開發部門不懂運維的實際業務邏輯,寫出來的東西爛爛不能用,這活最後還得交給運維開發人員來做。

3、自動化運維有什麼優勢和特點?

自動化運維(AMP)特色功能介紹

監控警告相關

1 大規模監控能力

AMP架構具有大規模橫向擴展能力,通過橫向擴展,AMP能實現同時對上萬台設備的監控,監控項數目可達百萬級別。


2 全方位監控告警

通過AMP,可以實現對硬體信息(含CPU溫度,電壓),主機,存儲,雲主機(VMWare),網路設備,操作系統,中間件,資料庫,應用(撥測,業務指標),通過統一監控告警。覆蓋幾乎所有主流IT軟硬體設備。


3 靈活的警告策略

通過靈活的告警策略配置,實現精確告警,避免告警風暴,減少無效告警,降低運維壓力。


4 告警自動消除

自動告警處理:根據告警觸發條件預定義相應的運維操作,自動調度運維操作以消除告警,例如:文件系統空間已滿,則可以預設清除日誌的操作,降低告警處理工作量,極大的提高了告警處理的及時性,降低系
統故障影響業務的風險。


5 資料庫專業化監控

通過資料庫專業配置庫、SQL語句、會話、等待事件、前瞻性趨勢分析,建立專業化的資料庫監控體系,為資料庫性能優化、預防性維護、故障分析、擴容規劃提供全方位支撐。


通過資料庫專業化監控,可實現資料庫資源消耗精確分析、優化以及預測;可精確的掌握資料庫的配置變更。通過資料庫運維自動化工具,快速定位資料庫性能問題,大大提高運維效率。

 監控多維度TOP SQL,提供輔助SQL優化工具,提升工作效率;

 預測容量短缺和瓶頸出現時間;

 監控阻塞會話、長會話、細化異常等待事件監控,預防故障;

 Oracle資料庫緩存命中率、SGA大小、PGA大小等指標;

 針對獲取到的指標進行自動分析,並提供圖表、列表等方式展現;

 通過上述信息,運維人員能迅速定位資料庫性能問題,降低故障恢復時間。


6 自動化發現、接入向導功能

自發現功能可以自動發現設備,VMWare虛擬機,並添加到系統監控,可以自動發現設備文件系統目錄,網路介面以及資料庫表空間信息。


接入向導,能一次性快速接入數百台節點。採用向導方式提供從客戶端操作文檔下載、批量導入設備、自發現設備、接入校驗到接入完成後的指引整個接入流程,可快速完成設備接入。


自動化運維相關

7 自動化巡檢

自動化巡檢對象包括主機、資料庫、中間件、應用在內的所有監控對象;自動化巡檢無需另外單獨進行部署,直接使用系統監控採集項;系統已經預定義了資料庫、中間件、主機等的部分日常標准巡檢;

可通過平台自動獲取巡檢結果,避免失誤、遺漏,確保巡檢結果的准確性、全面性。

巡檢的指標、巡檢范圍可以根據需求擴展。

運維人員把更多的時間花在對巡檢結果的分析中,從而確保系統健康、穩定運行。


8 文件批量下發

在平台上,上傳需要下發的文件後,在平台上點選文件需要被下發的主機,即可以在數百台機器上,迅速下發文件。


9 腳本管理、遠程批量執行

腳本管理功能對平常運維工作中常用的腳本(Shell/Python/Per/Sqll)或者命令行進行統一管理,用於完成日常運維操作,目前系統已內置常見告警的預處理腳本,腳本管理功能有利於維護經驗的沉澱;

腳本管理工作流程:採用向導方式進行新增腳本、腳本配置、腳本測試、腳本執行下發;

可對腳本進行手動執行或者自動定時執行;

在平台上,通過點擊的操作方式,在多台主機上遠程執行相應的運維操作。


 10 自動化補丁管理

結合漏掃結果,匹配相應的補丁集合,一鍵進行補丁集分發;

根據具體運維安排,運維人員一鍵遠程執行補丁安裝操作。


 11 自動化部署

自動化部署功能通過部署模板、部署方案、部署日誌、部署統計實現對日常應用部署工作的管理,可幫組運維人員實現可視化、自動化的應用程序部署:完成備份、更新應用程序包、清理緩存、啟停應用服務進程
、部署校驗、部署回退等操作。


部署模板:包含部署基本信息、軟體包信息、伺服器信息、下發資料路徑、備份路徑並定義了應用程序部署流程信息的模板。


部署方案:在部署模板的基礎上新建的用於部署特定版本應用程序的方案。需輸入應用程序包、SQL腳本信息,共用部署模板中的部署基本信息、軟體包信息、伺服器信息、下發資料路徑、備份路徑信息,可重新定義
應用程序部署流程信息。


12 自動化故障診斷

通過將故障診斷標准化、流程化、自動化、智能化,能夠快速、全面的進行故障診斷、診斷信息收集、告警自動恢復,可減少故障處理時間30分鍾以上,降低業務風險。

將常用的診斷命令記錄為診斷腳本。可直接對主機執行診斷腳本查看執行結果;

 由多個診斷腳本組合成一個診斷方案。可針對告警自動執行診斷方案,收集寶貴的動態診斷信息;

將多個診斷方案組合成一個診斷預案。可實現全方位、標准化的應急操作預案,解決人工執行腳本遺漏、不規范等問題。


13 資產配置自動獲取

系統可以實現對資產配置信息的自動獲取,無需人工更新,有利於實時掌握資產最新動態。

實現了主機的操作系統、IP地址、MAC地址、CPU核數、CPU型號、內存大小、存儲空間等固定資產信息的自動獲取;

可自動判斷主機上的應用軟體類型:是否安裝FTP、資料庫、中間件等;

結合主機的資源利用情況,可全面了解資產的配置以及利用情況。


14 配置文件變更管理

可實現主機、資料庫、中間件等配置信息抓取;

可設立基線,實現配置文件與基線版本比對,快速發現變更情況。

4、傳統的IT運維系統和自動化IT運維系統有什麼差別?

目前許多企業的IT運維雖然已經實現從人工運維到計算機管理,但這只是處在「半自動化」的運維狀態。因為這種IT運維仍然是等到IT故障出現後再由運維人員採取相應的措施,所以傳統被動的、孤立的、半自動式的IT運維管理模式經常是讓IT部門疲憊不堪。而現在的IT運維自動化是指基於流程化的框架,將事件與IT流程相關聯,一旦被監控系統發生性能超標或宕機,會觸發相關事件以及事先定義好的流程,可自動啟動故障響應和恢復機制。自動化工作平台還可幫助IT運維人員完成日常的重復性工作(如備份,殺毒等),提高IT運維效率。
隨著信息時代的持續發展,IT運維已經成為IT服務內涵中重要的組成部分。面對越來越復雜的業務,面對越來越多樣化的用戶需求,不斷擴展的IT應用需要越來越合理的模式來保障IT服務能靈活便捷、安全穩定地持續保障,這種模式中的保障因素就是IT運維(其他因素是更加優越的IT架構等)。從初期的幾台伺服器發展到龐大的數據中心,單靠人工已經無法滿足在技術、業務、管理等方面的要求,那麼標准化、自動化、架構優化、過程優化等降低IT服務成本的因素越來越被人們所重視。其中,自動化最開始作為代替人工操作為出發點的訴求被廣泛研究和應用。
IT運維從誕生發展至今,自動化作為其重要屬性之一已經不僅僅只是代替人工操作,更重要的是深層探知和全局分析,關注的是在當前條件下如何實現性能與服務最優化,同時保障投資收益最大化。自動化對IT運維的影響,已經不僅僅是人與設備之間的關系,已經發展到了面向客戶服務驅動IT運維決策的層面,IT運維團隊的構成,也從各級技術人員佔大多數發展到業務人員甚至用戶佔大多數的局面。
因此,IT運維自動化是一組將靜態的設備結構轉化為根據IT服務需求動態彈性響應的策略,目的就是實現IT運維的質量,降低成本。可以說自動化一定是IT運維最高層面的重要屬性之一,但不是全部。

5、如何做好python自動化運維

隨著移動互聯網的普及,伺服器運維所面臨的挑戰也隨之越來越大。當規模增長到一定程度,手動管理方式已經無法應對,自動化運維成為解決問題的銀彈。Python憑借其靈活性,在自動化運維方面已經被廣泛使用,能夠大大提高運維效率,伺服器集群的規模越大,優勢越明顯。現在不論是Linux運維工程師還是Unix運維工程師都需要掌握Python,以提高運維效率。

第一個階段:初級,掌握Python的語法和一些常用庫的使用

掌握一門語言最好的方法就是用它,所以我覺得邊學語法邊刷Leetcode是掌握Python最快的方式之一。

很多隻需要將Python作為腳本或者就是寫一些小程序處理處理文本的話,到這一個階段就足夠了,這個階段已經可以幫我們完成很多很多的事情了。但是如果是一個專業學習Python的,恐怕還需要努力的升級:首先,國內的大多數人都是學習了其他語言(C,C++,Java等)之後來學習Python的,所以Python和這些語言的不同,也就是pythonic的東西需要一些時間去學習了解和掌握;另外,對於自己領域的領域的庫構架的掌握也需要很長的時間去掌握;最後,如果想獨立完成一個Python的項目,項目的布局,發布,開源等都是需要考慮的問題。

第二個階段:中級,掌握自己特定領域的庫,掌握pythonic寫法,非常熟悉Python的特性

推薦的第一本書是《編寫高質量代碼–改善python程序的91個建議》,這本書大概的提了下Python工程的文件布局,更多的總結了如何寫出pythonic的代碼,另外,也介紹了一些常用的庫。

這里首先推薦在騰訊官方課程渠道上進行直播學習,有號就能無償一直學,每天晚上都是高清直播(企鵝球球:1129中間是834最後加上這個903連在一起就能夠了),除此之外基於python2.7在網上的書籍適合於重頭開始一直讀完,作為一個開發人員,除了基本的語法,這本書裡面提到了一些其他的常用的庫,看了廖老師寫的很多東西,感覺他的思路,以及寫博客寫書的高度,概括性,原理性都十分好,這本書讀完之後,相信就能夠動手寫很多東西了,能夠盡情的玩轉Python解說器了。

要想深入的了解Python,有的時候看看Python的源碼也是很重要的,自己通過讀懂源碼,來徹底的了解Python的核心機制,這里推薦《Python源碼剖析——深度探索動態語言核心技術》,這本書並沒有看完,只是在需要深入了解Python某個功能或者數據結構的時候看看相關章節,也覺得受益匪淺。

自己領域的書籍和資料也肯定很多,比如web開發的構架都有很多,只有了解熟悉了所有構架,在選擇的時候才能衡量利弊,然後深入掌握某些構架。

6、IT運維自動化的什麼是IT運維自動化

隨著信息時代的持續發展,IT運維已經成為IT服務內涵中重要的組成部分。面對越來越復雜的業務,面對越來越多樣化的用戶需求,不斷擴展的IT應用需要越來越合理的模式來保障IT服務能靈活便捷、安全穩定地持續保障,這種模式中的保障因素就是IT運維(其他因素是更加優越的IT架構等)。從初期的幾台伺服器發展到龐大的數據中心,單靠人工已經無法滿足在技術、業務、管理等方面的要求,那麼標准化、自動化、架構優化、過程優化等降低IT服務成本的因素越來越被人們所重視。其中,自動化最開始作為代替人工操作為出發點的訴求被廣泛研究和應用。
IT運維從誕生發展至今,自動化作為其重要屬性之一已經不僅僅只是代替人工操作,更重要的是深層探知和全局分析,關注的是在當前條件下如何實現性能與服務最優化,同時保障投資收益最大化。自動化對IT運維的影響,已經不僅僅是人與設備之間的關系,已經發展到了面向客戶服務驅動IT運維決策的層面,IT運維團隊的構成,也從各級技術人員佔大多數發展到業務人員甚至用戶佔大多數的局面。
因此,IT運維自動化是一組將靜態的設備結構轉化為根據IT服務需求動態彈性響應的策略,目的就是實現IT運維的質量,降低成本。可以說自動化一定是IT運維最高層面的重要屬性之一,但不是全部。

7、python自動化運維是做什麼的

隨著技術的進步、業務需求的快速增長,一個運維人員通常要管理上百、上千台版伺服器權,運維工作也變的重復、繁雜。把運維工作自動化,能夠把運維人員從伺服器的管理中解放出來,讓運維工作變得簡單、快速、准確;運維自動化是一組將靜態的設備結構轉化為根據IT服務需求動態彈性響應的策略,目的就是實現IT運維的質量,降低成本。

相關推薦:《Python入門教程》

運維自動化設計思想:

管理體系化

工作流程化

人員專業化

任務自動化

任務自動化

環境定義自動化

部署自動化

監控自動化

為什麼選python做自動化運維

自動化運維關心問題:

自動化

易實現

跨平台

輕量級

適合自動化運維編程語言特點:

豐富的第三方庫

學習成本低

跨平台

輕量級

8、數據自動化運維應該注意哪些事項

一、基礎數據概況

CMDB中文是配置管理資料庫,存儲與管理企業IT架構中設備的各種配置信息,與未來的IT運維管理標准化和流程化緊密關聯,並且支持流程的運轉。運維管理平台創建初期或初版中的CMDB更多是偏向IT資產管理,我們在這里定義的IT資產管理,暫時拋除公司個人使用的普通PC機。

日誌主要存儲CMDB中涉及到伺服器或是其它設備的日誌信息。

DB主要是所有IT系統的資料庫信息,包括運維管理系統本身的資料庫。由於資料庫的重要性,所以在基礎數據中單獨一個模塊管理資料庫,包括生產資料庫、測試資料庫、開發資料庫。資料庫的日誌放在日誌模塊進行統一管理,監控和備份。

知識庫主要存儲日常運維管理中發生的事件、問題以及一些經典問題的解決和常用的解決方案,主要起到運維管理輔助的功能。

二、基礎數據三要素

基礎數據要求完整、准確、實時,這三個特性缺一不可。

1.完整性

完整性,要求在數據採集整理階段,要一一梳理,不能有遺漏。任何一個設備的疏漏都將會導致未來出現問題。例如最近的勒索病毒在防範上需要給伺服器升級打補丁,這個時候就是根據伺服器清單一一對照,升級。如果有遺漏落下的伺服器未及時打補丁而導致病毒入侵,後果將很嚴重。那麼,如何做到完整性呢?大致可以分為以下幾步:

首先數據採集階段多人(推薦三人以上)同時對IT資產進行採集,那麼在數據採集完成後,將會有三份或以上的IT資產清單。

接下來就是相互確認階段。相互check對比兩方的清單和自己梳理的清單,找到不一樣的地方,大家在一起開會進行討論。經過這個階段,會產生一份相對完整且三方(或以上)認可的IT資產清單。

最後就是三方(或以上)一同針對認可的IT資產清單進行最終check,確保最後的清單,是經過多方討論確認,並最終又check過的IT資產清單。此時這份IT資產清單,相對比較完整。另外在梳理、討論和check的過程中,針對新增、變更、刪除的IT資產一定要及時更新我們的IT資產清單。

2.准確性

准確性要求IT資產清單或是CMDB中存儲的數據不能與實際情況有任何差異。要做到基礎數據的准確性除了在數據採集階段要下功夫外,要在運維管理的每一個階段定期對基礎數據進行審計,確保基礎數據中的數據無誤。一般月度一小審,半年一大審,具體情況根據企業的IT規模而定。

3.實時性

基礎數據的實時性可以確保數據的准確性。即基礎數據的每一次變動,包括增加、刪除、修改,不論大小,只要有變動(在運維流程完結階段,執行運維操作成功後,就要及時更新基礎數據。忽略基礎數據的實時性,必將導致准確性大打折扣,在以後的月審、年審中必將導致額外的工作量。一般在審計的過程中,當數據的錯誤率達到一定程度後,需要重新梳理全部數據,以確保最終的准確和完整。

CMDB

CMDB總的來說分為:產品線、資產管理、供應商管理三個部分。

總的思路是:通過產品線管理IT資產,通過IT資產信息管理硬體或服務提供者,供應商管理。

1.產品線

產品線是指整個公司所有IT系統、產品按照屬性進行歸類劃分。這有一個前提,就是梳理整個公司的IT項目和IT服務。這里項目也可以理解為每一套IT系統,例如OA、CRM、訂單系統、支付系統等等。

IT服務主要是指:應用服務(Tomcat、WebLogic、資料庫服務等),基礎IT服務如Nginx、Varnish、Redis等。通過項目和服務兩個維度來管理IT資產,尤其是虛擬機。因為一般系統和服務都是部署在虛擬機上,虛擬機的宿主機則是一台台物理主機。

產品線的劃分一般除了根據業務分類劃分幾個大的產品線外,還需要劃分一些基礎產品線,如:信息安全產品線,主要管理信息安全、網路安全等系統和設備等;基礎服務產品線,如Nginx反向代理大部分系統,Varnish緩存Web靜態資源等。

在這里單獨說一下產品線和項目包括的服務必須制定運維優先順序等級。運維等級的制定不能簡單定義為多少級,而應該是為每一套系統進行運維優先順序打分,分值不能一樣。這樣保證在大面積故障的時候,可以根據優先順序解決問題。

2.資產管理

資產管理主要有以下幾個方面。

首先是比較大的機房管理。有的企業可能會有多個機房,每個機房的基礎信息,如帶寬、位置、值班電話等都需要加以整理存儲用來管理機房信息。機房中的機架、機櫃、交換機、路由器等硬體信息,機房的空調、UPS電源、環境監測系統等都屬於機房管理的范疇。

安全設備管理。安全設備管理這里主要包含防火牆、IPS、WAF、VPN等網路設施。企業信息安全非常重要,在運維管理中也把安全作為一個單獨的模塊進行管理。通過購買安全硬體設備和安全服務,不斷學習和研究,從而保護好企業數據信息。

伺服器管理。這里假定企業實現了虛擬化,大部分系統和服務都部署在虛擬機,而虛擬機是部署在物理機上。伺服器管理分物理機和虛擬機分開管理,同時又密切關聯。虛擬機在哪一台或幾台物理機需記錄清楚。

根據產品線中定義的運維優先度等級,在資產管理中的每一個節點標註上相應的等級分值,以便出現大規模故障,有選擇、有重點、有順序地逐一解決問題。

3.供應商管理

供應商管理主要是管理由第三方企業提供的IT系統或設備的服務信息。記錄供應商的具體信息、值班電話、硬體備件庫等信息。

以上幾個模塊單獨管理,但是又密切相連。如產品線包含哪些項目,包含哪些服務,這些項目和服務部署在哪些虛擬機上,虛擬機又在哪一些物理機上,物理機分布在哪些機房和在機房中的具體位置,物理機在機房中的網路位置和網路架構如何,經過哪些安全設備等等。

反過來需要知道某一些機房有哪一些物理機,物理機位置,安全設備,以及安全設備與物理機的網路架構等,物理機上又有哪些虛擬機上部署了哪一些項目和服務等。系統和服務屬於哪些供應商提供,供應商又提供了哪些系統、設備或伺服器等。都要多維度進行管理。要求做到某一環節的故障,一查就知道所有受影響的系統和服務。CMDB中的信息相互交織,多維度查詢和管理,構建出一張完整的總體架構圖,通過總體架構圖除了展現出各個部分的基礎信息外,還描述了所有的依賴關系,做到壞一點而知全面。

日誌

通過日誌可以比較准確全面地知道系統或是設備的運行情況,可以返查問題產生的原因,還原問題發生的整個過程。通過日誌也可以提前預測系統可能要發生的問題或是故障,如系統安全日誌,如果網路攻擊會在系統安全日誌中有一定的體現。

1.系統日誌

系統日誌主要指的是操作系統的日誌,主要在/var/log下的各種日誌信息。包含系統操作日誌、系統安全日誌、定時任務日誌等。系統日誌是運維管理安全模塊中審計的重要依據。一般默認的操作系統日誌不能滿足要求,需要對系統的參數進行修改,如為history命令加上時間戳、IP,並且長久保留歷史等功能。並且對日誌文件進行處理,不允許用戶進行清空命令,只能append。

2.應用日誌

應用日誌主要記錄應用服務的健康運行情況以及業務操作的具體日誌兩部分。應用監控運行情況反應應用服務的健康狀態,如果應用佔用CPU或是內存過高或是忽高忽低不定,都可以通過分析應用日誌結合業務操作日誌得出結論。業務操作日誌可以為業務審計提供主要依據。有一些系統喜歡把業務操作日誌寫到資料庫中,這個也是需要注意的。不過不管在哪個地方,要求是不可缺少的,它為以後業務審計和問題返查提供依據。

3.資料庫日誌

資料庫日誌主要反饋資料庫的運行情況。通過監控和管理資料庫的日誌,及時了解資料庫的運行情況,遇到問題及時解決等。可以通過資料庫日誌結合資料庫系統自帶的資料庫如Oracle的系統視圖v$開頭,MySQL的performance_schema等。雖然資料庫的一些信息不是存在日誌中而是在資料庫裡面,但是也可以作為資料庫日誌的一部分進行管理和監控,已便我們及時知道資料庫的監控狀況,從而預防可能出現的問題。

4.設備日誌

設備日誌一般是一個比較容易忽略的地方,但設備日誌往往可以反映設備的運行情況。交換機故障,防火牆故障等設備故障都可能引起大面積的系統和服務故障。所以設備日誌一定要收集,分析和監控預警。常用的設備日誌有交換機日誌、防火牆日誌、網路安全設備日誌等。

在CMDB中梳理的IT基礎設施的基礎上,對日誌進行分類收集、管理、分析和監控,配著監控管理模塊的系統,就已經可以達到多方位監控IT系統,保障IT系統的安全穩定。

DB

由於數據和資料庫的重要性,在基礎數據中,資料庫作為單獨的模塊存在,根據環境劃分為:生產資料庫、測試資料庫、開發資料庫。嚴格區分三種環境的資料庫,避免測試數據到生產環境,生產數據到測試環境等。另外資料庫中數據也為業務監控提供數據依據。通過查詢資料庫中的數據,依據業務邏輯進行判斷是否有錯誤或是遺漏的數據。

知識庫

知識庫在整個運維管理中是一個輔助功能,主要為運維提供事件管理、問題管理。很多朋友可能會疑惑為什麼把事件庫和問題庫放在知識庫這里,這些不是應該在CMDB中嗎?這里稍微解釋一下,其實本人也並不太清楚這種辦法是否可行。在CMDB模塊中更多是偏向IT資產管理,為以後的運維操作提供運維范圍和運維目標。而事件(主要指運維過程中遇到的所有的運維事件)和問題(需要進行變更發布才能解決的事件升級)更多是在IT資產之上,是解決IT資產的過程中遇到的事件和問題。如果把CMDB作為IT運維的基礎管理對象和范圍目標的話,事件和問題應該單獨出來。也許在後面的運維管理中,逐漸強化CMDB的功能,會把事件庫和問題庫回歸到CMDB模塊中。

知識庫中還包含經典案例庫,主要是解決一些常遇故障、經典問題的解決方法的整理和歸檔。

解決方案庫只要是一些常用的或是探索中的解決方案,例如:Nginx+Tomcat+Redis部署方案,FastDFS分布式文件伺服器方案等。

文檔庫主要用來存儲運維管理過程中執行的運維標准和規范以及運維的流程規范,常用的一些規范舉例:

文檔庫也包括一些企業或是部門的規章制度,與供應商的合同條文等。主要是涉及到IT系統文檔的一個存放和查閱的地方。

運維標准和運維流程的文檔一定是必不可少的。因為運維自動化的前提就是運維的標准化和流程化。如果沒有明確的標准和規范的流程,運維自動化就只能一直停留在測試環境的假想空間中。

總結

基礎數據在整個運維管理中起到基礎、奠基的重要作用,也是做運維管理平台的第一步和以後每一步的重要依據。一定要捨得投入時間、人力等來建立起完整、准確、實時的基礎數據。打好地基,以後運維的每一步都將有條不紊地循序漸進,終將建設成屬於運維的高樓大廈。

9、運維自動化對運維人員的要求包括有哪些

這個主要包括他們的人員要求的話,就是說在他的就是或者是說的他的要求說明書裡面或者是他的規定規章制度裡面都會有單位的話可以查看一下。

與伺服器自動化運維相關的知識