服務(wù)熱線:
13342898875
1、什么是IDC機房運維?
IDC機房機柜運維涉及到方方面面的問題,它不同于其他運維,處理的問題都是比較低沉的問題。在很多公司可能都是將服務(wù)器托管的到專門的IDC機房讓專業(yè)的人士進(jìn)行維護(hù),還有些大公司建有自己的IDC機房,但管理層面上可能只是網(wǎng)絡(luò)信息部門的一個子部門,但我們?nèi)砸鎸芏鄼C房管理的問題。IDC機房運維可以簡單的從五個方面來概括:主機監(jiān)控、信息統(tǒng)計、硬件維護(hù)、系統(tǒng)維護(hù)、網(wǎng)絡(luò)維護(hù)。處理這些問題就是IDC機房的運維
2、分層運維
我認(rèn)為我們所熟知的計算機能有今天的成就很大一個成功是在于它的模塊化設(shè)計,以及分層體系,現(xiàn)在我們用的PC的硬件是由CPU、內(nèi)存、硬盤、主板、輸入輸出設(shè)備等組成。正是這些模塊化的構(gòu)造讓人們對計算機的維護(hù)更加的方便,快捷。
現(xiàn)在我們正在步入云計算時代,云計算的實施卻是阻礙重重。但是云計算是必然的趨勢,因為這是人們對信息自由的渴望、是對資源合理利用的迫切需要。所以說云計算的發(fā)展也少不了用模塊化,分層次的進(jìn)行設(shè)計和優(yōu)化。
我們來看看云計算的分類 云計算可以認(rèn)為包括以下幾個層次的服務(wù):基礎(chǔ)設(shè)施即服務(wù)(IaaS),平臺即服務(wù)(PaaS)和軟件即服務(wù)(SaaS)。
我覺得我們現(xiàn)在的系統(tǒng)分層多且繁雜,無法體現(xiàn)我們在IDC機房的運維,我認(rèn)為IDC機房的運維應(yīng)該根據(jù)服務(wù)提供的角度去對IDC機房進(jìn)行維護(hù),從終端角度來看,所有提供網(wǎng)絡(luò)服務(wù)的資源都是一朵朵的網(wǎng)云。我們在IDC機房中的運維都是為了面向終端進(jìn)行服務(wù)。所以說我們應(yīng)該根據(jù)服務(wù)來對我們的IDC機房進(jìn)行運維。
我根據(jù)云計算服務(wù)的分類認(rèn)為我們在運維分層的問題上應(yīng)該和云服務(wù)的分類相呼應(yīng)來進(jìn)行維護(hù),所以我認(rèn)為,IDC機房的運維應(yīng)該分成:基礎(chǔ)設(shè)施維護(hù),耦合層維護(hù),應(yīng)用服務(wù)維護(hù)三個層面。
基礎(chǔ)設(shè)施維護(hù)
基礎(chǔ)設(shè)施維護(hù)顧名思義,指的是對設(shè)施設(shè)備的維護(hù),包括設(shè)備的環(huán)境維護(hù),設(shè)備的統(tǒng)計等等。在這個層面我們需要保證每一臺機器是可以正常連接的,是可以正常使用對外提供服務(wù)的,并且我們得保障機器的正常運行并且是可管理的。總的來說基礎(chǔ)設(shè)施層的維護(hù)是為了對耦合層的交付使用而服務(wù)的。
耦合層維護(hù)
在這個層面我們對設(shè)備有了統(tǒng)一的管理,在這個層面有系統(tǒng)性的架構(gòu)統(tǒng)一的管理系統(tǒng),指令系統(tǒng),和監(jiān)控系統(tǒng),在這個層面我們可以發(fā)現(xiàn)底層的問題,并交由底層處理,并在這個層面保證應(yīng)用服務(wù)的正常運行。在這個層面將會涉及負(fù)載均衡和備份等技術(shù)。
應(yīng)用服務(wù)維護(hù)
在這個層面主要是客戶對自己應(yīng)用的維護(hù),在這個層面里客戶對自己運行的運營軟件進(jìn)行維護(hù)。
當(dāng)然這個分層的維護(hù)只是個萌生概念,如果有一天這個理論可以被建立,相信會被更加的完善。并且為我們更好的理解運維體系服務(wù)。
3、運維工程師
在我之前有很多人都對運維工程師進(jìn)行過很多定義,大家都說運維工程師是神仙,不是人干的活。因為運維工程師所承擔(dān)的東西太多了,這讓很多做運維工作的朋友們都表示傷不起啊。我們可以來看看以前別人是怎么來定義運維工程師的。
運維工作師需要什么樣的技能及素質(zhì)
做為一名運維工程師需要什么樣的技能及素質(zhì)呢,首先說說技能吧,如大家上面所看到,運維是一個集多IT工種技能與一身的崗位,對系統(tǒng)->網(wǎng)絡(luò)->存儲->協(xié)議->需求->開發(fā)->測試->安全等各環(huán)節(jié)都需要了解一些,但對于某些環(huán)節(jié)需熟悉甚至精通,如系統(tǒng)(基本操作系統(tǒng)的熟悉使用,*nix,windows..)、協(xié)議、系統(tǒng)開發(fā)(日常很重要的工作是自動運維化相關(guān)開發(fā)、大規(guī)模集群工具開發(fā)、管理)、通用應(yīng)用(如lvs、ha、webserver、db、中間件、存儲等)、網(wǎng)絡(luò),IDC拓樸架構(gòu)等等,但是我們知道每個人不肯能樣樣都很精通,每個人的知識層面不可能像水桶一樣,我不否認(rèn)這種人的處在,但是人的精力是有限的,一個人挖10口1米的井估計很難挖出水來,但是一個人挖一口10米的井我想挖出水的可能性還是很高的。所以說如果運維工程師通過分層運維將運維的知識面分開來進(jìn)行突破,我想運維水平的提高指日可待,運維工程師的工作負(fù)擔(dān)也會相應(yīng)的減輕。
那么運維工程師在技能和個人素質(zhì)方面需要什么要求呢?
我覺得在技能方面不需要過分去強求,只要懂得計算機的基本原理等計算機知識就可以,其他的個方面知識都可以通過后天的培養(yǎng)獲得。
在個人素質(zhì)方面應(yīng)該具備以下幾點:
1.溝通能力、團隊協(xié)作:運維工作跨部門、跨工種工作很多,需善于溝通、并且團隊協(xié)作能力要強;這應(yīng)該是現(xiàn)代企業(yè)的基本素質(zhì)要求了,不多說。
2.工作中需膽大心細(xì):膽大才能創(chuàng)新、不走尋常路,特別對于運維這種新的工種,更需創(chuàng)新才能促進(jìn)發(fā)展;心細(xì),運維工程師是網(wǎng)站admin,最高線上權(quán)限者,一不小心就會遺憾終生或打入十八層地獄。
3.主動性、執(zhí)行力、精力旺盛、抗壓能力強:由于IT行業(yè)的特性,變化快;往往計劃趕不上變化,運維工作就更突出了,比如國內(nèi)各大公司服務(wù)器往往是全國各地,哪里便宜性價比高,就那往搬,進(jìn)行大規(guī)模服務(wù)遷移(牽扯的服務(wù)器成百上千臺),這是一個非常頭痛的問題;往往時間非常緊迫,如限1周內(nèi)完成,這種情況下,運維工程師的主動性及執(zhí)行力就有很高的要求了:計劃、方案、服務(wù)無縫遷移、機器搬遷上架、環(huán)境準(zhǔn)備、安全評估、性能評估、基建、各關(guān)聯(lián)部門扯皮,7X24小緊急事故響應(yīng)等。
4.其它就是一些基本素質(zhì)了:頭腦要靈光、邏輯思維能力強、為人謙虛穩(wěn)重、親和力、樂于助人、有大局觀。
5.最后一點,做網(wǎng)站運維需要有探索創(chuàng)新精神,通過創(chuàng)新型思維解決現(xiàn)實中的問題,因為這是一個處于幼年的職業(yè)(國外也一樣,但比國內(nèi)起步早點),沒有成熟體系或方法論可以借鑒,只能靠大家自已摸索努力。
4、機房運維技術(shù)體系
在機房中我們要面對各種各樣的事情,如服務(wù)器上架,服務(wù)器下架,處理問題服務(wù)器等等。在機房運維中我覺得也應(yīng)該建立起我們的技術(shù)體系,從這幾方面入手使得我們的機房運營的更加平穩(wěn)健康。
1.監(jiān)控體系,一個健壯的身體里不開每天的觀察,我們需要時時刻刻觀察我們的機房,看看機房發(fā)生的細(xì)小問題,所以說強大而有健全的監(jiān)控體系有利于我們更好的維護(hù)我們的機房。
2.統(tǒng)計體系,在IDC機房我們管理著數(shù)以百計的服務(wù)器,統(tǒng)計工作可馬虎不得,每一臺機器的配置,存放機柜位置等等,都關(guān)系著數(shù)千元的設(shè)備的物理安全,其他的還有帶寬安全等等。數(shù)量少還好,數(shù)量一多就有可能出錯,如何快速高效的統(tǒng)計,并不出錯也是門技術(shù)。所以單獨為一個體系也是有必要的。
3.故障管理體系,在機房中我們要處理每一臺服務(wù)器發(fā)生的故障,有些問題很棘手,有些問題很簡單,但大多數(shù)問題都有相似性,可以參考其他問題的處理過程處理,良好的故障管理體系肯定是有助于我們快速的響應(yīng)和處理問題的。
4.自動化體系,太多的手動執(zhí)行大大影響了我們處理問題的工作效率,機房運維引入自動化的理念開發(fā)自動化管理工具可以大幅度的提高我們機房的管理效率。
5.評估優(yōu)化體系,正所謂人無完人,在好的東西也有不好的地方,如IPONG待機時間短,建立評估優(yōu)化體系使得我們可以在定期的時間內(nèi)發(fā)現(xiàn)我們不足的地方,更好的優(yōu)化我們的不足之處。
5、如何成為一個合格的運維工程師
我認(rèn)為做好IDC機房的運維就是要保障最底層的運維維護(hù)安全。如何高效的維護(hù)好底層的設(shè)備是每一個IDC運維工程師應(yīng)當(dāng)具備的職責(zé)。我們可以做好以下幾個方面。
第一、 統(tǒng)計記錄好機房機器運行的信息。如上下架記錄,故障處理記錄,監(jiān)控記錄等等,做到高效快速的統(tǒng)計好所有機房信息。
第二、 監(jiān)控。熟悉和掌握監(jiān)控軟件的使用,做到可以更具監(jiān)控工具的組合應(yīng)用定位故障點,初步反應(yīng)故障原因等。
第三、 通過創(chuàng)新思維以及熟練操作提高并解決運維效率問題;目前各公司大部份運維主要工作還是依賴人工操作干預(yù),需要盡可能的解放雙手。以及熟悉每一個運維環(huán)節(jié)的操作。
第四、 運維知識的積累與沉淀、文檔的完備性。運維是一個經(jīng)驗性非常強的崗位,好的經(jīng)驗與陷阱都需積累下來,避免重復(fù)性范錯。并且可以在相似問題發(fā)生的情況下快速反應(yīng)。
第五、 有計劃的做事;工作有計劃,計劃后想方設(shè)法達(dá)到目標(biāo),不找借口。機房運維工作大多都比較少,通常都是處理問題,但有很多事情是需要定期去做的,比如統(tǒng)計、評估、優(yōu)化等等。
6、運維職業(yè)的迷惘、現(xiàn)狀與發(fā)展前景
運維崗位不像其它崗位,如研發(fā)工程師、測試工程師等,有非常明確的職責(zé)定位及職業(yè)規(guī)劃,比較有職業(yè)認(rèn)同感與成就感;而運維工作可能給人的感覺是哪方面都了解一些,但又都比上專職工程師更精通、感覺平時被關(guān)注度比較低(除非線上出現(xiàn)故障),慢慢的大家就會迷惘,對職業(yè)發(fā)展產(chǎn)生困惑,為什么會有這種現(xiàn)象呢? 除了職業(yè)本身特點外,主要還是因為對運維了解不深入、做得不深入導(dǎo)致;其實這個問題其它崗位也會出現(xiàn),但我發(fā)現(xiàn)運維更典型,更容易出現(xiàn)這個問題;針對這個問題我談一下機房運維的現(xiàn)狀及發(fā)展前景(也在思考中,可能不太深入全面,也請大家斧正補充)
運維現(xiàn)狀:
1.處于剛起步的初級階段,各大公司有此專職,但重視或重要承度不高,可替代性強;小公司更多是由其它崗位來兼顧做這一塊工作,沒有專職,也不可能做得深入
2.技術(shù)層次比較低;主要處于技術(shù)探索、積累階段,沒有型成體系化的理念、技術(shù)。
3.體力勞動偏大;這個問題主要與第二點有關(guān)系,很多事情還是依靠人力進(jìn)行,沒有完成好的提練。
發(fā)展前景:
1.從個人角度,運維工程師技術(shù)含量及要求會越來越高,同時也是對公司應(yīng)用、架構(gòu)最了解最熟悉的人、越來越得到重視。
2.運維將成為一個融合多學(xué)科(網(wǎng)絡(luò)、系統(tǒng)、開發(fā)、安全、應(yīng)用架構(gòu)、存儲等)的綜合性技術(shù)崗位,給大家提供一個很好的個人能力與技術(shù)廣度的發(fā)展空間。
3.運維工作的相關(guān)經(jīng)驗將會變得非常重要,而且也將成為個人的核心競爭力,具備很好的各層面問題的解決能力及方案提供、全局思考能力等。
4.特長發(fā)控和興趣的培養(yǎng);由于運維崗位所接觸的知識面非常廣闊,更容易培養(yǎng)或發(fā)揮出個人某些方面的特長或愛好,如內(nèi)核、網(wǎng)絡(luò)、開發(fā)、數(shù)據(jù)庫等方面,可以做得非常深入精通、成為這方面的專家。
5.如果真要以后不想做運維了,轉(zhuǎn)到其它崗位也比較容易,不會有太大的局限性。當(dāng)然了,你得真正用心去做。
6.技術(shù)發(fā)展方向、網(wǎng)站/系統(tǒng)架構(gòu)師。
13342898875