“都是被逼的,在成本和技術(shù)的雙重壓力下,我們不得不對(duì)現(xiàn)有的IT系統(tǒng)進(jìn)行調(diào)整和優(yōu)化,最終從傳統(tǒng)IT架構(gòu)走上了開源的、分布式架構(gòu)。”面對(duì)至頂網(wǎng)記者,中國(guó)鐵路信息技術(shù)中心技術(shù)支持部部長(zhǎng)高明星坦言。
高明星所在的中國(guó)鐵路信息技術(shù)中心承擔(dān)了中國(guó)鐵路總公司本地信息系統(tǒng)的建設(shè)和運(yùn)維任務(wù),其中就包括我們所熟知的12306網(wǎng)站的后臺(tái)保障。隨著公司業(yè)務(wù)規(guī)模越來越大,數(shù)據(jù)中心從一個(gè)增加到多個(gè),服務(wù)器規(guī)模近萬臺(tái)的時(shí)候,不管是管理和運(yùn)維的成本還是對(duì)新應(yīng)用的支撐都給中國(guó)鐵路信息技術(shù)中心帶來很大的壓力。在這樣的背景之下,中國(guó)鐵路信息技術(shù)中心不得不尋求解決之道,IT優(yōu)化就是其中之一。
實(shí)際上,中國(guó)鐵路信息技術(shù)中心這個(gè)經(jīng)歷并不是個(gè)例,今天的IT已經(jīng)融入企業(yè)日常運(yùn)營(yíng)的點(diǎn)點(diǎn)滴滴之中,在不少企業(yè)中IT甚至成為企業(yè)運(yùn)營(yíng)中的一部分,企業(yè)業(yè)務(wù)也越來越離不開IT的支持,持續(xù)優(yōu)化IT成為越來越多公司共同的選擇。
點(diǎn)擊查看《企業(yè)開源智庫》之IT優(yōu)化高端對(duì)話視頻
壓力之下的IT優(yōu)化之路
作為中國(guó)鐵路總公司本地信息系統(tǒng)的建設(shè)者和維護(hù)者,中國(guó)鐵路信息技術(shù)中心的壓力主要來自幾個(gè)方面:一個(gè)是企業(yè)規(guī)??焖贁U(kuò)展。中國(guó)鐵路總公司的信息化建設(shè)經(jīng)過了40多年,特別是最近20多年的高速發(fā)展,機(jī)房面積已經(jīng)擴(kuò)張到2000多平米,上萬臺(tái)/套的IT設(shè)備在運(yùn)行,新數(shù)據(jù)中心也在規(guī)劃之中,這么大的規(guī)模給運(yùn)維帶來了很大挑戰(zhàn)。另一個(gè)壓力來自業(yè)務(wù)對(duì)信息系統(tǒng)的要求?,F(xiàn)在信息系統(tǒng)和業(yè)務(wù)的捆綁已經(jīng)越來越緊,有些信息系統(tǒng)是跟生產(chǎn)過程緊密捆綁的。信息系統(tǒng)如果中斷或者發(fā)生故障對(duì)業(yè)務(wù)的影響也是非常大。
“12306網(wǎng)站就是一個(gè)很好的例子,如果后臺(tái)運(yùn)行出現(xiàn)故障,輕的影響旅客用戶體驗(yàn),重的影響旅客購票。那就是一件大事情。”高明星表示。
第三,中國(guó)鐵路總公司自己目前也是處在一個(gè)轉(zhuǎn)型的階段,從過去的政府部門轉(zhuǎn)變成一個(gè)企業(yè),為走好轉(zhuǎn)型之路總公司對(duì)IT提出了更高的需求,這也是一個(gè)壓力。
這些壓力傳導(dǎo)到IT部門,對(duì)IT部門而言核心就是要解決好兩個(gè)問題,一個(gè)是經(jīng)濟(jì)上,即要控制成本;另一個(gè)是技術(shù)上,即要突破技術(shù)瓶頸及實(shí)現(xiàn)自主可控。“當(dāng)IT資產(chǎn)從幾百萬、幾千萬到幾十億的時(shí)候,如果IT的基礎(chǔ)架構(gòu)本身不方便運(yùn)維管理,如果沒有自動(dòng)化的工具、沒有標(biāo)準(zhǔn)化的流程,是很難做的,所以說IT的優(yōu)化首先是成本的壓力。其次,從技術(shù)的角度而言,IT要更加敏捷地滿足業(yè)務(wù)上線的需求。另外,國(guó)家對(duì)安全和自主可控方面現(xiàn)在越來越重視,這些也需要借助IT來落實(shí)。”高明星表示。
對(duì)于傳統(tǒng)企業(yè)面臨的這些壓力,紅帽首席解決方案架構(gòu)師張家駒也是感同身受。作為一名開源技術(shù)的資深從業(yè)者,張家駒常常接到客戶這方面的咨詢請(qǐng)求,希望幫助他們更好地應(yīng)對(duì)成本和技術(shù)壓力。張家駒告訴至頂網(wǎng)記者,過去傳統(tǒng)企業(yè)面對(duì)的是傳統(tǒng)業(yè)務(wù),年初做預(yù)算,什么都規(guī)劃好了,就按照這個(gè)步驟來。然而,今天整個(gè)世界變得敏捷了,出現(xiàn)了很多不確定性的因素,在這種背景下傳統(tǒng)企業(yè)一定要做轉(zhuǎn)變,必須擁抱新的技術(shù),需要對(duì)IT系統(tǒng)進(jìn)行調(diào)整和優(yōu)化。
訪談中,張家駒告訴至頂網(wǎng)記者,傳統(tǒng)企業(yè)對(duì)新技術(shù)的態(tài)度要比大家預(yù)想的積極得多。“我們看到越來越多的傳統(tǒng)企業(yè)愿意去嘗試新的事物,雖然在嘗試過程中可能會(huì)遇到這樣或者那樣的一些問題,這個(gè)時(shí)候可能借助于一些外部的力量,比如說一些廠商的支持,來逐步實(shí)現(xiàn)從傳統(tǒng)逐漸向新型業(yè)務(wù)轉(zhuǎn)變。”張家駒表示。
實(shí)際上,正如張家駒所言,在中鐵信息技術(shù)中心的一路前行過程中,就有紅帽等多個(gè)廠商的幫助和支持,這也是中鐵信息技術(shù)中心放手投入開源的底氣所在。
標(biāo)準(zhǔn)化、自動(dòng)化與云化
壓力之下的中國(guó)鐵路信息技術(shù)中心把目光投向了IT優(yōu)化,逐步引入開放系統(tǒng)、虛擬化和一些開源的技術(shù),并開啟了長(zhǎng)期的、持續(xù)不斷的IT優(yōu)化之路。其中,2010年時(shí)一個(gè)關(guān)鍵時(shí)間點(diǎn)。
高明星解釋說,早期的中國(guó)鐵路信息化主要基于專有系統(tǒng),包括大型機(jī)和各種小型機(jī)。到2010年時(shí),中國(guó)鐵路信息化出現(xiàn)了重要的變化,從過去面向內(nèi)部的生產(chǎn)經(jīng)營(yíng)管理為主,到面向主動(dòng)為旅客貨主提供服務(wù),此時(shí)信息系統(tǒng)面臨的壓力和需求規(guī)模突然攀升,在這種情況下,沿用傳統(tǒng)的專有系統(tǒng)從成本上考慮就不可行了。
“從2014年到2015年開始,我們被迫轉(zhuǎn)向x86平臺(tái),并從x86平臺(tái)延伸到基于Linux的開源系統(tǒng),到后來的云計(jì)算,就這么一路走來了。”高明星告訴至頂網(wǎng)記者。
據(jù)悉,整個(gè)過程中中國(guó)鐵路信息技術(shù)中心學(xué)習(xí)了很多互聯(lián)網(wǎng)公司的做法,包括虛擬化、標(biāo)準(zhǔn)化、自動(dòng)化以及云化等IT優(yōu)化的普遍做法。以12306網(wǎng)站為例,其最大的壓力來自余票查詢。因?yàn)閹缀趺總€(gè)人完成購票之前,都會(huì)進(jìn)行多次余票查詢。要保證用戶的查詢體驗(yàn),后臺(tái)就需要很好地應(yīng)對(duì)高并發(fā)的查詢需求。
高明星介紹說,“剛開始采取的辦法是采用關(guān)系型數(shù)據(jù)庫,通過增加服務(wù)器處理能力來應(yīng)對(duì),一臺(tái)不行上10臺(tái)、上100臺(tái),隨后發(fā)現(xiàn)這種思路仍然無法滿足在高峰期查詢的需求,后來轉(zhuǎn)向分布式架構(gòu),采用了分庫分表的辦法解決這個(gè)問題。”
正是因?yàn)橹袊?guó)鐵路信息技術(shù)中心在滿足業(yè)務(wù)需求時(shí)遇到的挑戰(zhàn)更大,對(duì)此體會(huì)更深,所以,相比一般傳統(tǒng)企業(yè),它們?cè)陂_源系統(tǒng)和云計(jì)算的道路都走得更堅(jiān)決、更快。比如,在開源上,不只是選擇了紅帽的Linux、虛擬化等基礎(chǔ)平臺(tái),還選擇了Ceph,構(gòu)建了基于Ceph的分布式存儲(chǔ)系統(tǒng)。甚至在云計(jì)算的道路上,選擇的也是基于OpenStack的開源云平臺(tái)。
“我們希望把命運(yùn)多掌控一些在自己的手里,多一些自主可控。”高明星談及這些選擇時(shí)表示。
要優(yōu)化,更要可靠
雖然中國(guó)鐵路信息技術(shù)中心一路走來,看起來比較激進(jìn),也比較堅(jiān)決,但實(shí)際上每一步走得都非常扎實(shí),并沒有急躁冒進(jìn)。比如,在正式轉(zhuǎn)向開源系統(tǒng)、遷移到x86+Linux平臺(tái)之前,中國(guó)鐵路信息技術(shù)中心曾對(duì)開源平臺(tái)的安全和可靠性經(jīng)過了兩三年考驗(yàn)期。
“在確定了要走開源路線之后,我們積極進(jìn)行了各種準(zhǔn)備,包括提升自身的能力。我們依托自己內(nèi)部的力量,包括下屬的公司,還組建了一支隊(duì)伍專門去研究開源,研究云計(jì)算。”高明星說,因?yàn)椴捎昧藵u進(jìn)的思路,在漸進(jìn)過程中逐步建立起了信心,現(xiàn)在才有足夠的底氣宣布要走開源之路。
而值得一提的是,在整個(gè)遷移過程,“可靠”一直是中國(guó)鐵路信息技術(shù)中心最優(yōu)先考慮的。高明星透露,“可靠”是比“成本”等更為重要的考量,在可靠性面前成本位居第二,所有優(yōu)化的前提是要保證可靠性?;谶@個(gè)原因,中國(guó)鐵路信息技術(shù)中心做了大量的驗(yàn)證測(cè)試工作,包括數(shù)據(jù)庫跑在Linux平臺(tái)、用Ceph存儲(chǔ)來支持Web服務(wù)等。
“對(duì)于我們來說,開源、分布式計(jì)算是有技術(shù)挑戰(zhàn)的,同時(shí)我們的業(yè)務(wù)是不能出錯(cuò)的。我們要在這個(gè)路上走得更穩(wěn)當(dāng),就要做很多的工作,包括測(cè)試、驗(yàn)證以及架構(gòu)的設(shè)計(jì)。”高明星表示。
基于這個(gè)考慮,目前中國(guó)鐵路信息技術(shù)中心核心數(shù)據(jù)庫還是跑在x86物理服務(wù)器上,并沒有一刀切地采用虛擬化。同時(shí),在架構(gòu)上中國(guó)鐵路信息技術(shù)中心也做了特別的設(shè)計(jì),采用了雙平臺(tái),即核心業(yè)務(wù)系統(tǒng)后臺(tái)采用了開源和閉源平臺(tái)并舉,通過負(fù)載均衡系統(tǒng)提供給前端,支撐業(yè)務(wù)的運(yùn)行,同時(shí)屏蔽了后臺(tái)的異構(gòu)。
“目前這個(gè)架構(gòu)資源池比例可能是五五開,后期會(huì)隨著我們自主研發(fā)程度的逐步提升,進(jìn)一步提高開源架構(gòu)資源池的比例。這樣做的好處是容錯(cuò)能力大大提升了,讓我們的轉(zhuǎn)型之路也能走得更平穩(wěn)性。”高明星表示。
很顯然,中國(guó)鐵路信息技術(shù)中心的轉(zhuǎn)型之路走得相對(duì)順利和平穩(wěn),與公司在這方面的看似激進(jìn)實(shí)則穩(wěn)健的工作風(fēng)格不無關(guān)系。頗有意思的是,在長(zhǎng)期與傳統(tǒng)企業(yè)客戶打交道的張家駒看來,這其實(shí)也是很多傳統(tǒng)企業(yè)特別是大型企業(yè)的普遍做法。
“中國(guó)鐵路信息技術(shù)中心給我們很好的一個(gè)例子,應(yīng)該如何在傳統(tǒng)技術(shù)和新技術(shù)之間,或者閉源和開源技術(shù)之間達(dá)到有效的平衡,也就是如何隨著技術(shù)的成熟逐漸會(huì)加大我們使用開源的新興技術(shù)的比例,而不是單純地冒進(jìn)。”張家駒評(píng)價(jià)說,“總之,業(yè)務(wù)優(yōu)先,只有把業(yè)務(wù)問題解決了,才能談IT優(yōu)化,談轉(zhuǎn)型。”
工業(yè)控制系統(tǒng)邁向開放 你想好如何進(jìn)行安全防范了嗎?