隨著互聯(lián)網(wǎng)和云計(jì)算行業(yè)的快速發(fā)展,數(shù)據(jù)中心網(wǎng)絡(luò)的重要性前所未有的凸顯。展望2020年,數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)會(huì)有哪些熱點(diǎn)問題受業(yè)界關(guān)注,面臨這些技術(shù)熱點(diǎn)問題你會(huì)如何應(yīng)對(duì)?
熱點(diǎn)5:下一代數(shù)據(jù)中心主干以太網(wǎng)演進(jìn),200G or 400G?
上榜指數(shù)★★★★☆
上榜原因大家都在等米下鍋
如果說從2016年開始的大規(guī)模數(shù)據(jù)中心主干網(wǎng)絡(luò)升級(jí)的浪潮是從40G升級(jí)到100G,那么2020年的下一代升級(jí)浪潮應(yīng)該是怎么樣的?業(yè)界因此有200G和400G兩種路線。
圖1 以太網(wǎng)標(biāo)準(zhǔn)進(jìn)展
200G的優(yōu)勢是所需的QSFP及50G Serdes均已成熟商用,缺點(diǎn)是相對(duì)100G的每G帶寬成本降低幅度不算太大;400G正好相反,預(yù)期的每G帶寬成本下降幅度足夠大,但需要QSFP搭載100G Serdes,或8通道的新標(biāo)準(zhǔn)(如OSFP、QSFP-DD)搭載50G Serdes,而100G Serdes、OSFP、QSFP-DD商用時(shí)間預(yù)計(jì)都要在2018年以后。
根據(jù)Google、Facebook等披露的數(shù)據(jù),這些互聯(lián)網(wǎng)巨頭數(shù)據(jù)中心內(nèi)部流量每年增長幅度接近100%,那么,部署100G較早的少數(shù)互聯(lián)網(wǎng)巨頭,比如Google,很可能會(huì)謀求盡快獲得200G,而其它企業(yè)則可以選擇跳過200G等待400G獲得更好的性價(jià)比。IEEE的400G以太網(wǎng)標(biāo)準(zhǔn)預(yù)計(jì)2017年完成,而200G以太網(wǎng)標(biāo)準(zhǔn)預(yù)計(jì)2018~2019年完成,也許也反應(yīng)了業(yè)界大部分企業(yè)的心態(tài)——更看好400G。
考慮到即便只有Google采用200G也會(huì)有足夠的市場影響力,可以預(yù)計(jì),2020年200G和400G均商用就緒,但400G會(huì)更加主流,性價(jià)比更優(yōu)。
熱點(diǎn)4:400G數(shù)據(jù)中心網(wǎng)絡(luò),光纖選多模還是單模?
上榜指數(shù)★★★★☆
上榜原因多模和單模一直是一道沒有標(biāo)準(zhǔn)答案的選擇題
數(shù)據(jù)中心集群內(nèi)布線選擇多模光纖還是單模光纖一直是一個(gè)業(yè)界在討論的話題,各大玩家也各有選擇,比如100G時(shí)代,F(xiàn)acebook選擇單模,Google選擇多模和單模同時(shí)部署,BAT則選擇多模。
從成本角度,多模光纖貴但多模光模塊便宜,單模光纖便宜而單模光模塊貴,因此很容易將光纖和光模塊成本進(jìn)行組合評(píng)估,得出距離和成本的關(guān)系。比如100G,光纖距離在100米以內(nèi)時(shí)多模解決方案的成本優(yōu)勢非常明顯。
從技術(shù)角度,傳統(tǒng)上多模解決方案代表光纖并行方向,單模解決方案代表波長復(fù)用方向(PSM4是個(gè)新的方向,單模并行)。40G和100G時(shí)代這兩種解決方案分別在短距和中長距場景各有千秋相安無事共同發(fā)展。然而400G時(shí)代情況有了變化,并行技術(shù)路線似乎在400G時(shí)代觸碰到了天花板。
并行技術(shù)路線的特點(diǎn)是每一對(duì)多模光纖分別承載一路光信號(hào)。目前IEEE的400G SR16標(biāo)準(zhǔn)是16*25G并行方案,需要16對(duì)多模光纖,遠(yuǎn)遠(yuǎn)超過100G時(shí)代廣泛使用的12芯MPO,會(huì)導(dǎo)致成本大幅上升;更重要的是,多模光模塊所依賴的低成本VCSEL光芯片方案,2020年很可能仍然只能提供每路50G的能力,400G SR8的8*50G方案仍然需要超過12芯MPO的8對(duì)多模光纖。現(xiàn)有的12芯MPO能夠容納的400G SR4看上去遙遙無期。
圖2 400G網(wǎng)絡(luò)技術(shù)演講(紅色部分為IEEE 802.3bs baseline規(guī)定
多模實(shí)際上也可以有波長復(fù)用解決方案。目前的一些私有技術(shù),如SWDM,可以實(shí)現(xiàn)一對(duì)多模光纖上4路光信號(hào)的傳輸。但私有技術(shù)封閉性導(dǎo)致的光模塊互通性問題和成本的提升,是這類解決方案大規(guī)模普遍應(yīng)用難以逾越的大山。
因此在2020年,如果沒有開放且標(biāo)準(zhǔn)化的多模波長復(fù)用技術(shù)出現(xiàn),低成本VCSEL 100G技術(shù)也不能取得突破,400G多模光纖解決方案成本優(yōu)勢將不再明顯,單模光纖在大規(guī)模數(shù)據(jù)中心也許將成為主流,而中短距的單模并行解決方案也許會(huì)是替代多模并行解決方案的高性價(jià)比選擇。
擁有多模波分復(fù)用私有技術(shù)的玩家,會(huì)為了避免400G多模解決方案的困境彼此妥協(xié)形成一個(gè)統(tǒng)一的標(biāo)準(zhǔn)嗎?讓我們拭目以待。
熱點(diǎn)3:數(shù)據(jù)中心400G光模塊封裝,OSFP、QSFP-DD該如何選擇?
上榜指數(shù):★★★★★
上榜原因一個(gè)小小的封裝問題,牽動(dòng)多少網(wǎng)絡(luò)大咖的心
歷史上光模塊封裝一直有多個(gè)標(biāo)準(zhǔn)并行,但像OSFP、QSFP-DD這樣如此受到關(guān)注的卻不多見。400G光模塊封裝目前有多個(gè)標(biāo)準(zhǔn),除了OSFP、QSFP-DD外還包括CFP8、CDFP等,其中OSFP、QSFP-DD是面向數(shù)據(jù)中心數(shù)通網(wǎng)絡(luò)的兩個(gè)標(biāo)準(zhǔn)。
OSFP和QSFP-DD的共同點(diǎn)是都將QSFP的4通道擴(kuò)展為8通道,8*50G的支持來實(shí)現(xiàn)400G,未來還可以通過8*100G實(shí)現(xiàn)800G。
OSFP的優(yōu)勢是體積大散熱好工程實(shí)現(xiàn)相對(duì)容易,外加有Google的加持,缺點(diǎn)是1U面板的尺寸基本只能做32*400G。OSFP預(yù)計(jì)2018年商用
QSFP-DD的優(yōu)勢是1U面板可以做到36*400G的密度,并且對(duì)QSFP前向和后向兼容,可兼容現(xiàn)有的QSFP28光模塊及AOC/DAC等,缺點(diǎn)是尺寸較緊湊對(duì)設(shè)計(jì)和散熱有更高要求(之前QSFP-DD的散熱方面認(rèn)為有較大局限,但現(xiàn)在也可以做到12W不再是瓶頸)。QSFP-DD得到Facebook的公開支持。從OFC 2017來看,QSFP-DD得到業(yè)界越來越多的支持。QSFP-DD預(yù)計(jì)2019年商用。
預(yù)計(jì)2020年,很多交換機(jī)、光模塊廠商都會(huì)同時(shí)支持兩種封裝,但QSFP-DD攜更高端口密度和前后向兼容性的優(yōu)勢很可能會(huì)成為市場主流。
熱點(diǎn)2:數(shù)據(jù)中心框式交換機(jī),體系架構(gòu)會(huì)如何變化?
上榜指數(shù):★★★★★
上榜原因昂貴而復(fù)雜的東西,天然會(huì)留下被顛覆的空間
長久以來,框式交換機(jī)的軟硬件設(shè)計(jì)復(fù)雜,產(chǎn)品研發(fā)周期長,成本高昂,強(qiáng)烈依賴特定芯片?;陬愃菩旁膬?nèi)部轉(zhuǎn)發(fā)、大片外緩存、N+1交換矩陣冗余等都是框式交換機(jī)給人留下的特有印象。
OCP的6-Pack、Backpack的發(fā)布給業(yè)界展示了互聯(lián)網(wǎng)巨頭們一直在嘗試的另外的方向。Backpack采用100G以太網(wǎng)互聯(lián)的CLOS架構(gòu),使用Tomahawk這樣主要用于TOR的芯片而不是傳統(tǒng)的Dune芯片,交換矩陣無N+1冗余,實(shí)際上它們就可以看作是用一堆Wedge接入交換機(jī)像樂高積木那樣搭建起來的。
圖4 Backpack G4前視效果圖(來源Backpack_OCP_Spec_V1.10)
圖5 Backpack G4線卡與矩陣互聯(lián)架構(gòu)(來源Backpack_OCP_Spec_V1.10)
從數(shù)據(jù)中心應(yīng)用場景來看,不依賴特定交換芯片的以太網(wǎng)架構(gòu)比信元架構(gòu)轉(zhuǎn)發(fā)效率雖然要低10%左右但成本可以大幅降低,流數(shù)量巨大且不是同步突發(fā)、端口速率一致匹配、收斂比設(shè)計(jì)合理時(shí)對(duì)緩存要求會(huì)降低,交換矩陣無N+1冗余可以進(jìn)一步降低成本。
當(dāng)然,6-Pack、Backpack這樣的框式交換機(jī)每一塊線卡、交換矩陣等在管理層面實(shí)際上是獨(dú)立的一臺(tái)臺(tái)交換機(jī),對(duì)網(wǎng)絡(luò)運(yùn)維管理能力要求很高,實(shí)際上是以強(qiáng)大的架構(gòu)、研發(fā)和運(yùn)維能力換取成本收益。所以,是否能夠仍然作為一個(gè)管理節(jié)點(diǎn)進(jìn)行管理對(duì)大部分用戶來說會(huì)是一個(gè)重要考量點(diǎn)。實(shí)際上,已經(jīng)有OEM廠商開始嘗試推出類似這樣架構(gòu)但仍然是一個(gè)管理節(jié)點(diǎn)的框式交換機(jī)產(chǎn)品,體系架構(gòu)改變帶來的成本明顯優(yōu)勢大大提升了其產(chǎn)品在市場上的競爭力。
可以預(yù)計(jì),2020年,適用于大規(guī)模數(shù)據(jù)中心框式交換機(jī)的體系架構(gòu)將會(huì)趨向400G以太網(wǎng)CLOS架構(gòu),不使用片外擴(kuò)展緩存,采用和TOR一致的交換芯片種類,而且極可能取消N+1冗余交換矩陣換取更低的成本。
熱點(diǎn)1:數(shù)據(jù)中心白盒交換機(jī)+開源OS的模式是否會(huì)大行其道?
上榜指數(shù):★★★★★
上榜原因白盒,想說愛你不容易
白盒交換機(jī)很容易獲得,但搭載的交換機(jī)OS卻是一個(gè)難題。如果沒有很大的網(wǎng)絡(luò)規(guī)模和足夠的決心,單一用戶難以承受獨(dú)立進(jìn)行自有交換機(jī)OS研發(fā)的長期投入成本和研發(fā)節(jié)奏。因此,大家都期盼能有一個(gè)好用的數(shù)據(jù)中心開源交換機(jī)OS。
然而開源交換機(jī)OS也不容易。首先,從社區(qū)運(yùn)作角度,如果沒有用戶主導(dǎo)方向、用戶自己投入研發(fā)資源,僅依靠商業(yè)廠商,社區(qū)難以持久有效的運(yùn)作;其次,需要有一個(gè)良好的軟件架構(gòu),具備良好擴(kuò)展性可以支持未來SDN網(wǎng)絡(luò)的發(fā)展,同時(shí)模塊之間可以松耦合便于不同用戶的研發(fā)協(xié)同;再次,需要輕量專注,僅研發(fā)數(shù)據(jù)中心網(wǎng)絡(luò)必須的特性;最后,需要有同步發(fā)展和包容的生態(tài),借助更多的用戶、芯片廠商、ODM/OEM、服務(wù)商等的有效參與,活躍相關(guān)的研發(fā)、部署、推廣。Linux、Openstack、Ceph等均是開源社區(qū)成功運(yùn)作的典范。
目前,開源交換機(jī)OS的典型代表是SONiC,SONiC開源社區(qū)已經(jīng)有一個(gè)良好的起步,然而還任重道遠(yuǎn)。1.0天使階段,開源社區(qū)需要依靠有實(shí)力的社區(qū)成員共同投入較多研發(fā)資源獲得一個(gè)可用的版本并在社區(qū)成員的數(shù)據(jù)中心網(wǎng)絡(luò)規(guī)模部署完成驗(yàn)證;2.0發(fā)展階段,更多的有一定研發(fā)能力的較大網(wǎng)絡(luò)規(guī)模用戶開始加入并嘗試使用,版本日趨完善和成熟;3.0普惠階段,大量普通用戶開始直接使用,眾多服務(wù)商可以提供白盒+開源OS的部署和運(yùn)維服務(wù)。
可以樂觀的預(yù)計(jì),2020年,開源OS社區(qū)將發(fā)展到2.0階段后期,白盒交換機(jī)市場將迎來井噴式發(fā)展,白盒交換機(jī)+開源OS將成為很多企業(yè)CTO/CIO的選項(xiàng)之一。
更多前瞻網(wǎng)絡(luò)技術(shù)話題和干貨,請(qǐng)關(guān)注并參與8月22日2017開放數(shù)據(jù)中心峰會(huì)。
本文作者
楊志華
ODCC網(wǎng)絡(luò)工作組組長、阿里巴巴資深網(wǎng)絡(luò)專家
ODCC2017專題鏈接:http://www.idcquan.com/Special/odcc2017/