IT服務器運維 | 服務器網(wǎng)卡Team聚合技術(shù)
2020-04-20 20:50 作者:admin
IT服務器運維 | 服務器網(wǎng)卡Team聚合技術(shù)
數(shù)據(jù)中心服務器接入大量采用了服務器網(wǎng)卡(Team)技術(shù)。Team技術(shù)不完全屬于網(wǎng)絡系統(tǒng),也不完全屬于主機系統(tǒng)負責,而是介于兩者的中間地帶,因此極易出現(xiàn)問題。最常見的錯誤就是服務器端選擇了交換機相關的team模式,但交換機端網(wǎng)絡人員卻沒有做任何設置。在一定條件觸發(fā)下,會引起交換機報主機物理地址flapping錯誤,繼而導致整個交換機CPU利用率居高不下。本文通過對兩種常見服務器網(wǎng)卡的Team技術(shù)原理的探討,分析了各種Team模式的實現(xiàn)方式和配置方式。
IT系統(tǒng)運維人員熟練掌握這些知識和技巧后,可根據(jù)自身系統(tǒng)的需要,選擇合適的Team模式,有效避免后期的運行風險。數(shù)據(jù)中心對可用性要求極高。為保證業(yè)務系統(tǒng)
高可用性和連續(xù)性,從網(wǎng)絡層面講,整個通道的網(wǎng)絡設備和通信線路,全部是
冗余設計:
即從客戶機到服務器之間的網(wǎng)絡通道,任一物理設備宕機,或任一通信線路中斷,都不會影響到業(yè)務的連續(xù)。 然而,服務器和客戶機,特別是服務器單線路接入網(wǎng)絡時,存在以下
單點故障:
·
接入物理設備(通常是交換機)宕機;
·
接入設備的網(wǎng)口損壞;
·
使用的網(wǎng)線損壞;
·
服務器、客戶機的網(wǎng)卡故障。
解決這種單點故障只能使用服務器網(wǎng)卡組(Team)技術(shù)。本質(zhì)上說,網(wǎng)卡team技術(shù)是將同一主機上的兩塊或兩塊以上的網(wǎng)卡,通過軟件控制,虛擬出一個邏輯網(wǎng)卡。實際工作時多塊網(wǎng)卡可以是一主一備模式,或者是
雙活模式。這種技術(shù)的初衷是為了解決服務器的帶寬瓶頸,隨著近年來千兆和萬兆級的服務器網(wǎng)卡的出現(xiàn),服務器帶寬瓶頸得以緩解。因而現(xiàn)在實施服務器網(wǎng)卡組,主要是為服務器網(wǎng)絡接入提供冗余,提高服務器可用性。這種技術(shù)的出現(xiàn)很好地解決了行業(yè)數(shù)據(jù)中心服務器接入的單點故障問題,因此在行業(yè)內(nèi)被大量使用。目前市場上流行的可以實施網(wǎng)卡組技術(shù)的網(wǎng)卡有intel和broadcom服務器網(wǎng)卡,本文也將重點介紹intel和broadcom服務器網(wǎng)卡組技術(shù)。
網(wǎng)卡組技術(shù)架構(gòu)
網(wǎng)卡組技術(shù)的實質(zhì)是對多個物理網(wǎng)絡接口進行統(tǒng)一管理,將多個物理接口虛擬成一個邏輯網(wǎng)絡接口。具體到服務器網(wǎng)卡上,可以看作將多塊網(wǎng)卡虛擬為一塊邏輯網(wǎng)卡。從屬性上看,虛擬邏輯網(wǎng)卡和物理網(wǎng)卡無任何不同,也有自己的物理地址和網(wǎng)絡地址。服務器使用邏輯網(wǎng)卡與外部的主機通信。外部主機只能看到服務器的邏輯網(wǎng)卡,至于服務器具體的物理網(wǎng)卡個數(shù)、物理地址等細節(jié),外部主機是不清楚的。
網(wǎng)卡組邏輯結(jié)構(gòu)如圖1所示
無論是intel還是broadcom,一般都是在原有網(wǎng)卡驅(qū)動程序基礎上,增加一個網(wǎng)卡組驅(qū)動程序,由該驅(qū)動程序完成網(wǎng)卡組功能。網(wǎng)絡協(xié)議直接訪問網(wǎng)卡組驅(qū)動程序,網(wǎng)卡組驅(qū)動程序負責完成負載均衡等功能。一般地,網(wǎng)卡組驅(qū)動負責對組成網(wǎng)卡組的各個物理網(wǎng)卡進行管理,例如,活動探測,流量探測等,并根據(jù)實際情況,實現(xiàn)
負載均衡和網(wǎng)卡容錯功能。
總結(jié)
下面是一些關于網(wǎng)卡組技術(shù)的總結(jié),可以幫助讀者更深刻地理解網(wǎng)卡組的實現(xiàn)技術(shù)。
1、網(wǎng)卡組技術(shù)是提高終端(不僅僅是服務器)接入網(wǎng)絡帶寬和可用性的一種技術(shù)。因此,它只涉及終端和網(wǎng)絡接入設備(交換機、HUB和路由器),參與的雙方必須直接連接,中間不能跨接其他設備。關于網(wǎng)卡組,目前都是各廠商自行實現(xiàn),尚無統(tǒng)一的國際標準。
2、提高帶寬是通過多塊網(wǎng)卡的
負載均衡手段,所有的交換機相關網(wǎng)卡組模式(靜態(tài)或動態(tài))、ALB和RLB,都提供負載均衡模式。負載均衡參與者必須是同一局域網(wǎng)的設備,即,客戶端與服務器必須是同一IP網(wǎng)段,且處于同一廣播域。
3、負載均衡不是基于單個數(shù)據(jù)包的,而是基于客戶端或網(wǎng)絡應用的。也就是說,某個網(wǎng)絡應用的所有數(shù)據(jù)流,自始至終,只使用組中的某一特定網(wǎng)卡,除非該網(wǎng)卡故障而發(fā)生切換;另外,由于發(fā)送和接收數(shù)據(jù)均衡由不同的設備實現(xiàn),因此同一網(wǎng)絡應用的收、發(fā)數(shù)據(jù)流可能會經(jīng)過不同的網(wǎng)卡。
4、HUB屬于物理層設備,處于同一沖突域,不能增加接入帶寬;路由器屬于網(wǎng)絡層設備,HUB和路由器都不能象交換機那樣處理設備物理地址,因此,網(wǎng)卡組技術(shù)不能在HUB或路由器上實現(xiàn)。
5、無論AFT、SFT、ALB還是其他交換機無關網(wǎng)卡組技術(shù),在交換機轉(zhuǎn)發(fā)表中,組中每塊網(wǎng)卡的物理地址都正常出現(xiàn),需要調(diào)整時,由網(wǎng)卡組驅(qū)動程序控制網(wǎng)卡發(fā)送特定的數(shù)據(jù)包,改變交換機中的MAC表,以實現(xiàn)冗余互備?;谶@個原理,雖然intel網(wǎng)卡支持的AFT,ALB等模式要求接入同一臺交換機,但經(jīng)過測試(在組中只有兩塊網(wǎng)卡的情況下,多塊網(wǎng)卡的情況未測試)在分接兩臺不同的交換機時,效果基本上是相同的。
6、Intel的技術(shù)資料說明,在做SFT模式時,啟用STP協(xié)議,但網(wǎng)卡連接接口應啟用STP速端口(portfast),其余模式的網(wǎng)卡組也應該如此。其給出的理由是啟用STP協(xié)議的交換機端口狀態(tài)轉(zhuǎn)變時候大約有40秒的延遲,會增加網(wǎng)卡切換時的時間,增加網(wǎng)絡應用中斷的時間。
事實上,無論何種模式,只要在STP協(xié)議穩(wěn)定后,參與網(wǎng)卡組的交換機全部處于正常轉(zhuǎn)發(fā)狀態(tài),此時如果僅僅是發(fā)生網(wǎng)卡故障,故障網(wǎng)卡上的數(shù)據(jù)流切換到正常網(wǎng)卡上,只要交換機上的端口物理狀態(tài)沒有改變,STP協(xié)議也不會發(fā)生狀態(tài)轉(zhuǎn)換,整個切換時間取決于交換機中轉(zhuǎn)發(fā)表的修改時間。
7、關于交換機相關網(wǎng)卡組模式。這種模式實際上是一種“分流、互備”方式,配置時選擇余地大,技術(shù)成熟,唯一的缺點是,所有與交換機相關的網(wǎng)卡組模式,不能跨接交換機,必須接入同一臺交換機上,即,這種模式只能提供帶寬擴展和網(wǎng)卡容錯,無法提供交換機容錯。
在可用性要求較高的場合,交換機容錯是必須的。如何解決這個問題呢?最理想的方式是借助
交換機堆疊技術(shù)。就CISCO交換機來說,兩臺堆疊的交換機邏輯上可以看做是一臺交換機。但配置FEC或GEC時,要求成員接口必須位于同一臺物理交換機上。CISCO 3750在堆疊時沒有這個限制,即,兩臺3750交換機堆疊后,可以將不同物理交換機上的交換機端口捆綁在一起。網(wǎng)卡組技術(shù)結(jié)合CISCO 3750堆疊技術(shù),就可以采用交換機相關模式,同時提供交換機容錯功能。
以上內(nèi)容由北京艾銻無限科技發(fā)展有限公司整理