解密谷歌網絡帝國背後的故事
鉅亨網新聞中心 2015-06-18 09:15
6月18日訊息, 三年半之前,一個包裹被快遞到了愛荷華州一個農業小鎮的某辦公樓里,一段關於谷歌的神奇故事就此拉開了帷幕。
包裹里面是幾個奇怪的計算設備,它們非常的寬大扁平,就像裝披薩的盒子。盒子的一邊是密集的開口,顯然是用來接入大量網線用的,另一邊貼著一個“海王星交換機”(Pluto Switch)的標簽。它們的外形與常規的網絡設備大相徑庭,而且盒子的背面還印著許多芬蘭語的字元。這個公司的工作人員顯然並不知道這些盒子的具體用途,於是有人把這些盒子轉寄到了他們威斯康辛的總部,希望那里的IT專家們可以解答這些盒子的秘密。總部的IT工作人員一開始同樣一頭霧水,但是不久之后他們在一個非常小眾的網絡論壇上得到了一些答復:這些盒子是網絡交換機,它們工作在因特網紛繁復雜豐富多彩的表面之下,負責在數據中心之間大量的傳輸和轉移數據,並且,它們的主人是谷歌。
谷歌的確在愛荷華州的那個小鎮附近設有數據中心,所以顯然是郵遞員粗心把這個設備寄到了錯誤的地址。這個公司的工作人員把這些盒子兩兩裝好之后寄給了谷歌,並且迅速的從那個論壇上銷聲匿跡,但是他們在論壇上曾經發過的照片和技術討論還是為人們打開了一扇窺探谷歌帝國內部的神秘網絡世界的窗戶。它指向了一個也許會改變整個互聯網世界的神秘項目,而谷歌卻從未在公開的場合談論過它。
圖為谷歌代號為”海王星“(Pluto)的高效能架頂式交換機
多年以來,谷歌在搭建自己的服務器網絡時並沒有使用傳統網絡設備商的設備,他們並沒有大規模的購買思科,惠普或者愛立信的交換機和路由器。為了適應谷歌急速擴張的服務器網絡,他們專門設計了自己的網絡設備並且為他們編寫了自己的軟件用於設定和管理自己的網絡。而直到這次陰差陽錯的郵遞員事件,外界才第一次看到這些設備的真容。由於這個項目對於谷歌的重大意義,在對外界保密的同時谷歌一直在持續增加對這個項目的投入。直到今天早上,在矽谷的一個技術會議中,來自谷歌的Amin Vahdat才第一次作為這個項目的負責人展示了支撐谷歌網絡帝國長達10年的前5代的硬體軟件解決方案,並且對這個領域的一些基礎技術進行了介紹和探討。這些探討對於整個互聯網世界都具有一定的前瞻性,畢竟未來會有更多的互聯網公司將要走上谷歌已經走過的路。
圖為Amin Vahdat, 谷歌“消防水管”(Firehose)項目的負責人
Amin Vahdat最早是UCSD的教授,他的研究領域就是網絡的拓展,當意識到在學術圈的世界里已經無法構建規模足夠大的網絡之后,他來到了谷歌。據Vahdat介紹,谷歌這個秘密項目名字叫做“消防水管”(Firehose),始於2004年。到2005,2006年的時候,這個項目的產品已經部署在谷歌若干個數據中心日夜運行。除了快遞員投錯的那些類似於“高效能架頂式”(Top-of-Rack)交換機的產品,他們還開發了另外一種用於連接大規模網絡之間相互連接的“集群交換機”(Cluster swtiches)。不僅如此,谷歌甚至還設計開發了自己專屬的路由協議和網絡管理軟件。對此Vahdat的解釋是:“那時的設備完全不能應付我們的網絡所需要處理的帶寬和數據吞吐量,那樣的設備在這個星球上根本就不存在。”
談到消防水管這個項目最初的動機,Vahdat表示主要有兩個方面,一方面在於谷歌的服務器網絡擴張太快,傳統網絡設備商的產品已經無法滿足他們在各個不停擴張的數據中心之間快速交換數據的需求;另一方面谷歌也需要為這個長期持續的挑戰找到一個低成本的解決方案,運用傳統的手段搭建谷歌所需要的規模的數據中心和網絡,成本將是真正意義的天文數字。而這個低成本的解決方案就是大量購買價格低廉的民用級的晶片,並且讓他們協同工作完成交換處理海量數據的任務,聽起來很像當下被炒得火熱的云計算的概念雛形。
十幾年之前當谷歌剛剛開始搭建自己的服務器網絡時,他們的選擇跟其他所有公司如出一轍。他們嘗試從思科購買最大最強的集群交換機(Cluster swtiches),在每個數據中心的內部,這些集群交換機構成了網絡的骨架。每一部這樣的集群交換機都要花費谷歌幾十萬到幾百萬美元,而每一部這樣的交換機上只有固定數量的網絡介面可以連接到其他的交換機,這意味著搭建一個可以滿足谷歌需要的數據網絡將會耗費無盡的美元。“那時候我們的采購只會跟他們說,嘿哥們,把你們現有最牛的交換機給我們,只要最牛的。”[NT:PAGE=$]
於是從2004年開始谷歌內部成立了一個小組開始研究自己的網絡設備解決方案。這個方案簡而言之就是用普通的民用級晶片搭建通用的硬體,然后在上面跑任何需要運行的軟件。思科為不同級別的需求提供不同的硬體,並每套硬體上面都運行特定的相匹配的軟件。而谷歌的解決方案則簡單粗暴的多,所有的硬體都是相同的,面對不同的需求時解決方案的差別僅在於一起協作的硬體的數量,一個“高效能架頂式”交換機就相當於一個“集群交換機”上的一塊板,效能的提升幾乎等同於數量的疊加,而這些相同的硬體都可以運行任何需要運行的軟件。根據Vahdat的介紹,現在谷歌“朱庇特”(Jupiter)系列集群交換機的處理能力已經達到了每秒40Tb,等同於4000萬個家庭用戶接入的帶寬和吞吐量。
圖為谷歌的”朱庇特“(Jupiter)系列集群交換機,每秒可以處理40Tb的數據,相當於4000萬家庭用戶接入的吞吐量。
相較於硬體,Vahdat對於他們解決方案的軟件部分言之甚少。但是他透露他們的網絡設備運行在Linux的系統之上,他們還開發了自己的路由協議“火線”(Firepath),用於判斷數據交換時的最佳路徑。在網絡世界里工業標準的路由協議是BGP和OSPF,開發自己的路由協議是非常罕見的現象。Vahdat解釋說在他們開始搭建網絡的時候這些標準協議還不像今天這般簡單和高效,而他們將要搭建這個世界上最大最復雜的網絡,所以他們需要一個更加簡單快速可擴展的方案。“火線”協議的細節無比復雜,如果要介紹它的優勢,一言以蔽之,“火線”的用戶可以通過一個中央控制軟件來統一設定整個網絡的行為,而在傳統的網絡世界里如果想要達到同樣的效果,網絡管理專家們必須對網絡中的每個交換機一個一個的單獨設定。
谷歌的服務器網絡很可能是世界上最大的一個。一個驚人的事實是,如今谷歌網絡內部數據中心之間交換的數據量已經超過了谷歌和整個互聯網之間交換的數據量。如今像微軟,亞馬遜和Facebook也都面臨著和谷歌類似的挑戰,而他們也各自進行著類似的項目。Facebook從一開始就公開了他們的SDN(software-defined networking)計劃,而美國最大的網絡服務提供商AT&;T也已經在緊鑼密鼓的進行著向這種新的網絡技術的遷移。
SDN技術發展到現在,憑借其低成本,高靈活性和幾乎無限的擴展性的巨大優勢,已經給傳統的網絡設備商帶來了前所未有的挑戰,而這種挑戰很可能是顛覆性的,它意味著傳統網絡設備商們的蛋糕整個變小了,而且將越變越小。當谷歌微軟這樣的巨頭紛紛拋棄思科們的時候,那些中小規模的公司一樣會因為SDN的種種優勢而希望轉投SDN的懷抱,他們之所以還不能這樣做是因為他們不像那些巨頭公司一樣有足夠的資源來設計開發自己的硬體軟件和解決方案。於是一批新的創業公司應運而生,他們專門為其他公司提供新一代的網絡解決方案,“當你只需要花很少的錢買一堆廉價晶片並且用一個中央控制軟件就可以設定整個網絡的時候,昂貴而又復雜的傳統網絡解決方案看起來如此笨拙不堪一擊。”如今Nicira (已經被VMware收購), Big Switch Networks, 和 JR Rivers’ Cumulus Networks等公司的蓬勃發展已經證明了SDN大勢的不可阻擋,網絡世界注定將要迎來一場革命。
- 掌握全球財經資訊點我下載APP
文章標籤
上一篇
下一篇