如果大家有關注各硬件廠商的新品發(fā)布活動,可能會注意到這樣一個現(xiàn)象,比起普通消費者,云計算廠商如今似乎對于更新硬件配置要熱心得多。許多時候,那些最新最強的處理器、加速器和存儲器件剛一發(fā)布,往往就會看到不止一家云計算廠商出來 " 站臺 ",并積極宣傳新硬件所帶來的性能提升。
為什么云計算廠商會普遍對 " 新硬件 " 格外熱心?因為對于云計算這種商業(yè)模式來說,絕對的硬件性能提升就必然意味著可以用更短的時間去完成既定的計算量,從而能夠得到更多的設備 " 空閑 ",相當于在原有的總時間內可以應對更多用戶需求。而能效比的上漲更是會帶來同等計算量下功耗的降低,從而直接拉低巨大規(guī)模機房的運營成本。
除了爭搶算力,自研芯片更是云計算廠商的重要選擇之一
當然,除了 " 爭搶 " 最新的通用硬件之外,也有一些云計算廠商選擇 " 兩條腿走路 "、發(fā)力自研芯片方案。只不過縱觀整個云計算行業(yè)不難發(fā)現(xiàn),對于 " 自研芯片 " 這件事,不同的企業(yè)似乎有著并不一致的目的。比如,有些企業(yè)雖然喜歡高調宣傳他們的 " 自研 " 項目,但在其真正提供的云計算實例中,幾乎沒有多少服務真的用到了這些 " 自研芯片 "。
而與之相映成趣的,則是已連續(xù) 13 年被 Gartner 評為戰(zhàn)略云平臺服務(SCPS)魔力象限 " 領導者 " 的亞馬遜云科技。歷數(shù)亞馬遜云科技如今的自研產品陣容不難發(fā)現(xiàn),他們已經擁有包括通用處理器 Graviton、AI 訓練芯片 Amazon Trainium、AI 推理芯片 Amazon Inferentia,以及網絡系統(tǒng) Nitro 在內的至少四大類自研硬件 / 芯片家族。
更不要說,根據云成本管理和優(yōu)化平臺 Vantage 的一項調查顯示,在實例類型的成本支出方面,在 2024 第一季度的 Amazon EC2 M7 系列通用實例類型上,采用 Graviton 的 M7g 系列已經超過三分之一(34.5%);到了 2024 年第二季度,在 Amazon RDS、Amazon ElastiCache 和 Amazon OpenSearch 托管服務所采用的實例類型中,Graviton 已經超越了 Intel。
不難看出,作為持續(xù)的行業(yè)領導者,亞馬遜云科技不只是擁有客觀上更多的自研芯片種類。更為重要的是,他們是真的將自研芯片投入到了主力云計算業(yè)務中,并已取得了客觀上的巨大成功。
從最初就開始 " 務實 ",是亞馬遜云科技自研芯片的奧秘
那么,為何亞馬遜云科技不僅能夠自研硬件,而且可以讓自研硬件帶來云計算業(yè)務上的優(yōu)勢呢?要弄明白這一點,我們需要稍微做一些 " 歷史功課 "。
亞馬遜云科技的硬件自研之路始于 2012 年,并且從 2013 年就被確立為重要的業(yè)務策略,同年他們就研發(fā)出了第一款自研芯片 Nitro。
需要注意的是,Nitro 并非如今大家 " 喜聞樂見 " 的通用處理器或 AI 芯片,它本質上其實是一個專用硬件系統(tǒng),主要用于高性能網絡處理和虛擬化卸載。亞馬遜云科技之所以要優(yōu)先研發(fā)它,是因為他們注意到當時傳統(tǒng)的、基于軟件的網絡虛擬機程序將大量的 CPU 資源消耗在了網絡封包的卸載和加速操作上。而通過一款專用硬件系統(tǒng)去轉移這個負載,就可以將服務器的更多 CPU 算力解放出來、讓這些 CPU 性能能夠被更多客戶所使用。
是的,從這段歷史中就不難發(fā)現(xiàn),基于真正現(xiàn)實的需求去進行自研硬件的開發(fā),是亞馬遜云科技一直以來的傳統(tǒng)。事實上,這一點不僅適用于已經更迭了五個代次的 Nitro 系統(tǒng),更在最新的 Amazon Graviton 4 通用處理器的研發(fā)過程中,也起到了極其重要的指導意義。
不同于目前行業(yè)中傳統(tǒng)的、以 " 跑分 ( 基準測試 ) " 為指標的處理器設計思路,Amazon Graviton4 是首個以實際工作負載為目標設計的處理器。在研發(fā)過程中,亞馬遜云科技結合自身的業(yè)務特點,首先設計了真實工作負載的雷達圖,將 CPU 微架構的參數(shù)特性劃分為前端與后端,并各自細分為六項。再根據該雷達圖來衡量 CPU 設計過程中不同的細節(jié),來優(yōu)化對最終實際云計算負載的效果。
正是在這樣的設計思路指導下,最終誕生的 Graviton4 處理器核心數(shù)量增加了 50% 以上,內存帶寬比前代提升超過 75%。按照亞馬遜云科技方面公布的相關信息顯示,這款云計算專用處理器廣泛適用于高性能計算、機器學習、人工智能、容器化應用構建、數(shù)據分析和數(shù)據處理等不同領域。而根據亞馬遜云科技在 Epic Games 的開源教學游戲 Lyra Starter Game 的測試來看,Graviton4 相比于前代帶來了超過 25% 的性價比提升,與 Intel Sapphire Rapids 和 AMD Genoa 相比,更是能夠帶來 30%~35% 的性價比提升。
自研芯片推動服務性價比提升,更帶來可持續(xù)的市場競爭優(yōu)勢
當然,除了強調芯片設計 " 貼近實際場景 " 之外,亞馬遜云科技的許多自研硬件更是成為了其云服務性價比不斷攀升背后的重要因素。
例如,2020 年亞馬遜云科技推出了 Graviton2 處理器,它的計算性能比第一代提升 7 倍、內存速度達到前代 5 倍。
2021 年 Graviton3 面世,它的浮點性能比前代翻倍,但更為重要的是與同期的其他 EC2 實例相比,它的功耗僅有 40%。
除此之外,2022 年亞馬遜云科技發(fā)布了 Inferentia 2 推理芯片。與前代方案相比,基于這顆新芯片的 Inf2 實例吞吐量提升 4 倍、延遲降低 90%,同時還有著 45% 的能效增長。
緊接著在 2023 年,除了前面提到的 Graviton4,亞馬遜云科技還帶來了 Trainium2 芯片。這款 AI 加速芯片比它的前代快 4 倍,同時每瓦性能提升更是多達 2 倍。
這意味著什么?一方面縱觀亞馬遜云科技的歷史不難發(fā)現(xiàn),自從 2006 年推出第一代公有云服務以來,他們至今已主動降價 100 次以上,甚至有時降價幅度極其巨大。比如就在今年 10 月,亞馬遜云科技剛剛宣布將 Amazon DynamoDB 按需吞吐量的價格降低 50%、將全球表(Global Tables)的價格降低多達 67%。很顯然,這種持續(xù)、主動的降價行為,很大程度是得益于了亞馬遜云科技貼近自身需求、且不斷進步的自研硬件體系,并且由于硬件的能效比持續(xù)提升,他們的云服務自然有底氣既越做越好、越做越便宜。
另一方面,這種性能與性價比的雙重提升,也促使亞馬遜云科技可以實現(xiàn)一些規(guī)模驚人、難以被競爭對手企及的性能水準。比如在 AI 訓練方面,EC2 UltraClusters 支持部署多達 100000 個 Trainium2 加速芯片,以實現(xiàn)超算級別、高達 65exaflops 的算力水平。
甚至就連亞馬遜云科技自己,也受益于這種自研芯片所帶來的 " 性價比 " 和規(guī)模優(yōu)勢。此前亞馬遜云科技副總裁 Jeff Barr 曾展示了一張 Graviton4 開發(fā)時的實例集群快照,從中可以看到,他們充分利用自研處理器的規(guī)模優(yōu)勢,使用了多達數(shù)十萬個內核加速 EDA 電子設計自動化流程,峰值規(guī)模為正常使用規(guī)模的 5 倍。而這種對于充足算力的盡情 " 揮霍 ",自然也從側面體現(xiàn)了亞馬遜云科技如今完善的自研芯片體系,給他們的業(yè)務所帶來的顯著性能、能效比,以及難以抗拒的價格競爭力。