熟妇人妻一区二区三区四区,久久ER99热精品一区二区,真实的国产乱XXXX在线,性XXXX18精品A片一区二区

關(guān)注公眾號

關(guān)注公眾號

手機(jī)掃碼查看

手機(jī)查看

喜歡作者

打賞方式

微信支付微信支付
支付寶支付支付寶支付
×

亞馬遜披露多年自研芯片歷程,與英偉達(dá)合作詳情

2023.12.04

·AWS正與英偉達(dá)合作推動Ceiba項目。英偉達(dá)將擁有自己的超級計算機(jī)供自己使用,并提供DGX云服務(wù)(訓(xùn)練即服務(wù))給他們的最終客戶,AWS也將為自己的客戶提供英偉達(dá)GH200 NVL32的多節(jié)點(diǎn)集群。

·對于Trainium 2及Graviton 4在中國市場的推出時間,AWS計算和網(wǎng)絡(luò)副總裁大衛(wèi)·布朗在接受澎湃科技采訪時表示還未有明確時間表。

在11月26日-12月1日期間舉辦的2023亞馬遜云科技re:Invent全球大會上,亞馬遜云科技(AWS)公布了其在硬件方面的諸多努力,推出了專為訓(xùn)練人工智能系統(tǒng)而設(shè)計的第二代芯片Trainium 2,以及通用Graviton 4處理器。英偉達(dá)CEO黃仁勛也到現(xiàn)場站臺,宣布AWS成為第一家在云端配備英偉達(dá)最新GH200 Grace Hopper超級芯片的云廠商。

對于Trainium 2及Graviton 4在中國市場的推出時間,AWS計算和網(wǎng)絡(luò)副總裁大衛(wèi)·布朗(David Brown)在大會期間接受澎湃科技采訪。


在為期5天的會議期間,生成式人工智能幾乎是每場論壇都會提及的高頻詞匯,成本優(yōu)化則是相關(guān)熱門話題。在此期間,記者對話亞馬遜云科技數(shù)據(jù)庫、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)全球副總裁斯瓦米·西瓦蘇布拉馬尼安(Swami Sivasubramanian)和大衛(wèi)·布朗,談及與英偉達(dá)的合作詳情,AWS自研芯片的發(fā)展過程,以及當(dāng)下對生成式人工智能發(fā)展熱潮的思考。

“成為運(yùn)行英偉達(dá)GPU的最佳場所”

“我們與英偉達(dá)密切合作了很長時間,投入了大量資源,將最新的英偉達(dá)GPU引入AWS(亞馬遜云科技)。”布朗表示,當(dāng)你運(yùn)行英偉達(dá)GPU時,要做得好非常具有挑戰(zhàn)性。現(xiàn)在正在發(fā)生的事情是,這些GPU變得非常復(fù)雜,從工程角度來看,運(yùn)行它們變得非常困難。“我認(rèn)為AWS在如何運(yùn)行這些GPU方面確實勝過其他所有競爭對手,我們也希望成為運(yùn)行英偉達(dá)GPU的最佳場所。”

黃仁勛在大會現(xiàn)場的對話中提到了一個他稱之為“驚人的”統(tǒng)計數(shù)據(jù):僅在過去幾年中,AWS在云中部署了200萬個使用Ampere和Hopper架構(gòu)的GPU,這相當(dāng)于一個3000 EFLOPS(每秒進(jìn)行百億億次浮點(diǎn)運(yùn)算)運(yùn)算性能的超級計算機(jī)。

“擁有一臺百億億級次浮點(diǎn)運(yùn)算性能的超級計算機(jī)就非常令人羨慕,而AWS相當(dāng)于擁有3000臺這樣的超級計算機(jī)。”黃仁勛說,“這才只是一個開始。我們與AWS的合作仍在以驚人的速度增長。每個季度,我們都會為AWS部署超過1 ZFLOPS(1 ZFLOPS=1000 EFLOPS)的計算能力,這是一個令人難以置信的數(shù)字,我們兩個團(tuán)隊建立了一整套新的基礎(chǔ)設(shè)施。”

與此同時,AWS實際上一直在投資自己的定制芯片,從2013年推出首顆Nitro 1芯片至今,AWS是最先涉足自研芯片的云廠商,已擁有虛擬化芯片、服務(wù)器芯片、人工智能機(jī)器學(xué)習(xí)自研芯片3條產(chǎn)品線。

為何“雙管齊下”,一邊與英偉達(dá)合作更加緊密,一邊自研芯片?

布朗解釋稱,一切都是為了確保客戶有選擇。“選擇是如此重要。它真的推動了正向的客戶體驗,并且從長遠(yuǎn)來看,這將帶來最好的結(jié)果,因為所有這些選擇都在獨(dú)立創(chuàng)新,彼此競爭。在某些情況下,一些工作負(fù)載可能在Trainium上,而在其他情況下可能在英偉達(dá)上,所以最終可能不會有一個贏家,始終會有英偉達(dá)、Trainium和市場上的其他選擇。”

對于為何AWS有自研的Titan大模型,同時又投資OpenAI的競爭對手Anthropic,在AWS平臺同時提供Claude 2大模型等選項,西瓦蘇布拉馬尼安也給了相似的答案。“它們實際上具有不同的能力,Claude 2具有非常好的推理能力,而Titan模型非常靈活,兩者在性能成本等方面也很不同。我認(rèn)為擁有更多的選擇從客戶角度來看是一件好事,這也是激勵我們的原因。”

AWS正與英偉達(dá)合作推動Ceiba項目,計劃構(gòu)建全球最快的GPU驅(qū)動的AI超級計算機(jī)——配置16384顆英偉達(dá)H200超級芯片,能處理65 EFLOPS速度等級的AI運(yùn)算,為英偉達(dá)研發(fā)團(tuán)隊提供服務(wù)。

對于記者詢問Ceiba項目是否只服務(wù)于英偉達(dá),布朗表示,英偉達(dá)將擁有自己的超級計算機(jī)供自己使用,并提供DGX云服務(wù)(訓(xùn)練即服務(wù),AI-training-as-a-service)給他們的最終客戶,AWS也將為自己的客戶提供英偉達(dá)GH200 NVL32的多節(jié)點(diǎn)集群。

“繼續(xù)成本優(yōu)化”

“我在這周進(jìn)行的對話實際上都關(guān)于如何繼續(xù)成本優(yōu)化。生成式人工智能如此新穎,大家都在努力弄清楚如何在業(yè)務(wù)中應(yīng)用它,但有兩件事必須考慮清楚。”布朗說。

第一是構(gòu)建概念驗證,真正測試生成式人工智能對業(yè)務(wù)的潛在影響。第二,當(dāng)企業(yè)擁有了生成式人工智能解決方案,必須確保它可以適應(yīng)企業(yè)的損益表。如果運(yùn)行成本過高,實際上無法部署,因為它將沒有用處。布朗表示,“無論是通過開發(fā)模型還是Trainium芯片這樣的方式,我們都希望真正降低生成式人工智能所需的成本。”

西瓦蘇布拉馬尼安也在對話中表示,企業(yè)需要的不僅僅是更大的模型,更關(guān)鍵的是投資回報。“比如我正在構(gòu)建生成式人工智能應(yīng)用程序,希望增加收入或降低成本,但我不想在推理上花費(fèi)巨額資金,因為這意味著我可能無法產(chǎn)生盈利。當(dāng)我們與這些企業(yè)合作時,他們會意識到其實際上需要的是一個較小的模型以適應(yīng)特定用例,這樣就可以在不使用大型模型的情況下從生成式人工智能中獲得價值。他們實際上從一個非常龐大的模型過渡到了經(jīng)過精細(xì)調(diào)整的較小模型,并取得了更低的成本、更高的準(zhǔn)確性和更好的性能。”

在回顧AWS從2013年推出Nitro芯片的歷程時,被高頻提及的也是成本優(yōu)化。“摩爾定律(注:摩爾定律指集成電路上可容納的晶體管數(shù)目,約每隔18-24個月便會增加一倍,性能也將提升一倍。)早在十幾年前就有所減弱,就像人們說的,我們不可能讓這些芯片再快一點(diǎn)了,因為如果再添加更多的晶體管,就無法保持冷卻效果,這是一個物理問題。我們正處于這樣一個旅程中,我們需要思考,如何持續(xù)提高性能、降低成本?”布朗表示,“除非我們真的涉足芯片并在硬件上進(jìn)行創(chuàng)新,否則我們所能做的事情就會受到限制,我們不能僅僅依賴于行業(yè)中現(xiàn)有的東西。因此,我們首先從Nitro開始這個旅程。”

布朗繼續(xù)分享道,“然后我們想,是否真的可以構(gòu)建一款服務(wù)器芯片?這個想法是,我們可以構(gòu)建一款基于Arm架構(gòu)的芯片。Arm架構(gòu)就在每個人的手機(jī)上,它的功耗很低,因為其整個芯片的架構(gòu)都是為全天電池運(yùn)行而設(shè)計,它還有一個強(qiáng)大的生態(tài)系統(tǒng),有很多為手機(jī)編寫的應(yīng)用程序。我們當(dāng)時認(rèn)為Arm架構(gòu)是我們構(gòu)建服務(wù)器芯片的完美選擇,這就是Graviton的由來。”

推理芯片Inferentia和訓(xùn)練芯片Trainium則可以追溯到5年前,當(dāng)時布朗團(tuán)隊認(rèn)為,機(jī)器學(xué)習(xí)中的絕大部分成本實際上是推理,如果能夠構(gòu)建一個推理芯片并降低推理成本,客戶就可以完成更多推理并改進(jìn)應(yīng)用程序,訓(xùn)練方面也同樣。“現(xiàn)在由于生成式人工智能的原因,訓(xùn)練占主導(dǎo)地位,但隨著更多人使用生成式人工智能,推理的工作負(fù)載會在時間的推移中恢復(fù),Inferentia 2將非常適合這個用途。”布朗說。

目前這些工作已經(jīng)帶來了回報,據(jù)布朗介紹,Graviton比當(dāng)時的可用產(chǎn)品計算性能提升了40%,Graviton 2比前一代提高了25%,Graviton 3比Graviton 2更優(yōu),現(xiàn)在Graviton 4至少比Graviton 3提高了30%。


“這就是我們在Graviton上看到的,我們正在改變芯片的架構(gòu)方式,改變簡化芯片的方式,改變?yōu)樾酒峁╇娫吹姆绞剑瑫r還有許多可以提高性能的方法。因此,摩爾定律的消失并不意味著我們不再能通過創(chuàng)新和加速性能的方式來發(fā)展。”布朗說。

解決算力需求劇增帶來的環(huán)境問題

對于2024年生成式人工智能如何發(fā)展有何判斷?西瓦蘇布拉馬尼安對澎湃科技表示,這些模型將因其推理能力等的不斷提升而變得越來越強(qiáng)大,因此我們將會看到更多的應(yīng)用。

而隨著生成式人工智能應(yīng)用到各個領(lǐng)域,對算力的需求也會進(jìn)一步劇增,如何解決高算力帶來的能源消耗與環(huán)保問題?

據(jù)布朗透露,到2040年,亞馬遜公司整體將實現(xiàn)碳中和,但這包括貨車、飛機(jī)等,因此,在碳足跡方面,AWS將在2030年實現(xiàn)碳中和。

“這意味著我們在數(shù)據(jù)中心使用的電力將來自綠色能源,如風(fēng)、水、太陽能,或者如果我們必須消耗不來自綠色能源的電力,我們將購買碳抵消來確保該電力從碳中和的角度來看是綠色的。我們正在按計劃實現(xiàn)2030年的碳中和目標(biāo),到2025年,我們實際上產(chǎn)生的清潔水將比消耗的更多。”布朗說。

那么在芯片方面如何更加節(jié)能?布朗說,“最好的辦法就是不使用電力。因此,使用Graviton會比同類芯片少用60%的電來完成相同的工作負(fù)載,這意味著在我們工作負(fù)載上所用的能量要比在其他云服務(wù)提供商上看到的要少得多。如果看Trainium 2,它實際上使用的能量比Trainium 1完成相同工作負(fù)載要少兩倍。”

推薦
關(guān)閉