日韩欧美看国产,欧美精品一二三四,懂色av一区二区三区在线播放,久久噜噜亚洲综合

生成式AL/ML公司面臨的問題:究竟是GPU短缺還是GPU選擇?
發(fā)布時間: 2024-08-19 11:37

我們真的沒有 GPU 計算能力了嗎,還是我們只是在 錯誤的地方尋找 錯誤類型的GPU?最近,GPU短缺的 消息隨處可見。生成式人工智能的爆炸式增長導(dǎo)致了 對以人工智能為中心的 GPU 的瘋狂搶購和漫長的等待時間。對于正在成長的提供大規(guī)模推理服務(wù)的人工智能公司來說,這種 GPU 的短缺并不是真正的問題。 選擇合適的 GPU 才是。


GPU 的短缺并不是真正的問題。 選擇合適的 GPU 才是


AI 推理可擴(kuò)展性和“合適大小”的 GPU


當(dāng)今的“GPU 短缺”實際上是由于 使用效率低下以及對不符合大規(guī)模 AI 應(yīng)用程序需求的 GPU 支付過高的費(fèi)用造成的。大型云計算公司和硬件制造商的營銷機(jī)器已經(jīng)成功地說服開發(fā)人員,他們 絕對需要最新、最強(qiáng)大的硬件 才能成為一家成功的 AI 公司。


A100H100 非常適合訓(xùn)練高級模型,它們無疑是速度最快、最先進(jìn)的 GPU,理應(yīng)受到廣泛關(guān)注。但這些 GPU 數(shù)量不足,而且即使有售,也需要預(yù)付款或簽訂現(xiàn)有合同。


最近有一篇文章,有兩點證實了這一點:


  • 即使是 OpenAI 也無法獲得足夠的 GPU,這嚴(yán)重限制了其近期的發(fā)展路線圖。由于 GPU 短缺,OpenAI 無法部署其多模式模型。

  • 盡管 Nvidia 試圖大幅提高產(chǎn)量,但最高端的 Nvidia GPU H100 仍將缺貨。


同時,GPU 基準(zhǔn)測試數(shù)據(jù)表明,在許多用例中,您不需要最新、最強(qiáng)大的 GPU。消費(fèi)級 GPU(RTX3090、A5000、RTX4090 等)不僅具有高可用性,而且 每美元可提供更多的推理,從而大大降低您的云成本。


在正確的階段選擇“合適大小”的 GPU 可以讓生成式 AI 公司走上盈利、可擴(kuò)展的增長之路,降低云成本,并免受“GPU 短缺”的影響。


如何找到“合適尺寸”的 GPU?


在確定適合您應(yīng)用程序的“合適大小” GPU 時,需要考慮幾個因素。第一步是評估應(yīng)用程序在 AI 模型生命周期的每個階段的需求。這意味著要考慮數(shù)據(jù)預(yù)處理、訓(xùn)練和推理等任務(wù)的不同計算、網(wǎng)絡(luò)和存儲要求。


訓(xùn)練模型


在機(jī)器學(xué)習(xí)模型的訓(xùn)練階段,通常需要大量的計算資源。這包括使用高性能圖形處理單元 (GPU),其數(shù)量可能從數(shù)百到數(shù)千個不等。這些 GPU 需要通過專門設(shè)計的集群中的閃電般快速的網(wǎng)絡(luò)連接進(jìn)行連接,以確保機(jī)器學(xué)習(xí)模型獲得有效訓(xùn)練所需的資源。這些專門設(shè)計的集群針對機(jī)器學(xué)習(xí)的特定需求進(jìn)行了優(yōu)化,能夠處理訓(xùn)練階段所需的大量計算需求。


示例:訓(xùn)練Stable Diffusion(大約成本:60 萬美元)


示例:訓(xùn)練Stable Diffusion (大約成本:60 萬美元)


服務(wù)模型(推理)


在為您的模型提供服務(wù)時,可擴(kuò)展性和吞吐量尤為重要。通過仔細(xì)考慮這些因素,您可以確保您的基礎(chǔ)設(shè)施能夠滿足不斷增長的用戶群的需求。這包括注意預(yù)算限制和架構(gòu)考慮。


值得注意的是,在許多例子中,用于 推理的 GPU 要求明顯低于用于訓(xùn)練的 GPU 要求。盡管如此,許多人仍繼續(xù)使用相同的 GPU 執(zhí)行這兩項任務(wù)。這可能會導(dǎo)致效率低下,因為硬件可能未針對每項任務(wù)的獨(dú)特需求進(jìn)行優(yōu)化。通過花時間仔細(xì)評估您的基礎(chǔ)設(shè)施需求并進(jìn)行必要的調(diào)整,您可以確保您的系統(tǒng)盡可能高效、有效地運(yùn)行。


示例 1:消費(fèi)級 GPU 上每美元可獲得的圖像數(shù)量增加 6 倍


在最近的 Stable Diffusion 基準(zhǔn)測試中,與專注于 AI 的 GPU 相比,消費(fèi)級 GPU 每美元可生成 4 至 8 倍的圖像。大多數(shù)文本轉(zhuǎn)圖像領(lǐng)域的生成式 AI 公司都可以使用消費(fèi)級 GPU 進(jìn)行大規(guī)模推理。經(jīng)濟(jì)性和可用性使其成為此用例的贏家。


消費(fèi)級 GPU 上每美元可獲得的圖像數(shù)量增加 6 倍

示例 2:提供Stable Diffusion XL


在最近推出 SDXL 的公告中,Stability.ai 指出 SDXL 0.9 可在僅具有 16GB RAM 和至少 8GB vRAM 的現(xiàn)代消費(fèi)級 GPU 上運(yùn)行。


大規(guī)模提供“合適規(guī)模”的人工智能推理


在捷智算平臺,我們深知能夠在不花太多錢的情況下大規(guī)模提供 AI/ML 推理的重要性。因此,我們創(chuàng)建了一個全球分布的消費(fèi)級 GPU 網(wǎng)絡(luò),該網(wǎng)絡(luò)從頭開始設(shè)計,以滿足您的需求。我們的客戶發(fā)現(xiàn),轉(zhuǎn)向捷智算平臺而不是依賴大型云計算提供商不僅可以節(jié)省 高達(dá) 90% 的云成本,還可以改善他們的產(chǎn)品供應(yīng)并減少開發(fā)運(yùn)營時間。


示例:24 小時內(nèi)生成 900 多萬張圖片,僅需 1872 美元


在最近為客戶進(jìn)行的基準(zhǔn)測試中,我們在 24 小時內(nèi)生成了 920 萬張穩(wěn)定擴(kuò)散圖像,成本僅為 1872 美元 - 全部使用 Nvidia 的 3000/4000 系列 GPU。這意味著每美元可以生成約 5000 張圖像,從而為這家圖像生成公司節(jié)省了大量成本。


示例:24 小時內(nèi)生成 900 多萬張圖片,僅需 1872 美元


使用捷智算平臺,您無需擔(dān)心昂貴的基礎(chǔ)設(shè)施維護(hù)或意外停機(jī)。如果它在您的系統(tǒng)上有效,它也可以應(yīng)用于捷智算平臺。相反,您可以專注于真正重要的事情 - 服務(wù)于不斷增長的用戶群,同時保持盈利。


要了解您的用例是否適合消費(fèi)級 GPU, 請立即聯(lián)系我們的團(tuán)隊。

粵公網(wǎng)安備 44030502006483號、 粵ICP備15047669號
  • 捷易科技聯(lián)系人
  • 主站蜘蛛池模板: 呼和浩特市| 沂水县| 安康市| 任丘市| 敦化市| 普安县| 白沙| 内丘县| 阿巴嘎旗| 贵南县| 曲松县| 建瓯市| 五家渠市| 玉林市| 北川| 定南县| 盐源县| 双鸭山市| 苏尼特右旗| 高雄县| 顺昌县| 仁化县| 沙田区| 万荣县| 凤凰县| 岑巩县| 通州市| 仙游县| 阳信县| 烟台市| 饶平县| 大渡口区| 镇安县| 十堰市| 屯留县| 万荣县| 凉山| 炉霍县| 普兰店市| 瑞安市| 庆阳市|