聊天機器人大熱 英偉達借風駛船

黃仁勳介紹英偉達在推動和利用人工智能方面佔盡時機。NVIDIA

過去,當英偉達(NVIDIA)公司創始人兼執行長黃仁勛(Jensen Huang)發出關於人工智能(AI)的豪言壯語時,感覺大多像是營銷上的虛張聲勢,但是今年,經過OpenAI的ChatGPT、微軟的Bing等競爭對手一系列的炒作之後,英偉達在GTC(GPU技術大會)顯示其推動和利用AI方面佔盡時機。

「我們正處於AI的iPhone時刻。」黃仁勛在GTC主題演講中點出英偉達在AI浪潮開始時發揮的作用:他在2016年親自為OpenAI帶來了一台DGX人工智能超級計算機,最終被用來構建ChatGPT。DGX系統多年來不斷發展,但仍超出了許多公司的負擔能力,DGX A100在2020年售價20萬元。

這就是英偉達新推出的DGX Cloud的用處。該服務可以在線利用其AI超級計算機的力量。單個節點的起價僅為每月3萬6999元,可為企業提供一種更靈活的方式來擴展其AI需求。DGX雲還可以與現場的DGX設備一起工作。

英偉達表示,DGX Cloud的每個實例都配有8個H100或A100系統,60GB的VRAM,每個節點內存總量達640GB,還有高性能的存儲,以及將各系統連接在一起的低延遲結構。DGX Cloud開始時將由甲骨文的OCI託管,下一季度將擴展到微軟Azure,「很快」還將擴展到谷歌雲和其他供應商。

英偉達發布了AI Foundations,方便企業開發自己的大型語言模型(LLM),類似於ChatGPT和生成式AI。Adobe、Getty Images和Shutterstock等大公司已經用它來建立LLM。它還通過語言服務NeMo以及圖像、視頻和3D服務NVIDIA Picasso直接與DGX雲相聯繫。

英偉達展示了四款推理平台,以處理AI任務。一是NVIDIA L4。據該公司稱,L4的「AI視頻性能是CPU的120倍,能效提高99%」,可用於視頻流、編碼和解碼,以及生成AI視頻。二是NVIDIA L40,專門用於生成2D和3D圖像。三是NVIDIA H100 NVL,該LLM解決方案擁有94GB內存和加速的Transformer Engine,據稱可提供比A100快12倍的GPT3推理性能。最後是NVIDIA Grace Hopper for Recommendation Models,該推理平台適用於推薦模型,圖形神經網絡和矢量數據庫。

NVIDIA L4即日起就可在谷歌雲G2機器上預覽。谷歌和英偉達還宣布,生成式AI視頻工具Descript以及藝術應用WOMBO都已經在谷歌雲上使用L4。本報訊

科技-三藩市版