NVIDIA和Google Cloud攜手 加速生成式AI 創新
此次合作爲幫助全球數以千計的新創企業更快地建立生成式人工智慧應用程序和服務。「我們的目標是消除新創企業開發生成式AI應用的成本障礙,讓他們能夠更快地爲客戶創造價值」NVIDIA創始人兼執行長黃仁勳表示。「通過與Google Cloud的合作,我們可以爲新創企業提供強大的技術支援和資源,加快行業創新的步伐。」
此外,Google for Startups Cloud計劃的成員也可加入NVIDIA Inception計劃,獲得技術培訓、NVIDIA硬體和軟體等福利。這些新創公司還可以參與NVIDIA Inception Capital Connect,讓他們與感興趣的投資者接洽。
爲了進一步優化生成式AI模型在NVIDIA平臺上的運行,NVIDIA與Google合作對DeepMind的Gemma模型進行了特定優化。NVIDIA TensorRT-LLM庫可以顯著提升Gemma在NVIDIA GPU上的效能。同時,NVIDIA的NIM微服務也能與Google Kubernetes Engine無縫整合,簡化AI模型的部署。
爲配合這些努力,Google Cloud還宣佈將在下個月全面推出基於NVIDIA H100 GPU的A3 Mega虛擬機器。這些新實例將使A3系列的GPU間帶寬提升一倍。此外,Google Cloud還將引入支援機密計算的新虛擬機器,幫助客戶保護敏感數據。
未來,NVIDIA和Google Cloud還將於2025年在Google Cloud上推出搭載NVIDIA GB200 NVL72 GPU的DGX Cloud服務。該GPU基於NVIDIA最新的Blackwell架構,在生成式AI模型的訓練和推理性能方面都有大幅提升。