DeepSeek︱傳為改用國產GPU做準備　跳出NVIDIA限制

2025-02-02 23:10:00

內地AI新創公司深度求索（DeepSeek），開發的大語言模型時，繞過美國人工智能巨頭輝達（NVIDIA）的CUDA框架，有內媒報道，DeepSeek正為未來適配國產GPU晶片做準備。

據《快科技》和《騰訊網》報道，NVIDIA的「統一運算架構」（Compute Unified Device Architecture，CUDA），能大幅降低了研發大模型的難度，獲全球開發商使用，令NVIDIA在人工智能發展上擁有壟斷地位。

DeepSeek如成功改用國產GPU，NVIDIA在人工智能的壟斷地位或被打破。路透社

有內媒報道指，DeepSeek已準備改用國產GPU，以跳出NVIDIA限制。路透社

美國科技網站Tom’s Hardware報道，DeepSeek在使用Nvidia的H800晶片進行訓練時，使用了Nvidia的底層硬件指令PTX（Parallel Thread Execution）語言，而不是高級編程語言CUDA。

北京航空航太大學副教授黃雷表示，繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開發，從而實現更加細微性的操作。

報道指，DeepSeek擁有一些擅長寫PTX語言的內部開發者，假如它之後使用中國國產GPU，其在硬體適配方面將會更得心應手，其只要了解這些硬體驅動提供的一些基本函數介面，就可以仿照輝達GPU硬體的程式設計介面，去寫相關的代碼，從而讓自家大模型更加容易適配國產硬體。

即時兩岸