內地AI新創公司深度求索(DeepSeek),開發的大語言模型時,繞過美國人工智能巨頭輝達(NVIDIA)的CUDA框架,有內媒報道,DeepSeek正為未來適配國產GPU晶片做準備。
據《快科技》和《騰訊網》報道,NVIDIA的「統一運算架構」(Compute Unified Device Architecture,CUDA),能大幅降低了研發大模型的難度,獲全球開發商使用,令NVIDIA在人工智能發展上擁有壟斷地位。
DeepSeek如成功改用國產GPU,NVIDIA在人工智能的壟斷地位或被打破。路透社
DeepSeek如成功改用國產GPU,NVIDIA在人工智能的壟斷地位或被打破。路透社
DeepSeek如成功改用國產GPU,NVIDIA在人工智能的壟斷地位或被打破。路透社
DeepSeek如成功改用國產GPU,NVIDIA在人工智能的壟斷地位或被打破。路透社
有內媒報道指,DeepSeek已準備改用國產GPU,以跳出NVIDIA限制。路透社
相關新聞:DeepSeek是甚麼?與ChatGPT有何分別?一文睇清DeepSeek爆紅原因、創辦人梁文鋒來頭
美國科技網站Tom’s Hardware報道,DeepSeek在使用Nvidia的H800晶片進行訓練時,使用了Nvidia的底層硬件指令PTX(Parallel Thread Execution)語言,而不是高級編程語言CUDA。
北京航空航太大學副教授黃雷表示,繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開發,從而實現更加細微性的操作。
報道指,DeepSeek擁有一些擅長寫PTX語言的內部開發者,假如它之後使用中國國產GPU,其在硬體適配方面將會更得心應手,其只要了解這些硬體驅動提供的一些基本函數介面,就可以仿照輝達GPU硬體的程式設計介面,去寫相關的代碼,從而讓自家大模型更加容易適配國產硬體。