微信掃一掃
美國人工智能(AI)芯片龍頭輝達(dá)(NVIDIA,又譯英偉達(dá))執(zhí)行長黃仁勛近期首度公開談?wù)撝袊鳧eepSeek引發(fā)輝達(dá)股價(jià)賣壓,表示投資人弄錯(cuò)了DeepSeek進(jìn)步的訊息,正確的訊息應(yīng)該是AI的后訓(xùn)練(post-training)階段才是關(guān)鍵,對輝達(dá)芯片的需求不減反增。
DeepSeek在1月發(fā)表“R1”大型語言模型(LLM),以較低的成本獲得高效能,引發(fā)美國科技巨擘的AI投資前景憂慮,拖累輝達(dá)股價(jià)在1月挫跌,但近期輝達(dá)股價(jià)幾乎已收復(fù)失土。黃仁勛20日在合作伙伴DDN預(yù)錄的訪談?dòng)捌硎荆x達(dá)股價(jià)對DeepSeek的劇烈反應(yīng),源于投資人對DeepSeek進(jìn)步的解讀錯(cuò)誤。AI產(chǎn)業(yè)仍需要運(yùn)算能力進(jìn)行AI模型的后訓(xùn)練,后期訓(xùn)練的方法多元,對輝達(dá)芯片所供應(yīng)運(yùn)算能力的需求也將成長。
后期訓(xùn)練讓AI模型能在完成訓(xùn)練后,做出結(jié)論或進(jìn)行預(yù)測。黃仁勛說,“從投資人的角度來看,過去都有一種心智模型,認(rèn)為世界是先預(yù)訓(xùn)練(pre-training),接著再(進(jìn)入)推論(階段),(投資人認(rèn)知的)推論是:你問了AI一個(gè)問題,就能立刻獲得答案”,他認(rèn)為,這個(gè)心智圖是不對的。他說,預(yù)訓(xùn)練仍然很重要,但后期訓(xùn)練反而是最重要的智能環(huán)節(jié),“是(AI)學(xué)會(huì)解決問題的環(huán)節(jié)”,后期訓(xùn)練方法“如火如荼”進(jìn)展,AI模型持續(xù)以新的推理方法進(jìn)步。他稱贊DeepSeek的創(chuàng)新提振AI產(chǎn)業(yè)的活力,“實(shí)在令人無比興奮。
R1開源在全球激起的活力令人驚嘆”。輝達(dá)26日將舉行財(cái)報(bào)說明會(huì),黃仁勛勢必面對DeepSeek的問題,這番談話可能也是他的回應(yīng)。近期的美股財(cái)報(bào)季,DeepSeek已成為熱議話題,超微(AMD)執(zhí)行長蘇姿豐也被問到類似問題,她表示DeepSeek正在帶動(dòng)“有利AI采用”的創(chuàng)新。
黃仁勛最近幾個(gè)月不斷駁斥模型擴(kuò)展陷入麻煩的憂慮,在DeepSeek聲名大噪之前,1月就有報(bào)導(dǎo)指出OpenAI的模型進(jìn)步正在放慢,輝達(dá)成長可能放緩。黃仁勛去年11月強(qiáng)調(diào),模型擴(kuò)展“活得很好”,只是從訓(xùn)練轉(zhuǎn)向推論。
Copyright @ 2009-2025 巴西華人網(wǎng) 紹興美信信息技術(shù)有限公司 All Right Reserved@巴西華人網(wǎng);浙公網(wǎng)安備 33069802000078 號