不僅開(kāi)源還便宜好用，硅谷員工直呼“火燒屁股”的DeepSeek大模型強(qiáng)在哪

2025-01-26 15:43:04 澎湃新聞

　　不僅開(kāi)源還便宜好用，硅谷員工直呼“火燒屁股”的DeepSeek大模型強(qiáng)在哪

　　澎湃新聞?dòng)浾?胡含嫣

　　國(guó)產(chǎn)大模型公司深度求索(DeepSeek)發(fā)布的最新AI(人工智能)大模型在海外引起開(kāi)發(fā)者和投資者的熱議。

　　1月20日，量化巨頭幻方量化旗下大模型公司DeepSeek正式發(fā)布推理大模型DeepSeek-R1。作為一款開(kāi)源模型，R1在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上的性能能夠比肩OpenAI o1模型正式版，并采用MIT許可協(xié)議，支持免費(fèi)商用、任意修改和衍生開(kāi)發(fā)等。目前，在國(guó)外大模型排名榜Chatbot Arena上，DeepSeek-R1的基準(zhǔn)測(cè)試排名已經(jīng)升至全類別大模型第三，與OpenAI的ChatGPT-4o最新版并列，并在風(fēng)格控制類模型(StyleCtrl)分類中與OpenAI的o1模型并列第一。

　　更令市場(chǎng)驚訝的是，據(jù)DeepSeek介紹，R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬(wàn)美元，在2048塊英偉達(dá)H800 GPU(針對(duì)中國(guó)市場(chǎng)的低配版GPU)集群上運(yùn)行55天完成，僅是OpenAI GPT-4o模型訓(xùn)練成本的不到十分之一。DeepSeek表示，R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù)，在僅有極少標(biāo)注數(shù)據(jù)的情況下，極大提升了模型推理能力。此外，DeepSeek不僅將R1訓(xùn)練技術(shù)全部公開(kāi)，還蒸餾了6個(gè)小模型向社區(qū)開(kāi)源，允許用戶借此訓(xùn)練其他模型。

　　開(kāi)源模型正在趕超，比OpenAI便宜九成

　　一經(jīng)推出，DeepSeek-R1便憑借其“物美價(jià)廉”的特性在海外開(kāi)發(fā)者社區(qū)中引發(fā)了轟動(dòng)。在API定價(jià)方面，DeepSeek R1服務(wù)對(duì)每百萬(wàn)輸入token收取0.55美元，對(duì)每百萬(wàn)輸出token收取2.19美元/百萬(wàn)，而OpenAI最新版o1模型的相應(yīng)收費(fèi)分別為15美元/百萬(wàn)和60美元/百萬(wàn)。在海外AI社區(qū)中小有名氣的研究者Shubham Saboo表示，作為一款“100%開(kāi)源”的模型，R1比OpenAI o1便宜96.4%，同時(shí)提供類似的性能，建議已經(jīng)訂閱ChatGPT的開(kāi)發(fā)者“放棄沉沒(méi)成本”。

　　除了性能方面的突出表現(xiàn)外，DeepSeek還給出了新的AI大模型搭建思路。英偉達(dá)高級(jí)研究科學(xué)家Jim Fan表示，DeepSeek-R1可能是“首個(gè)展示了RL(強(qiáng)化學(xué)習(xí))飛輪可以發(fā)揮作用且能帶來(lái)持續(xù)增長(zhǎng)的OSS(開(kāi)源軟件)項(xiàng)目”。其中，“飛輪”用來(lái)形容AI系統(tǒng)中自我強(qiáng)化、正向循環(huán)的過(guò)程。DeepSeek的論文顯示，不同于過(guò)去AI模型往往依賴于監(jiān)督微調(diào)(SFT，指AI模型通過(guò)已標(biāo)注的數(shù)據(jù)進(jìn)行訓(xùn)練)，R1完全由強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)，證明了直接強(qiáng)化學(xué)習(xí)是可行的。

　　Jim Fan寫道：“我們正處于一個(gè)奇特的時(shí)間線上，一家非美國(guó)公司正在踐行OpenAI最初的使命，即實(shí)現(xiàn)真正開(kāi)放的前沿研究并讓所有人受益。這種情況簡(jiǎn)直無(wú)法理解。最有娛樂(lè)性的結(jié)果卻是可能性最大的結(jié)果�！�

　　硅谷知名投資機(jī)構(gòu)A16z的合伙人、Mistral AI董事會(huì)成員Anjney Midha表示：“從斯坦福到麻省理工，DeepSeek-R1幾乎在一夜之間成為美國(guó)頂尖大學(xué)研究人員的首選模型。”德國(guó)馬克斯·普朗克量子光學(xué)研究所AI科學(xué)家實(shí)驗(yàn)室負(fù)責(zé)人馬里奧·克倫(Mario Krenn)也盛贊DeepSeek-R1的開(kāi)放性，相比之下，OpenAI旗下的模型“本質(zhì)上都是黑箱”。

　　憑借極低的訓(xùn)練成本，DeepSeek-R1也讓華爾街和投資者感到了震撼。1月24日，參投過(guò)OpenAI、Databricks、Character.AI等知名企業(yè)的風(fēng)險(xiǎn)投資巨頭安德森·霍洛維茨基金(Andreessen Horowitz)的聯(lián)合創(chuàng)始人馬克·安德森(Marc Andreesen)連轉(zhuǎn)了幾篇關(guān)于Deepseek-R1的推文，并對(duì)其進(jìn)行了公開(kāi)贊賞。他在X(原推特)平臺(tái)上寫道：“Deepseek R1是我見(jiàn)過(guò)的最令人驚嘆和印象深刻的突破之一——作為開(kāi)源項(xiàng)目，它是對(duì)世界的一份深刻饋贈(zèng)�！�

　　隨后，法國(guó)企業(yè)家、推特意見(jiàn)領(lǐng)袖阿諾德·貝特朗(Arnaud Bertrand)轉(zhuǎn)發(fā)了安德森的推文，并稱中國(guó)AI的發(fā)展速度令人驚艷：“Deepseek時(shí)刻不僅是關(guān)于AI的，而是讓世界意識(shí)到中國(guó)在技術(shù)和創(chuàng)新方面已經(jīng)趕上了美國(guó)，并且在某些領(lǐng)域甚至超過(guò)了美國(guó)，盡管有人努力阻止這種情況的發(fā)生�！�

　　在近日舉辦的2025年達(dá)沃斯論壇上，AI科技初創(chuàng)公司Scale AI創(chuàng)始人亞歷山大·王(Alexandr Wang)表示，DeepSeek的AI大模型性能“大致與美國(guó)最好的模型相當(dāng)”。去年12月，DeepSeek發(fā)布上一代模型V3后，Alexandr Wang就在X平臺(tái)上評(píng)價(jià)道：“DeepSeek-V3帶給外界的教訓(xùn)是：當(dāng)美國(guó)人在休息時(shí)，中國(guó)人在工作，并以更便宜、更快、更強(qiáng)的產(chǎn)品迎頭趕上�！�

　　而Meta首席AI科學(xué)家楊立昆(Yann LeCun)指出，比起“中國(guó)AI超越了美國(guó)”的觀點(diǎn)，DeepSeek-R1更重要的是證明了“開(kāi)源模型正在超越專用模型”：“DeepSeek得益于開(kāi)源研究和開(kāi)源項(xiàng)目(例如PyTorch和來(lái)自Meta的Llama)。這就是開(kāi)放研究與開(kāi)源的力量�！�

　　1月26日，360創(chuàng)始人周鴻祎發(fā)視頻談“中國(guó)大模型DeepSeek反超GPT”，稱中美AI競(jìng)爭(zhēng)“最終一定是中國(guó)勝利”，就像中國(guó)已經(jīng)在制造業(yè)領(lǐng)域戰(zhàn)勝了美國(guó)：“DeepSeek這家公司最近的表現(xiàn)簡(jiǎn)直逆天，我相信將來(lái)如果要對(duì)抗美國(guó)的AI技術(shù)霸權(quán)，中國(guó)大模型技術(shù)復(fù)仇者聯(lián)盟戰(zhàn)隊(duì)里一定有DeepSeek的一份，因?yàn)檫@家公司和它的創(chuàng)始人非常低調(diào)，他們技術(shù)能力和未來(lái)前景被市場(chǎng)嚴(yán)重低估了�！�

　　AI競(jìng)賽發(fā)展加速，“燒錢”潮流能否持續(xù)

　　同時(shí)，市場(chǎng)開(kāi)始猜測(cè)，DeepSeek-R1的橫空出世是否會(huì)影響一味“砸錢”投入AI競(jìng)賽的美國(guó)科技巨頭們。分析指出，AI行業(yè)競(jìng)爭(zhēng)或?qū)⒁员阮A(yù)想中更快的速度加劇，并有可能影響到上游AI硬件企業(yè)的收入。

　　加州大學(xué)伯克利分校的AI政策研究員Ritwik Gupta表示，DeepSeek-R1的出現(xiàn)證明了“AI能力沒(méi)有技術(shù)護(hù)城河”，并稱“中國(guó)的系統(tǒng)工程師人才庫(kù)比美國(guó)大得多，他們懂得如何充分利用計(jì)算資源來(lái)更高效地訓(xùn)練和運(yùn)行模型”。

　　1月23日，一名Meta員工在匿名職場(chǎng)論壇Teamblind上發(fā)帖稱，Meta內(nèi)部已經(jīng)因?yàn)镈eepSeek-R1而進(jìn)入“恐慌模式”。這位員工寫道：“Meta的工程師們正在爭(zhēng)分奪秒地分析DeepSeek，試圖復(fù)制其中一切可能的技術(shù)，管理層正為生成式AI研發(fā)部門的巨額投入而發(fā)愁�！�

　　該員工表示，DeepSeek-R1的訓(xùn)練成本不到550萬(wàn)美元，而Meta的生成式AI部門里“每位領(lǐng)導(dǎo)的薪資都超過(guò)了這個(gè)數(shù)字”：“(AI部門)本應(yīng)是一個(gè)以工程為核心的小型組織，但因?yàn)楹芏嗳硕枷脒M(jìn)來(lái)分一杯羹，人為膨脹了組織的規(guī)模，結(jié)果人人都是輸家。”

　　隨后，有認(rèn)證為谷歌員工的網(wǎng)友回復(fù)上述言論稱：“DeepSeek做的事情很瘋狂。不僅是Meta，OpenAI、谷歌和Anthropic都因?yàn)樗麄兌馃ü�。這是一件好事，我們可以見(jiàn)證公開(kāi)競(jìng)爭(zhēng)對(duì)創(chuàng)新的推動(dòng)作用。”

　　或許是因?yàn)楦惺艿搅烁?jìng)爭(zhēng)壓力，Meta的CEO馬克·扎克伯格(Mark Zuckerburg)于24日在旗下社交平臺(tái)上表示，公司計(jì)劃在2025年投資600億至650億美元用于資本支出，并計(jì)劃大幅擴(kuò)張AI團(tuán)隊(duì)。到2025年年底，Meta將擁有超過(guò)130萬(wàn)個(gè)GPU。扎克伯格稱“今年將是AI的關(guān)鍵一年”，公司還將在路易斯安那州建設(shè)一座價(jià)值100億美元的數(shù)據(jù)中心。

來(lái)源：澎湃新聞

編輯：董文博

廣告等商務(wù)合作，請(qǐng)點(diǎn)擊這里

本文為轉(zhuǎn)載內(nèi)容，授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人

中新經(jīng)緯版權(quán)所有，未經(jīng)書(shū)面授權(quán)，任何單位及個(gè)人不得轉(zhuǎn)載、摘編或以其它方式使用。

關(guān)注中新經(jīng)緯微信公眾號(hào)(微信搜索“中新經(jīng)緯”或“jwview”)，看更多精彩財(cái)經(jīng)資訊。

今日推薦