當(dāng)前位置：首頁(yè) > 新聞資訊 > 人工智能應(yīng)用 > deepseek大模型生態(tài)報(bào)告,AI供應(yīng)鏈格局將被重塑,基礎(chǔ)模型層商品化,為應(yīng)用開(kāi)發(fā)者帶來(lái)新機(jī)遇

deepseek大模型生態(tài)報(bào)告,AI供應(yīng)鏈格局將被重塑,基礎(chǔ)模型層商品化,為應(yīng)用開(kāi)發(fā)者帶來(lái)新機(jī)遇

來(lái)源：賽迪智庫(kù)電子信息研究所編輯：創(chuàng)澤時(shí)間：2025/3/6 主題：其他 [加盟]

DeepSeek 對(duì)中國(guó)大的啟示，還是“開(kāi)放”二字。無(wú)論是心態(tài)上還是方法上，都要毫不動(dòng)搖地堅(jiān)持開(kāi)放，繼續(xù)開(kāi)放。 DeepSeek 的勝利，就是開(kāi)源打敗閉源。OpenAI 以前是開(kāi)源的，后來(lái)變成閉源的，這次 DeepSeek 爆火之后，OpenAI 的奧特曼也出來(lái)說(shuō)話，承認(rèn)閉源是一種戰(zhàn)略錯(cuò)誤。

本周圍繞 DeepSeek 的熱議，讓許多人清晰地看到了幾個(gè)一直存在的重要趨勢(shì)：美國(guó)在 GenAIL域的L先地位正在被中國(guó)迎頭趕上，AI 供應(yīng)鏈格局將被重塑；開(kāi)放權(quán)重模型正在推動(dòng)基礎(chǔ)模型層商品化，為應(yīng)用開(kāi)發(fā)者帶來(lái)新機(jī)遇；擴(kuò)大規(guī)模并非通往 AI 進(jìn)步的途徑。盡管算力備受追捧，但算法創(chuàng)新正在快速降低訓(xùn)練成本。

“DeepSeek 可能會(huì)開(kāi)辟一個(gè)全新的由中國(guó)引L的技術(shù) 生態(tài)系統(tǒng)，這會(huì)讓的開(kāi)發(fā)者因 DeepSeek 開(kāi)發(fā)的低成本、更G效的人工智能產(chǎn)品而受益。”一位 TMT L域投資人如是說(shuō)，“這種競(jìng)爭(zhēng)從某種程度來(lái)說(shuō)也將打破美國(guó)科技巨頭的市場(chǎng)主導(dǎo)地位。

大模型訓(xùn)練降低成本主要靠?jī)烧校簤嚎s、并行和提升硬件使用效率。DeepSeek-V3 這次所用的方法基本上就是猛揮這三板斧。

1. 壓縮：從結(jié)構(gòu)到量化

壓縮很容易理解，就是把大的東西壓縮成小的。對(duì)于模型訓(xùn)練來(lái)講，壓縮之后，運(yùn)算單元（GPU 和 CPU）需要進(jìn)行的運(yùn)算數(shù)據(jù)量就會(huì)減少，運(yùn)算速率必然會(huì)提升。另一個(gè)重要影響是，內(nèi)存占用和緩存會(huì)減少，這樣訓(xùn)練同樣大小的模型所需要的硬件規(guī)模也可以大幅減少。

2. 并行：對(duì)硬件的J限使用

要實(shí)現(xiàn)更快的訓(xùn)練速度，有效的方法就是增加并行計(jì) 算的規(guī)模，讓更多的計(jì)算單元同時(shí)處理不同的數(shù)據(jù)或任務(wù)。而在并行中，需要解決的問(wèn)題就是盡可能的有效利用計(jì)算資源，讓它們都G負(fù)載的工作。

DeepSeek-V3 這回真的可以說(shuō)是在訓(xùn)練工程上無(wú)所不用其J�？偨Y(jié)下來(lái)，重要的包括以下這么幾個(gè)方面。

DeepSeek-V3 的橫空出世，用一組的數(shù)據(jù)出色詮釋了沒(méi) 有 GPU Poor，只有卷得不夠多。當(dāng) o1、Claude、Gemini 和 Llama 3 等模型還在為數(shù)億美元的訓(xùn)練成本苦惱時(shí)， DeepSeek-V3 用 557.6 萬(wàn)美元的預(yù)算，在 2048 個(gè) H800 GPU集群上僅花費(fèi) 3.7 天/萬(wàn)億 tokens 的訓(xùn)練時(shí)間，就達(dá)到了足以與它們比肩的性能。這意味著每萬(wàn)億 tokens 僅需 180K 個(gè) H800 GPU 小時(shí)，總計(jì) 278 萬(wàn) GPU 小時(shí)的訓(xùn)練成本。而 Llama 3.1 的訓(xùn)練使用了 16,384 塊 Nvidia H100 GPU，總計(jì) 2100 多萬(wàn) GPU 小時(shí)，翻了十倍。通過(guò) 671B 的總參數(shù)量，在每個(gè) token 激活 37B 參數(shù)的準(zhǔn)確控制下，DeepSeek-V3 用 14.8 萬(wàn) 億G質(zhì)量多樣化 token，構(gòu)建出了一個(gè)能夠超越所有開(kāi)源模型，直逼 GPT-4 和 Claude-3.5 的 AI 巨人。

附件：deepseek大模型生態(tài)報(bào)告,AI供應(yīng)鏈格局將被重塑,基礎(chǔ)模型層商品化,為應(yīng)用開(kāi)發(fā)者帶來(lái)新機(jī)遇