創(chuàng)澤機器人 |
CHUANGZE ROBOT |
DeepSeek-V3 和 DeepSeek-R1 陸續(xù)發(fā)布,國產(chǎn)大模型能力已可比肩海 外領(lǐng)軍大模型。2024 年 12 月 26 日,杭州 AI 公司深度求索(DeepSeek) 正式發(fā)布 DeepSeek-V3 大模型首個版本并同步開源。根據(jù) DeepSeek 網(wǎng) 站信息,DeepSeek-V3 為自研 MoE 模型,671B 參數(shù),激活 37B,在 14.8T tokens 上進行了預(yù)訓(xùn)練。DeepSeek-V3 多項評測成績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型,并在性能上和世界 頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 相當(dāng)。在訓(xùn)練成本方 面,根據(jù) DeepSeek 發(fā)布的技術(shù)文檔論文信息,DeepSeek-V3 的訓(xùn)練時 長為 2788K 個 H800 GPU 小時,訓(xùn)練花費約為 557.6 萬美元。2025 年 1 月 20 日,DeepSeek 正式發(fā)布復(fù)雜推理類大模型 DeepSeek-R1,性能對 齊 OpenAI o1 正式版。以 DeepSeek 系列大模型為代表的國產(chǎn)大模型性 能已可比肩海外領(lǐng)軍大模型,且成本更低。
DeepSeek 系列大模型引發(fā)全球廣泛關(guān)注,海內(nèi)外巨頭科技公司及云服務(wù) 平臺廠商已相繼接入。2025 年 1 月 15 日,DeepSeek 推出 AI 助手 DeepSeek App。2025 年春節(jié)期間,DeepSeek 系列大模型火爆出圈,引 發(fā)全球廣泛關(guān)注。根據(jù)新浪財經(jīng) 2 月 1 日引用彭博社信息,DeepSeek 的 AI 助手在 140 個市場中成為下載量最多的移動應(yīng)用。根據(jù) Appfigures 的 數(shù)據(jù),DeepSeek 的推理人工智能聊天機器人在 1 月 26 日登上蘋果公司 App Store 的榜首,并自那時以來一直保持全球第一的位置。同時,全球 也開始了對 DeepSeek 大模型的復(fù)刻。以港科大團隊為例,港科大助理教 授 何 俊 賢的 團 隊, 只 用了 8K 個 樣 本, 就 在 7B 模型 上 復(fù)刻 出 了 DeepSeek-R1-Zero 和 DeepSeek-R1 的訓(xùn)練。當(dāng)前,海內(nèi)外巨頭科技公 司及云服務(wù)平臺廠商已相繼接入了 DeepSeek 大模型,部分 AI 應(yīng)用領(lǐng)域 相關(guān)企業(yè)也已開始了 DeepSeek 大模型的部署和應(yīng)用。DeepSeek 大模型 獲得了全球的廣泛關(guān)注,認可度持續(xù)提升。我們認為,DeepSeek大模型的開源、低成本和高性能將大幅降低大模型的獲得、部署和應(yīng)用成本,將加快大模型在 B 端和 C 端應(yīng)用場景的落地。另外,DeepSeek 大模型的出 圈將對全球大模型產(chǎn)業(yè)的競爭格局產(chǎn)生重要影響,將對海外領(lǐng)軍大模型廠 商的領(lǐng)先性產(chǎn)生沖擊,并同時將對算力的未來發(fā)展產(chǎn)生重要影響。
DeepSeek 大模型的出圈預(yù)計不改算力整體需求向上的態(tài)勢,但推理和端 側(cè)算力有望增長更快。DeepSeek 在算法效率和計算成本方面有著較大的 優(yōu)勢,短期內(nèi)可能對訓(xùn)練算力的增長有一定的平抑效應(yīng),但是不改 AI 算 力整體需求長期上升的態(tài)勢。AI 作為全球智能化發(fā)展的主要抓手,大模型 當(dāng)前已應(yīng)用于端側(cè)、教育、金融、辦公、傳媒、醫(yī)療、智能汽車、企業(yè)服務(wù)等多個應(yīng)用場景,應(yīng)用領(lǐng)域廣闊。DeepSeek 低成本而且開源的解決方 案,大幅降低了 AI 在各行各業(yè)應(yīng)用的技術(shù)和成本門檻,為 AI 的產(chǎn)業(yè)化落地提供了更快的路徑。推理和端側(cè)的算力需求增長潛力非常大。同時,較低訓(xùn)練成本以及開源的 DeepSeek,有望帶來更低 的大模型開發(fā)和使用門檻,基于該大模型開發(fā)的主體可能更多,也一定程度上為訓(xùn)練算力需求提供了支撐。DeepSeek 并不 是壓縮了算力市場,反而為算力市場增加了更多的想象空間。DeepSeek 也在積極與國產(chǎn) AI 算力平臺合作。DeepSeek 大模 型與國產(chǎn) AI 芯片適配的逐步成熟,將加快推動國產(chǎn) AI 芯片在國內(nèi)大模型訓(xùn)練端和推理端的應(yīng)用,加快國產(chǎn) AI 芯片產(chǎn)業(yè)鏈的 成熟,為國產(chǎn) AI 芯片產(chǎn)業(yè)帶來發(fā)展機遇,同時加快我國大模型產(chǎn)業(yè)的發(fā)展。
![]() |
機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務(wù)機器人 大屏機器人 霧化消毒機器人 紫外線消毒機器人 消毒機器人價格 展廳機器人 服務(wù)機器人底盤 核酸采樣機器人 智能配送機器人 導(dǎo)覽機器人 |