中國多家網路平台宣佈上架DeepSeek-R1系列模型

吳碧娥╱北美智權報 編輯部

0
25

2025年初,全球AI領域迎來了一股全新熱潮,DeepSeek以其強大的深度學習能力和廣泛的應用場景,迅速成為科技界和產業界的焦點。中國多家平台宣佈上線DeepSeek大模型,包括中國聯通、京東雲、華為運算、安恆資訊、騰訊雲、百度智慧雲、阿里雲等。DeepSeek憑藉中國技術團隊和本土算力資源,可望推動AI應用和終端技術普及,加速通用人工智慧(AGI)時代到來。

圖片來源 : shutterstock、達志影像

根據超算互聯網消息,近日DeepSeek-R1、V3、Coder等系列模型,已陸續上線中國國家超算互聯網平台,除了DeepSeek-R1模型的1.5B、7B、8B、14B版本已正式上線,,近期將陸續更新32B、70B等版本。DeepSeek-R1小版本模型提供一鍵推理服務;還可根據私有化需求,引入專有資料,對模型進行定制化訓練和開發。

圖1. 超算互聯網上線DeepSeek系列模型;圖片來源;超算互聯網

除R1模型外,國家超算互聯網平台還上線了DeepSeek-V3、DeepSeek-v2.5系列、DeepSeek-coder系列 、DeepSeek-math系列(7b)和DeepSeek-v2系列(Lite)等模型。 超算互聯網指出,DeepSeek模型相較於國外大模型,通過優化計算資源實現了更低的調用成本,被寄望成為中國AI從業者實現批量「彎道超車」的第一步。

而在2月5日,中國雲端運算服務商中國聯通宣佈,聯通雲上架DeepSeek-R1系列模型,聯通雲憑藉7.5版雲智融合、場景能力升級、全域按需部署能力以及強大的安全防護體系,率先與DeepSeek實現多場景深度對接,提供高效、安全、靈活的雲端運算服務,是聯通雲在AI算力領域的一項重大突破。

中國聯通指出,聯通雲已基於星羅平台實現國產及主流算力,適配多規格DeepSeek-R1模型,兼顧私有化和公有化場景,提供全方位運行服務保障,為客戶帶來開箱即用的使用體驗;並實現多產品場景調用,為使用者打造了高效、安全、靈活的智慧算力體驗。聯通雲基於聯合創新和自研加速引擎,與DeepSeek-R1模型深度對接,簡化調用流程,具備複雜任務下的推理能力,並確保使用者的資料隱私與安全性,以滿足內外部客戶需求。

同時,京東雲已正式上線DeepSeek-R1及DeepSeek-V3模型,支援「公有雲線上部署」及「專混私有化實例部署」兩種模式,供用戶按需求快速調用。除了聯通雲和京東雲外,包括華為運算、安恆資訊、百度智慧雲、阿里雲、騰訊雲都陸續宣佈將DeepSeek整合於平台中。

儘管中國在算力受限的情況下,仍致力於追趕AI技術,透過DeepSeek的成本優化和技術創新,將進一步推動全球AI終端技術的創新和應用普及。

作者: 吳碧娥
現任: 北美智權報主編
學歷: 政治大學新聞研究所
經歷: 北美智權報資深編輯
驊訊電子總經理室特助
經濟日報財經組記者
東森購物總經理室經營企劃


發表留言

請輸入您的評論!
請在此輸入您的姓名