近日,深度求索(DeepSeek)旗下全系列大模型——包括專注自然語言處理的DeepSeek-R1、聚焦圖像生成的DeepSeek-V3以及針對快速代碼生成的DeepSeek-Coder——正式接入國家超算互聯(lián)網(wǎng)平臺。憑借在文本生成、圖像創(chuàng)作和程序開發(fā)輔助等多個場景的強大功能,DeepSeek系列的“國家級”上線不僅拓寬了其應用領域,也為國產(chǎn)AI技術的生態(tài)發(fā)展和普及注入了新動能。
國家超算互聯(lián)網(wǎng)平臺以互聯(lián)網(wǎng)思維運營超算中心,連接產(chǎn)業(yè)生態(tài)中的算力供給、應用開發(fā)、運營服務、用戶等各方資源與能力,形成一體化超算算力網(wǎng)絡與服務平臺。平臺自去年4月正式上線以來,致力于促進超算算力一體化運營、打造國家算力底座,已覆蓋科學計算、工業(yè)仿真、人工智能(AI)模型訓練等各類應用領域。截至今年1月,平臺上已有超過6500款各類算力商品,其中模型服務近240款,包括DeepSeek、Qwen等國內(nèi)開源大模型,以及Llama、Stable Diffusion、Gemma、Mistral、StarCoder、ChatGLM等國外開源模型。
作為國內(nèi)AI領域的新銳力量,DeepSeek系列在性能上與國際頂尖大模型不相上下,卻借助算法優(yōu)化有效降低了計算資源消耗。此次接入國家超算互聯(lián)網(wǎng)平臺后,用戶無需本地下載,即可在線部署、推理并進行定制化訓練與開發(fā),大幅降低AI技術使用門檻;平臺依托國產(chǎn)深算智能加速卡與全國一體化算力服務體系,也為DeepSeek等模型提供了豐富的異構(gòu)算力資源,進一步保證了國產(chǎn)AI應用與創(chuàng)新所需的持久算力支持。
國家超算互聯(lián)網(wǎng)平臺相關負責人表示,此次DeepSeek的全面上線,是“國產(chǎn)AI技術與國家級綜合算力服務平臺融合”的前沿實踐。在市場、技術、創(chuàng)新、產(chǎn)品及用戶層面,DeepSeek系列的規(guī)?;瘧糜型苿訃鴥?nèi)AI技術生態(tài)的多元化發(fā)展,加速中國乃至全球AI市場的應用落地和產(chǎn)業(yè)化進程。業(yè)界普遍認為,隨著DeepSeek對更多使用場景的支持,國內(nèi)AI行業(yè)對海外閉源模型的依賴或?qū)⒅鸩綔p輕,未來國產(chǎn)AI技術的規(guī)模化應用潛力也將進一步釋放。