以下文章來源于Gitee AI,作者馬建倉
Gitee AI 剛剛上線了DeepSeek-R1-Distill-Qwen-1.5B
、DeepSeek-R1-Distill-Qwen-7B
、DeepSeek-R1-Distill-Qwen-14B
、DeepSeek-R1-Distill-Qwen-32B
四個較小尺寸的 DeepSeek 模型。更值得關注的是,本次上線的四個模型均部署在國產沐曦曦云 GPU 上。
與全尺寸 DeepSeek 模型相比,較小尺寸的 DeepSeek 蒸餾版本模型更適合企業(yè)內部實施部署,可以極大的降低落地成本。
同時,這次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平臺,更是實現(xiàn)了從芯片到平臺,從算力到模型,全國產研發(fā)、中國制造。
DeepSeek R1 是一款大型混合專家(MoE)模型,擁有 6710 億個參數(shù),支持 128000 個 Token 的大輸入上下文長度。在數(shù)學、代碼和自然語言推理等任務上表現(xiàn)出色。
本次部署在沐曦曦云 GPU 上的是四個 DeepSeek R1 蒸餾模型,以更小參數(shù)量的資源占用,實現(xiàn)了性能與大參數(shù)模型旗鼓相當。
曦云系列通用 GPU 產品(包括 C550、C500、C500X、C290、C280、N260 等型號)采用完全自主研發(fā)的 GPU IP,擁有完整的知識產權,并具備強大的多精度混合計算能力及高帶寬顯存支持。同時,沐曦產品搭載先進的時空互聯(lián)技術和全球兼容的 MXMACA 軟件棧,可廣泛應用于智能、通用計算和數(shù)據處理等場景。
在本次部署適配工作中,得益于沐曦曦云良好的 CUDA 兼容性,同時得到沐曦的算力供應商超訊通信的鼎力支持,最終實現(xiàn)了模型的快速部署、穩(wěn)定調用。
更多國產芯片適配工作已在緊鑼密鼓進行中,各位開發(fā)者敬請期待。
2024 年初上線以來,Gitee AI 平臺以 Serverless API、模型引擎、AI 應用為核心功能與服務,致力于讓開發(fā)者輕松構建和部署 AI 應用,為企業(yè)客戶提供更加智能、高效的 AI 應用解決方案。
目前 Gitee AI 上的DeepSeek-R1-Distill
系列模型現(xiàn)已面向全體開發(fā)者免費使用!免費使用!免費使用!
本次上線的模型參數(shù)雖小,但它們表現(xiàn)并不亞于大參數(shù)模型,如下圖中的DeepSeek-R1-Distill-Qwen-14B
,雖然參數(shù)較小,但簡單任務相較于大參數(shù)模型其響應速度更快,同時也具備體現(xiàn)思考過程的能力:
模型自強、算力自強、平臺自強,100%國產AI的新時代已然來臨。與其在“制裁-替代-再制裁”的循環(huán)中疲于奔命,不如和我們一起在國產 AI 的土壤上,種出下一個時代的參天大樹。
點擊文末閱讀原文訪問 Gitee AI,體驗基于沐曦算力的 DeepSeek R1,開啟你的100%國產AI開發(fā)之旅!
Gitee AI 的 Serverless API 提供了文本生成、視覺模型、圖像處理、語音識別、語音生成、向量與重排模型、代碼生成等 9 種類型共 52 個大模型的 API 使用。通過購買模型資源包,即可通過極低的價格即可盡享眾多主流模型。