DeepSeek一體機
單機可部署R1 671B滿血版
兼容CUDA
| 模型 | 精度 | 顯存 | 總吞吐(tokens/s) | 并發(fā)數(shù) |
|---|---|---|---|---|
| DeepSeek-R1/V3 | BF16 | 1536GB | 3708 | 256 |
| DeepSeek-R1/V3 | INT8 | 1536GB | 5872 | 512 |
| 單臺流暢體驗并發(fā)條件下 | AGP@BF16 | |
|---|---|---|
| 短文本輸入 | TTFT首字延遲(秒) | 0.121-0.583 |
| TPOT解析延遲(秒) | 0.029-0.052 | |
| 總吞吐速度(tokens/秒) | 68-322 | |
| 長文本輸入 | TTFT首字延遲(秒) | 1.181-10.59 |
| TPOT解析延遲(秒) | 0.050-0.056 | |
| 總吞吐速度(tokens/秒) | 648-826 | |
| 訓(xùn)推一體機 | 智能體一體機 | 高性能一體機 | |
|---|---|---|---|
| 特性 | 單機16卡DeepSeek滿血版支持16/8/4bit全精度推理,實現(xiàn)軟硬一體的訓(xùn)練和推理性能極致加速,實現(xiàn)全棧AI可觀測 | 搭載模型微調(diào)、數(shù)據(jù)知識處理和智能體RAG搭建的全棧大模型工具鏈,具備高效訓(xùn)推性能,預(yù)制應(yīng)用模板開箱即用 | 支持高網(wǎng)環(huán)境下多機多卡的高性能PD分離式推理與分布式訓(xùn)練,支持模型蒸餾后訓(xùn)練 可納管異構(gòu)GPU,支持并行化多模態(tài)數(shù)據(jù)預(yù)處理與海量向量RAG檢索 |
| 智算 | APG 16卡 單臺 | APG 16卡 單臺 | APG 16卡 2-10臺 |
| 通算 | - | 海光 3臺 | 海光 3臺+ |
| 交換機 | - | 25GE | 200GE/400GE |
| 軟件 | 預(yù)裝內(nèi)置 容器/存儲/緩存/數(shù)據(jù)庫 | ||
| 訓(xùn)推平臺 | 訓(xùn)推+智能體平臺 | 訓(xùn)推+智能體平臺 | |
| 服務(wù) | 軟硬件安裝部署、性能調(diào)優(yōu)測試、行業(yè)模型訓(xùn)練、智能體應(yīng)用搭建 | ||
|
可支持模型列表: |
|||
實現(xiàn)DeepSeek R1/V3及其蒸餾模型的極致適配,確保推理性能和效率達到最優(yōu)狀態(tài)
