91国自产精品中文字幕_娇妻被调教成禁脔h_国产亚洲精品国产_8禁真人抽搐一进一出免费_免费a级午夜绝情美女图片_18禁止在线中文毛女人_亞洲AV無碼潮噴在線觀看_18免费视频无遮挡在线观看

DeepSeek一體機

單機可部署R1 671B滿血版
兼容CUDA

全精度高并發(fā)
國內(nèi)唯一單機16卡全精度16/8/4bit下高并發(fā)滿血版DeepSeek-R1/V3
長窗口低延時
BF16精度下8K+Tokens輸入每秒解析延遲保持在50毫秒
極致推理加速
自研OpenTrek-LLM相比開源vLLM版本可提升吞吐50%,延時降低100%
模板開箱即用
預(yù)置數(shù)據(jù)知識處理+蒸餾 微調(diào)訓(xùn)練+智能體搭建一體工具鏈與應(yīng)用模版
性能報告
模型 精度 顯存 總吞吐(tokens/s) 并發(fā)數(shù)
DeepSeek-R1/V3 BF16 1536GB 3708 256
DeepSeek-R1/V3 INT8 1536GB 5872 512
單臺流暢體驗并發(fā)條件下 AGP@BF16
短文本輸入 TTFT首字延遲(秒) 0.121-0.583
TPOT解析延遲(秒) 0.029-0.052
總吞吐速度(tokens/秒) 68-322
長文本輸入 TTFT首字延遲(秒) 1.181-10.59
TPOT解析延遲(秒) 0.050-0.056
總吞吐速度(tokens/秒) 648-826
一體機系列推薦
訓(xùn)推一體機 智能體一體機 高性能一體機
特性 單機16卡DeepSeek滿血版支持16/8/4bit全精度推理,實現(xiàn)軟硬一體的訓(xùn)練和推理性能極致加速,實現(xiàn)全棧AI可觀測 搭載模型微調(diào)、數(shù)據(jù)知識處理和智能體RAG搭建的全棧大模型工具鏈,具備高效訓(xùn)推性能,預(yù)制應(yīng)用模板開箱即用 支持高網(wǎng)環(huán)境下多機多卡的高性能PD分離式推理與分布式訓(xùn)練,支持模型蒸餾后訓(xùn)練
可納管異構(gòu)GPU,支持并行化多模態(tài)數(shù)據(jù)預(yù)處理與海量向量RAG檢索
智算 APG 16卡 單臺 APG 16卡 單臺 APG 16卡 2-10臺
通算 - 海光 3臺 海光 3臺+
交換機 - 25GE 200GE/400GE
軟件 預(yù)裝內(nèi)置 容器/存儲/緩存/數(shù)據(jù)庫
訓(xùn)推平臺 訓(xùn)推+智能體平臺 訓(xùn)推+智能體平臺
服務(wù) 軟硬件安裝部署、性能調(diào)優(yōu)測試、行業(yè)模型訓(xùn)練、智能體應(yīng)用搭建

可支持模型列表:
DeepSeek-R1/V3、DeepSeek蒸餾全尺寸、Qwen全尺寸、Qwen-VL全尺寸、全模態(tài)解析模型、向量模型、精排模型

一體機系列

實現(xiàn)DeepSeek R1/V3及其蒸餾模型的極致適配,確保推理性能和效率達到最優(yōu)狀態(tài)

配置信息

  • 單機 海光/lntel雙路多核CPU
  • 單機 16卡
  • 單機熱插拔 15.36TB NVMe 高速存儲
  • 單機顯存容量 1536GB,顯存帶寬 2765GB/S
  • 機內(nèi)卡間互聯(lián)帶寬 700GB/s
  • 機外支持 400G RDMA 網(wǎng)絡(luò)