Reader

DeepSeek 开源周第 6 天彩蛋 – DeepSeek-V3/R1 推理系统概览

| 宝玉的分享 | Default
通过以下方式优化吞吐量和时延: 基于跨节点 EP 的批量扩展\ 计算与通信重叠\ 负载均衡 DeepSeek 在线服务统计数据:\ 每个 H800 节点每秒输入/输出分别达 73.7k/14.8k token\ 成本利润率 545%