标签:
DeepSeek开源周第二天,开源 EP通信库DeepEP
DeepSeek开源周第二天,介绍 DeepEP — 首个用于 MoE 模型训练和推理的开源通信库。
- 高效优化的全对全通信,支持 NVLink 和 RDMA,适用于节点内和节点间。
- 高吞吐量内核,支持训练和推理预填充。
- 低延迟内核,专为推理解码设计。
- 原生 FP8 调度支持。
- 灵活的 GPU 资源控制,实现计算与通信重叠。
标签: