快速导航
快捷键: ← → 方向键

DeepSeek-V3(性能卓越的混合专家(MoE)语言模型 — 参数规模达到540B,单Token激活量为42B)

大语言模型技术报告 DeepSeek-V3 性能卓越的混合专家MoE语言模型 — 参数规模达到540B,单Token激活量为42B 首次更新: 2023年 开发方: DeepSeek AI 开源协议:...

作者: admin 2025-03-28 03:46 83 次浏览 HTML
打开

预览结果: