吞吐
百度旗下昆仑芯支持单机部署DeepSeek满血版大模型
新京报贝壳财经讯 2月20日,据“昆仑芯科技”公号显示,百度旗下的昆仑芯P800在国产AI芯片中首发支持单机部署DeepSeek V3/R1671B满血版大模型,包括8卡和16卡两种配置,总吞吐最高为每秒4825tokens。编辑 段文平
山东的“长期主义”,在坚守什么
大众网记者 魏俊怡近来,许多“长期主义者”被世界“看见”。从《哪吒2》的“五年磨一剑”,到“杭州六小龙”的横空出世;从《黑神话:悟空》的乘风起势,到强者华为的近20年深耕。人们发现,“在任何一个领域里有所成就的人,都是长期主义者,因为他们敢进窄门,愿走远路。”其中,也有一直默默无闻,却“深藏功与名”的坚守者,在耐得住寂寞、守得住朴拙的时光里,如黄河入海般,在静水深流中成就磅礴——比如,咱们的山东。
理论成本利润率545%!DeepSeek 知乎发文引业内震动
3月1日,DeepSeek官方认证账号在知乎发布了《DeepSeek-V3/R1推理系统概览》(下称《概览》)一文,首次公布模型推理系统的核心优化方案,并披露理论成本利润率高达545%,刷新了全球AI大模型领域的盈利高点,引发业内震动。《概览》显示,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。为了实现上述两个目标,DeepSeek使用大规模跨节点专家并行(EP)。首先E