底层

DeepSeek开源周第四日发布:优化并行策略

新京报贝壳财经讯(记者罗亦丹)北京时间2月27日10点5分,DeepSeek发布了其“开源周”第四日的内容:优化的并行策略,其中包括DualPipe,一种用于V3/R1训练中计算与通信重叠的双向管道并行算法, 以及EPLB,一种针对V3/R1的专家并行负载均衡器。此外,DeepSeek还公开分享了其训练和推理框架的性能分析数据,从而帮助开源社区更好地了解通信与计算重叠策略和底层实现细节。编辑 寇德

DeepSeek指路算力优化路径,国产AI有望实现生态闭环

·DeepSeek同时考虑算法精度和系统效率。除了极致的底层优化,协同优化也可能让大模型在利用国产算力时达到甚至超越英伟达GPU的性能。从最顶层的产品应用到底层的基础设施,大模型的每一个层级都已经形成了非常好的生态,每一个层级上都存在着优化空间。·未来推理算力或将有2-3个数量级的提升。训练算力需求仍会有所增长,总体来看,算力需求会激增,成本会更高,但算力成本还有巨大压缩空间,单位算力成本将下降,

云天励飞:预计2024年净亏损5亿元-5.9亿元

【云天励飞:预计2024年净亏损5亿元-5.9亿元】《科创板日报》17日讯,云天励飞公告,预计公司2024年度营业收入为8.2亿元到9.3亿元,同比增加62.05%至83.79%。预计公司2024年度归属于母公司所有者的净利润为-5亿元到-5.9亿元,同比亏损扩大30.51%至54.00%。主要原因是股权激励费用增加、芯片业务持续投入增加、应收账款增长及预期信用减值损失增加等。同时,公司在高端人才